Значение визуализации данных для eBay
Перевод статьи Эндрю Лэмпитта «Big data visualization: A big deal for eBay», опубликованной на сайте www.infoworld.com
Будучи крупнейшим сайтом электронной торговли, eBay анализирует огромные массивы данных, визуализация которых дает понимание ситуации во всех областях деятельности компании.
EBay — компания, число активных пользователей которой составляет 108 миллионов и чьи продажи в прошлом году составили 68 миллионов долларов. Сотрудники компании имеют доступ к 52 петабайтам различной информации– от транзакций онлайн до отгрузок товара, при этом у них также существуют ограничения по доступу, и пользователи могут увидеть лишь ту информацию, которую им разрешено.
Для понимания этих данных компания eBay внедрила программное обеспечение Tableau Online,которое превращает большие и сложные данные в простую для понимания интерактивную картинку. Сотрудники eBay в любое время могут построить визуализацию данных или проанализировать поведение покупателя.
EBay использует три хранилища данных. Два из них – Terradata, с серьезной защитой данных, а третье – Hadoop, которое используется для хранения неструктурированных данных. К данным Hadoop имеют доступ тоже не все сотрудники, частично из-за сложности в осуществлении контроля над доступом.
Хранилище данных (enterprise data warehouse – EDW) eBay, размер которого составляет примерно 10 петабайт, нацелен на хранение структурированных данных о заказах, отгрузках, платежах, ценах и др. Все сотрудники могут подключиться к EDW через SQL, где и находятся бесконечные запросы большинства посетителей.
Второе хранилище данных, которое eBay называет “Singularity”, содержит около 42 петабайт, и используется для более специализированного бизнес-анализа и хранения неструктурированных и частично структурированных данных, в том числе о входе на сайт eBay. Доступ к этому хранилищу имеют около 30% сотрудников, имеющих доступ к первому хранилищу.
Передовые аналитические инструменты зачастую требуют особенных навыков. Однако такие интерактивные инструменты визуализации данных, как Tableau, позволяют практически любому сотруднику стать аналитиком и определять тренды в режиме реального времени. eBay использует Tableau для визуализации информации о релевантности поиска и качестве работы сайта компании, а также для отслеживания поведения потребителей на сайте и их предпочтений. Все это помогло бизнес-аналитике стать важнейшей часть корпоративной культуры компании.
Гари Дуган, ответственный за BI-платформы в eBay, отмечает: «Данные стали представлять ценность для практически всех сотрудников компании именно благодаря Tableau. Мы наблюдаем невероятный рост. Число пользователей Tableau в нашей компании удваивается каждые полгода. Оно позволяет пользователям изучать данные из разных источников и используется все больше и больше для поддержки стратегии компании».
У любого сотрудника компании есть доступ к лицензии Tableau Desktop на Microsoft Windows, чтобы сделать визуализацию какого-либо набора данных. Те же, у кого есть разрешение на публикацию данных, могут опубликовать их на внутреннем портале компании с помощью Tableau Server.
Чтобы сделать big data для анализа больших данных и Tableau еще более доступными, eBay создал веб-портал Joomla, который называется Data Hub и представляет собой защищенный централизированный ресурс для сотрудников, которые могут посмотреть уже существующие отчеты и данные и сделать запрос на создание новых. Такой широкий доступ имеет смысл, учитывая то, что уверенность eBay в пользе визуализации помогла компании оптимизировать свою деятельность.
Оригинал статьи: http://www.infoworld.com/d/big-data/big-data-visualization-big-deal-ebay-208589