BIG DATA… Как выжать деньги из Ваших данных?

Важно: Запись на данный практикум не проводится. Другие наши практикумы можно посмотреть в разделе События.
– Реальные кейсы для решения самых важных бизнес-задач, пошаговые инструкции
– BIG DATA аналитика, обучение новым технологиям анализа
– Программа адаптирована для быстрого погружения в анализ данных и статистику
– Минимум теории, адаптированной для непрофессионалов в области статистики
Хотите научиться? Нет ничего проще, ведь Вы:
- Даже не будучи Эйнштейном, убедитесь на собственном опыте, что анализ данных и BIG DATA аналитика – это реальные и понятные действия.
- Узнаете, как работают настоящие профессионалы.
- Эти монстры, Data Scientists, сами расскажут и покажут вам, КАК они это делают.
- Более того, ВЫ сами ЭТО сделаете.
- Принцип Парето: даже краткий, но практический семинар даст Вам 80% quick wins!
Аудитория
Практикум предназначен для специалистов в области машинного обучения, Data Scientist. Семинар также будет полезен аналитикам, которые хотя подробнее изучить возможности статистического языка R в связке с новыми технологиями Tableau и HP Vertica.
Уровень: Продвинутый
Дополнительные требования: Желательно знание основ машинного обучения и анализа данных или математическое образование. Возьмите с собой ноутбук, чтобы сразу тренироваться и получать необходимые навыки.
Вы получите
Вы ознакомитесь с базовыми возможностями и областями применения языка R для бизнес-анализа данных. Научитесь работать с данными и использовать простые математические методы, а также интегрировать полученные модели в программное решение Tableau для расширения базовых возможностей анализа данных. В рамках практикума мы вместе разберем практические кейсы для решения статистических задач с применением библиотек языка R: сегментация клиентской базы, прогноз продаж, поиск аномалий в данных, прогноз прихода покупателя и размера чека. Вы также сможете закрепить полученные знания на полуторачасовом Мастер-классе.
Вторая часть практикума будет посвящена разбору реальных бизнес-задач по анализу Больших данных на основе конкурсов, проводимых самой популярной в мире площадкой по соревновательному анализу данных Kaggle с помощью R и HP Vertica. Научившись использовать язык R в интеграции с HP Vertica, Вы сможете прозрачно получать дополнительные данные к имеющимся на основе статистического анализа с помощью обычных SELECT-запросов, как если бы данные уже были в таблице.
Для самостоятельной практической работы будут предоставлены образы виртуальных машин с ОС Debian 7, готовой к работе с Vertica и R. При желании все действия, описываемые в рамках семинара, можно будет дублировать в онлайн машины на ваших ноутбуках.
Формат обучения
Формат Offline – очное, г. Москва. Для тех, кто хочет получить знания и практические навыки, поработав с преподавателем очно.
Формат Online – видео-онлайн трансляция. Для тех, кому необходимо принять дистанционное участие в мероприятии. Трансляция мероприятия идет в режиме реального времени. Профессиональная съемка мероприятия, просмотр доступен на персональных компьютерах и мобильных устройствах. Вы сможете видеть и слышать преподавателя, аудиторию. Вы также будете видеть слайды, демонстрируемые преподавателем на проекторе, в высоком качестве. Вы сможете задавать вопросы и получить ответы от преподавателя через ЧАТ. Вы будете удаленно решать практические задания на своем компьютере вместе с участниками мероприятия. В случае возникновения сложностей, у вас будет возможность получить помощь преподавателя (путем предоставления доступа к экрану своего компьютера с помощью программы TeamViewer).
Внимание! Количество мест ограничено. Гарантией вашего участия в мероприятии является своевременная оплата.
Формат Offline – не более 12 мест
Формат Online – не более 24 мест
Дата
25 сентября 2015 г.
Время
09:30 – 17:00, 3 перерыва – 20 мин., 50 мин., 20 мин.
Место
Хорошая еда и приятная атмосфера – это важно! Поэтому мы проводим наши практикумы в уютном зале Гастрономического Кафе «Перец&Мята».
Адрес: м.Новые Черемушки, ул. Академика Пилюгина, д.4
Сколько это стоит?
Форма оплаты:
– Для физических лиц – наличная оплата (PayPal, Visa, MasterCard, Банковский перевод)
– Для юридических лиц – безналичная оплата. Вы также можете заказать проведение этого семинара в рамках корпоративного обучения.
Дополнительные бонусы
Все участники мероприятия получат:
Раздаточные материалы
Бесплатные консультации у преподавателя в течение 2-х недель после мероприятия
Дополнительные бонусы для участников формата Offline:
Новые бизнес-контакты, опыт коллег из мировых лидирующих компаний
Ресторанное питание и приятная атмосфера
Сертификат в печатном формате
Дополнительные бонусы для участников формата Online:
Качественное видео, показ материалов спикера, обратная связь – ЧАТ
Возможность принять участие не выходя из дома/офиса. Доступ с любого мобильного устройства
Сертификат в электронном формате
Корпоративное обучение
Вы также можете заказать наши практикумы в формате корпоративного обучения. Получить более подробную информацию можно по телефонам +7 499 391-29-84, +7 926 111-25-80.
Программа практикума
Вы ознакомитесь с базовыми возможностями и областями применения языка R для бизнес-анализа данных. Научитесь работать с данными и использовать простые математические методы, а также интегрировать полученные модели в программное решение Tableau для расширения базовых возможностей анализа данных. В рамках практикума мы вместе разберем практические кейсы для решения статистических задач с применением библиотек языка R: сегментация клиентской базы, прогноз продаж, поиск аномалий в данных, прогноз прихода покупателя и размера чека. Вы также сможете закрепить полученные знания, решая практические задачи с использованием технологий R и Tableau.
Мы также разберем реальные бизнес-задачи по анализу Больших данных на основе конкурсов, проводимых самой популярной в мире площадкой по соревновательному анализу данных Kaggle с помощью R и HP Vertica. Научившись использовать язык R в интеграции с HP Vertica, Вы сможете прозрачно получать дополнительные данные к имеющимся на основе статистического анализа с помощью обычных SELECT-запросов, как если бы данные уже были в таблице. Для самостоятельной практической работы будут предоставлен образ виртуальной машины, готовой к работе с Vertica и R. При желании все действия, описываемые в рамках практикума, можно будет дублировать на ваших ноутбуках.
В рамках первой половины практикума будет представлено краткое введение в статистический пакет R, закрепленное разбором простых примеров и задач из области big data для анализа больших данных, будут рассмотрены доступные уже сейчас возможности интеграции R и программного решения Tableau. Мы расскажем об основных задачах анализа данных: классификации, кластеризации, регрессии, прогнозирования.
Затем мы сконцентрируемся на рассмотрении реальных бизнес-кейсов: определение аномалий в данных, сегментация клиентской базы, прогнозирование ежемесячных продаж. В каждом случае будет продемонстрировано применение возможностей языка R, интеграция с Tableau и визуализация результатов.
Вы также сможете закрепить полученные знания на практике. Мы вместе решим задачу построения прогноза ежедневного суммарного дохода супермаркета на месяц вперед на основе исторических данных. А также рассмотрим вопрос более подробного прогноза – для каждого покупателя в отдельности оценим наиболее вероятный день следующего посещения и размер чека.
Вторая часть практикума будет посвящена вопросам интеграции Vertica с R. Мы создадим тестовую среду — настройка VM, ОС для работы с Vertica. Научим простейшим взаимодействиям с данными в Vertica. Рассмотрим скалярные и преобразующие функции. Затем мы решим две задачи, чтобы на практике разобраться в вопросах интеграции Vertica + R и научиться применять новые технологии для BIG DATA аналитики.
1-ая задача: Задача фильтрации объявлений из конкурса Kaggle: https://www.kaggle.com/c/avito-prohibited-content. Вы узнаете, как работать с текстами в R. Мы вместе построим офлайн модель в R и сделаем онлайн-предсказание с предобученной моделью.
2-я задача: Задача предсказания финансовой несостоятельности заемщика из конкурса Kaggle: https://www.kaggle.com/c/GiveMeSomeCredit. Ансамбли алгоритмов, решающие деревья, случайный лес.
На практикуме вам понадобится ноутбук для выполнения практических заданий. В начале практикума мы выдадим вам флэшки со всей необходимой информацией для установки и работы с Tableau Desktop Professional, HP Vertica. Мы также выдадим вам ключ для полнофункциональной работы Tableau сроком на 2 недели.
Системные требования:
Windows: Microsoft Windows 7 SP1 и выше (32-bit/64-bit), Microsoft Server 2008 R2 и выше (32-bit/ 64-bit), процессор Intel Pentium 4 или AMD Opteron и выше (должен поддерживать инструкции SSE2 и выше), желательно от 8 GB оперативной памяти, диск от 100 GB, Internet Explorer 8 и выше.
Mac: iMac/MacBook выпуска 2009 года и выше, OS X 10.9 и выше, желательно от 8 GB оперативной памяти, диск от 100 GB.
Дополнительные требования для участников формата Online:
Для просмотра видео в высоком качестве пропускная способность канала должна быть не менее 4 Мбит/сек. Если пропускная скорость соединения меньше вышеуказанной, то возможно потребуется переключить встроенный плеер в режим вещания с более низким качеством (SQ,LQ), вследствие чего будет присутствовать размытость изображения. Звук в любом режиме будет качественным. Поддерживается вещание на мобильные устройства (телефоны и планшеты iPhone, iPad, Android от версии 4.1 и выше), для комфортного просмотра настоятельно рекомендуем пользоваться ноутбуками либо стационарными компьютерами
Отзывы участников семинара
Александр Мельничков
“Получил много полезной информации о Tableau, языке R, работе с Tableau. Буду осваивать дальше, применять в работе. Спасибо!!!”
Галина Федорова, ЛЕТО БАНК
“Прекрасно организован.Очень полезен для практической работы.”
Алим Губжоков, Управление делами Главы и Правительства Кабардино-Балкарской Республики
“Семинар прошел на высоком профессиональном уровне.”
Татьяна Бородина, Пилотаж
“Большое спасибо за насыщенную программу, возможность попробовать предложенные модели на практике.”
Преподаватели
Евгений Нижибицкий
Евгений – аналитик компании АНАЛИТИКА ПЛЮС, cтудент последнего курса кафедры математических методов прогнозирования факультета ВМК МГУ имени М.В. Ломоносова. Области интересов – big data для анализа больших данных, прогнозирование, обработка текстов, компьютерное зрение, байесовские методы. Уже будучи студентом третьего курса, Евгений достиг первых высоких результатов в области соревновательного анализа данных. Одним из последних достижений являются новые результаты в области тематического моделирования, которые будут представлены на конференции Ломоносов-2014. В прошлом трижды становился призером на финале Всероссийской олимпиады по математике (серебряные медали в 2007, 2008 и 2009 гг.).
Проекты:
Прогнозирование продаж в конкурсе “Product Launch Challenge” (http://analit.iguminov.ru/?page_id=786)
Несмотря на то, что серьезная научная и профессиональная деятельность требуют полного погружения, Евгений успевает находить время для увлечений музыкой и игрой на фортепиано.
Все вопросы по big data курсу обучения можно задать по телефонам: +7 499 391 2984
Вы также можете заказать проведение этих практикумов в рамках корпоративного обучения.