Практикум «Data Mining. Tableau + R, Vertica + R»

покупки 2 покупки 1 сувениры

BIG DATA… Как выжать деньги из Ваших данных?

– Реальные кейсы для решения самых важных бизнес-задач, пошаговые инструкции
– BIG DATA аналитика, обучение новым технологиям анализа
– Программа адаптирована для быстрого погружения в анализ данных и статистику
– Минимум теории, адаптированной для непрофессионалов в области статистики

Хотите научиться? Нет ничего проще, ведь Вы:
– Даже не будучи Эйнштейном, убедитесь на собственном опыте, что анализ данных и BIG DATA аналитика – это реальные и понятные действия.
– Узнаете, как работают настоящие профессионалы.
– Эти монстры, Data Scientists, сами расскажут и покажут вам, КАК они это делают.
– Более того, ВЫ сами ЭТО сделаете.
– Принцип Парето: даже краткий, но практический семинар даст Вам 80% quick wins!

 

Аудитория

Практикум предназначен для специалистов в области машинного обучения, Data Scientist. Семинар также будет полезен аналитикам, которые хотя подробнее изучить возможности статистического языка R в связке с новыми технологиями Tableau и HP Vertica.

Уровень: Продвинутый.

Дополнительные требования: Желательно знание основ машинного обучения и анализа данных или математическое образование. Возьмите с собой ноутбук, чтобы сразу тренироваться и получать необходимые навыки.

 

Вы получите

Вы ознакомитесь с базовыми возможностями и областями применения языка R для анализа данных. Научитесь работать с данными и использовать простые математические методы, а также интегрировать полученные модели в программное решение Tableau для расширения базовых возможностей анализа данных. В рамках практикума мы вместе разберем практические кейсы для решения статистических задач с применением библиотек языка R: сегментация клиентской базы, прогноз продаж, поиск аномалий в данных, прогноз прихода покупателя и размера чека. Вы также сможете закрепить полученные знания на полуторачасовом Мастер-классе.

Вторая часть практикума будет посвящена разбору реальных бизнес-задач по анализу Больших данных на основе конкурсов, проводимых самой популярной в мире площадкой по соревновательному анализу данных Kaggle с помощью R и HP Vertica. Научившись использовать язык R в интеграции с HP Vertica, Вы сможете прозрачно получать дополнительные данные к имеющимся на основе статистического анализа с помощью обычных SELECT-запросов, как если бы данные уже были в таблице.

Для самостоятельной практической работы будут предоставлены образы виртуальных машин с ОС Debian 7, готовой к работе с Vertica и R. При желании все действия, описываемые в рамках семинара, можно будет дублировать в онлайн машины на ваших ноутбуках.

 

Формат обучения

Формат Offline – очное, г. Москва. Для тех, кто хочет получить знания и практические навыки, поработав с преподавателем очно.

Формат Online – видео-онлайн трансляция. Для тех, кому необходимо принять дистанционное участие в мероприятии. Трансляция мероприятия идет в режиме реального времени. Профессиональная съемка мероприятия, просмотр доступен на персональных компьютерах и мобильных устройствах. Вы сможете видеть и слышать преподавателя, аудиторию. Вы также будете видеть слайды, демонстрируемые преподавателем на проекторе, в высоком качестве. Вы сможете задавать вопросы и получить ответы от преподавателя через ЧАТ. Вы будете удаленно решать практические задания на своем компьютере вместе с участниками мероприятия. В случае возникновения сложностей, у вас будет возможность получить помощь преподавателя (путем предоставления доступа к экрану своего компьютера с помощью программы TeamViewer‎).

Внимание! Количество мест ограничено. Гарантией вашего участия в мероприятии является своевременная оплата.

  • Формат Offline – не более 12 мест
  • Формат Online – не более 24 мест

Дата

25 сентября 2015 г.

Время

09:30 – 17:00, 3 перерыва – 20 мин., 50 мин., 20 мин.

Место

Хорошая еда и приятная атмосфера – это важно! Поэтому мы проводим наши практикумы в уютном зале Гастрономического Кафе «Перец&Мята».
Адрес: м.Новые Черемушки, ул. Академика Пилюгина, д.4

скачанные файлы

 

Сколько это стоит?

Форма оплаты:
– Для физических лиц – наличная оплата (PayPal, Visa, MasterCard, Банковский перевод)
– Для юридических лиц – безналичная оплата. Вы также можете заказать проведение этого семинара в рамках корпоративного обучения.
Оформить заявку

Дополнительные бонусы

Все участники мероприятия получат:

  • Раздаточные материалы
  • Бесплатные консультации у преподавателя в течение 2-х недель после мероприятия

Дополнительные бонусы для участников формата Offline:

  • Новые бизнес-контакты, опыт коллег из мировых лидирующих компаний
  • Ресторанное питание и приятная атмосфера
  • Сертификат в печатном формате

Дополнительные бонусы для участников формата Online:

  • Качественное видео, показ материалов спикера, обратная связь – ЧАТ
  • Возможность принять участие не выходя из дома/офиса. Доступ с любого мобильного устройства
  • Сертификат в электронном формате

Корпоративное обучение

Вы также можете заказать наши практикумы в формате корпоративного обучения. Получить более подробную информацию можно по телефонам +7 499 391-29-84, +7 926 111-25-80.

Программа практикума

Вы ознакомитесь с базовыми возможностями и областями применения языка R для анализа данных. Научитесь работать с данными и использовать простые математические методы, а также интегрировать полученные модели в программное решение Tableau для расширения базовых возможностей анализа данных. В рамках практикума мы вместе разберем практические кейсы для решения статистических задач с применением библиотек языка R: сегментация клиентской базы, прогноз продаж, поиск аномалий в данных, прогноз прихода покупателя и размера чека. Вы также сможете закрепить полученные знания, решая практические задачи с использованием технологий R и Tableau.

Мы также разберем реальные бизнес-задачи по анализу Больших данных на основе конкурсов, проводимых самой популярной в мире площадкой по соревновательному анализу данных Kaggle с помощью R и HP Vertica. Научившись использовать язык R в интеграции с HP Vertica, Вы сможете прозрачно получать дополнительные данные к имеющимся на основе статистического анализа с помощью обычных SELECT-запросов, как если бы данные уже были в таблице. Для самостоятельной практической работы будут предоставлен образ виртуальной машины, готовой к работе с Vertica и R. При желании все действия, описываемые в рамках практикума, можно будет дублировать на ваших ноутбуках.

В рамках первой половины практикума будет представлено краткое введение в статистический пакет R, закрепленное разбором простых примеров и задач из области анализа данных, будут рассмотрены доступные уже сейчас возможности интеграции R и программного решения Tableau. Мы расскажем об основных задачах анализа данных: классификации, кластеризации, регрессии, прогнозирования.

Затем мы сконцентрируемся на рассмотрении реальных бизнес-кейсов: определение аномалий в данных, сегментация клиентской базы, прогнозирование ежемесячных продаж. В каждом случае будет продемонстрировано применение возможностей языка R, интеграция с Tableau и визуализация результатов.

Вы также сможете закрепить полученные знания на практике. Мы вместе решим задачу построения прогноза ежедневного суммарного дохода супермаркета на месяц вперед на основе исторических данных. А также рассмотрим вопрос более подробного прогноза – для каждого покупателя в отдельности оценим наиболее вероятный день следующего посещения и размер чека.

Вторая часть практикума будет посвящена вопросам интеграции Vertica с R. Мы создадим тестовую среду — настройка VM, ОС для работы с Vertica. Научим простейшим взаимодействиям с данными в Vertica. Рассмотрим скалярные и преобразующие функции. Затем мы решим две задачи, чтобы на практике разобраться в вопросах интеграции Vertica + R и научиться применять новые технологии для BIG DATA аналитики.

1-ая задача: Задача фильтрации объявлений из конкурса Kaggle: https://www.kaggle.com/c/avito-prohibited-content. Вы узнаете, как работать с текстами в R. Мы вместе построим офлайн модель в R и сделаем онлайн-предсказание с предобученной моделью.

2-я задача: Задача предсказания финансовой несостоятельности заемщика из конкурса Kaggle: https://www.kaggle.com/c/GiveMeSomeCredit. Ансамбли алгоритмов, решающие деревья, случайный лес.

На практикуме вам понадобится ноутбук для выполнения практических заданий. В начале практикума мы выдадим вам флэшки со всей необходимой информацией для установки и работы с Tableau Desktop Professional, HP Vertica. Мы также выдадим вам ключ для полнофункциональной работы Tableau сроком на 2 недели.

Системные требования:

Windows: Microsoft Windows 7 SP1 и выше (32-bit/64-bit), Microsoft Server 2008 R2 и выше (32-bit/ 64-bit), процессор Intel Pentium 4 или AMD Opteron и выше (должен поддерживать инструкции SSE2 и выше), желательно от 8 GB оперативной памяти, диск от 100 GB, Internet Explorer 8 и выше.

Mac: iMac/MacBook выпуска 2009 года и выше, OS X 10.9 и выше, желательно от 8 GB оперативной памяти, диск от 100 GB.

Дополнительные требования для участников формата Online:

Для просмотра видео в высоком качестве пропускная способность канала должна быть не менее 4 Мбит/сек. Если пропускная скорость соединения меньше вышеуказанной, то возможно потребуется переключить встроенный плеер в режим вещания с более низким качеством (SQ,LQ), вследствие чего будет присутствовать размытость изображения. Звук в любом режиме будет качественным. Поддерживается вещание на мобильные устройства (телефоны и планшеты iPhone, iPad, Android от версии 4.1 и выше), для комфортного просмотра настоятельно рекомендуем пользоваться ноутбуками либо стационарными компьютерами
Оформить заявку

 

Отзывы участников семинара

Александр Мельничков
“Получил много полезной информации о Tableau, языке R, работе с Tableau. Буду осваивать дальше, применять в работе. Спасибо!!!”
P1060635

Галина Федорова, ЛЕТО БАНК
“Прекрасно организован.Очень полезен для практической работы.”
P1060608

Алим Губжоков, Управление делами Главы и Правительства Кабардино-Балкарской Республики
“Семинар прошел на высоком профессиональном уровне.”
P1060593

Татьяна Бородина, Пилотаж
“Большое спасибо за насыщенную программу, возможность попробовать предложенные модели на практике.”
P1060624

 

Фото

P1060621 P1060615 P1060610

 

Преподаватели

Евгений Нижибицкий
ЕвгенийН_sm
Евгений – аналитик компании АНАЛИТИКА ПЛЮС, cтудент последнего курса кафедры математических методов прогнозирования факультета ВМК МГУ имени М.В. Ломоносова. Области интересов – BIG DATA анализ, прогнозирование, обработка текстов, компьютерное зрение, байесовские методы. Уже будучи студентом третьего курса, Евгений достиг первых высоких результатов в области соревновательного анализа данных. Одним из последних достижений являются новые результаты в области тематического моделирования, которые будут представлены на конференции Ломоносов-2014. В прошлом трижды становился призером на финале Всероссийской олимпиады по математике (серебряные медали в 2007, 2008 и 2009 гг.).

Проекты:
Прогнозирование продаж в конкурсе “Product Launch Challenge” (http://analytikaplus.ru/?page_id=786)

Несмотря на то, что серьезная научная и профессиональная деятельность требуют полного погружения, Евгений успевает находить время для увлечений музыкой и игрой на фортепиано.

Оформить заявку

Все вопросы по курсу обучения можно задать по телефонам: +7 499 391 2984
Вы также можете заказать проведение этих практикумов в рамках корпоративного обучения.


НАМ ДОВЕРЯЮТ:
AnalytikaPlus_Clients_v2
НАШИ ПЛЮСЫ: ПРОСТЫЕ решения. Высокая СКОРОСТЬ. Значимый РЕЗУЛЬТАТ.

Все Новости на Facebook