АНАЛИТИКА ПЛЮС
Профессиональные услуги в сфере BI

TabPy 1.0 сближает. Как подружить Python и Tableau

Миссия Tableau — помогать людям принимать правильные решения, позволять им не только видеть, но и понимать свои данные. Основная цель data science — передавать аналитические знания тем, кто принимает бизнес-решения. Но есть проблема — работа специалистов по data science часто не приносят отдачи от инвестиций. И основная причина — коммуникационный разрыв между командой data science и лицами, принимающими бизнес-решения.

Как раз на этом этапе на помощь приходит Tableau. Платформа сокращает разрыв с помощью интерактивности и доступности данных. В этом посте поделимся возможностями интеграции Python и Tableau.

TabPy 1.0

Python — это инструмент для аналитиков и специалистов data science, используется с разными целями — от очистки и формирования данных до внедрения передовых алгоритмов машинного обучения. Чтобы поддержать интеграцию data science в Tableau, команда Tableau работает над расширением возможностей и повышением безопасности сервера Python — TabPy. Tableau поддерживает динамическую интеграцию с Python через TabPy в Desktop и Server начиная с версии 10.3 и в Prep — начиная с версии 2019.3.

Подробнее почитать (на англ.) об интеграции Python и Tableau можно здесь:

  • Статья в блоге о скриптах в Tableau Prep
  • How-to guide — руководство для тех, кто хочет понять и использовать табличные вычисления.

Сегодня TabPy (релиз 1.0, Tableau 2020.1) — это официально поддерживаемый продукт Tableau и готов к использованию. Какие функции доступны в TabPy 1.0?

Простая установка

В своей первоначальной итерации TabPy был установлен как пакет Python pip под названием tabpy-server и по умолчанию требовал установки фреймворка Anaconda data science. TabPy также требовался второй пакет для развертывания функций — tabpy-client. Чтобы упростить этот процесс для пользователей, функциональность обоих пакетов была объединена в один пакет под названием tabpy. А также исчезла зависимость от Anaconda. TabPy сегодня может работать в виртуальной среде Anaconda. Чтобы установить TabPy на любую другую машину со средой Python 3.6+, запустите:

pip install tabpy
Для запуска сервера TabPy в командной строке напишите :

tabpy
Как только TabPy запущен, можно соединиться с Tableau Desktop в навигационном меню: Help->Settings and Performance->Manage External Service Connections и далее введите информацию о своем соединении:

На Tableau Server соединение можно сконфигурировать с помощью запуска команд TSM security.

Встроенные статистические функции

После установки TabPy и запуска сервера вы можете установить библиотеку готовых статистических функций (library of pre-built statistical) с той же машины, используя простую команду командной строки:

tabpy-deploy-models
Эти функции включают в себя функции анализа, такие как:  анализ главных компонентов (Principal Component Analysis, PCA), Sentiment Analysis, a t-test и ANOVA. После установки любая из этих функций может быть вызвана по имени в любом Tableau Desktop или Server, подключенными к TabPy. В следующем примере функция t-test используется для веб-тестирования A/B:

Библиотека tabpy_tools, поставляемая вместе с TabPy, позволяет определять и развертывать собственные функции Python, включая оценку с помощью моделей машинного обучения. Чтобы попробовать это самостоятельно, просто используйте эти инструкции — instructions.

Защищенные соединения и аутентификация

TabPy поддерживает безопасные соединения по протоколу HTTPS (с использованием SSL) и аутентификации по имени пользователя и паролю (с использованием стандартной аутентификации). Защищенные соединения можно настроить в файле конфигурации TabPy, как показано здесь. Начиная с Tableau 2020.1 Tableau Desktop и Server будут считывать SSL-сертификаты из хранилища ключей ОС и не требовать указания сертификата в Tableau. Аутентификация настраивается с помощью утилиты, входящей в пакет tabpy — посмотреть документацию здесь.

Быстрая настройка

TabPy можно запустить с помощью пользовательских параметров конфигурации, которые определены в файле конфигурации, указанном при запуске сервера. Посмотреть спецификации для файла конфигурации и образец — можно здесь. Настраиваемые функции включают SSL, аутентификацию, ведение журнала, максимальный размер данных и тайм-аут. Чтобы запустить TabPy с помощью пользовательской конфигурации, добавьте параметр запуска config, как в этом примере:

tabpy —config=path/to/my/config/file.conf

Улучшенный журнал логов

Возможности журнала логов расширены — теперь есть аудит кода Python, выполняемого на сервере, а также отслеживание, какой какие пользователи выполняли тот или иной код. При подключении к Tableau Server можно настроить запись имени пользователя Tableau Server. Инструкции по настройке можно найти здесь.

Источник: www.tableau.com

ЦИФРЫ О НАС

Мы, компания АНАЛИТИКА ПЛЮС, с 2012 года помогаем нашим клиентам работать с данными — находить полезные инсайты и использовать эту информацию для увеличения прибыли компании.

За это время мы разработали и внедрили решения для компаний из разных сфер бизнеса: ритейл, дистрибуция, логистика, e-commerce, банки и финансы, маркетинг, телеком, производство, логистика, транспорт.

Мы помогаем начать работу с инструментами BI, предоставляем услуги «под ключ» — от сбора данных до установки ПО и предоставления финального интерактивного отчета. И конечно — проводим обучение: наши клиенты ни от кого не зависят и умеют работать со своими данными самостоятельно!

Как мы помогаем в работе с данными? >>

x

Этот сайт использует файлы cookies, чтобы облегчить вам пользование нашим веб-сайтом.

Продолжая использовать этот веб-сайт, вы даете согласие на использование файлов cookies.