АНАЛИТИКА ПЛЮС
Профессиональные услуги в сфере BI

KNIME VS Alteryx

Инструменты ETL позволяют извлекать данные из внешних источников, комбинировать и преобразовывать их в формат, который затем может быть загружен в хранилище данных. Кроме этих базовых функций, многие инструменты ETL содержат большой набор дополнительных функций: от инструментов анализа данных, включая множество функций прогнозного моделирования, до полезных функций вывода данных, включая возможность создания графиков, диаграмм и дашбордов.

В этой статье мы рассмотрим две аналитические платформы: KNIME и Alteryx.

Итак, мы сравним:

— Интерфейс
— Ввод / подготовка данных
— Консолидация данных
— Анализ данных
— Вывод
— Графики / отчеты

Интерфейс

И KNIME, и Alteryx используют одинаковый подход к созданию рабочего пространства.

KNIME

В KNIME есть список нод в репозитории (левый нижний угол приложения). Список нод разделен на сегменты. Из репозитория ноды можно «вытаскивать» на рабочее пространство и соединить с другой нодой при помощи перетаскивания линии — с выхода одной ноды на вход другой ноды. Кликнув на ноду правой кнопкой мыши, можно изменить ее настройки для получения желаемого результата на выходе ноды.

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №1

Alteryx

В Alteryx ноды сгруппированы в понятное меню по категориям с цветовой кодировкой, включая «Ввод / вывод», «Подготовка данных», «Соединение», «Анализ», «Преобразование», «Отчетность» и т. д.

В Alteryx зачастую применение одной ноды дает результат, сопоставимый с применением 2 или 3 нод в KNIME, что сильно сокращает габариты итогового потока работ и упрощает восприятие алгоритма. При выборе любой ноды в левой части экрана отображается панель конфигурации ноды, в отличие от KNIME не приходится постоянно открывать/закрывать окно конфигурации дополнительными кликами, это сильно упрощает интерфейс.

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №2

Ввод / подготовка данных

Первый шаг в решении каждой аналитической задачи — подготовка данных. Так как примерно 80% работы, связанной с анализом данных, обычно тратится на подготовку данных, простота использования и функциональность аналитических платформ

имеют решающее значение. И KNIME, и Alteryx позволяют подключать (извлекать) данные из нескольких источников: начиная с файлов CSV, баз данных или из облака.

KNIME

В KNIME, дважды кликнув на ноду, мы получаем доступ к параметрам конфигурации. Вот программа для чтения файлов, открывающая файл CSV:

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №3

KNIME позволяет выполнять широкий спектр типовых операций подготовки данных: извлечение, фильтрация строк и колонок, переименование, агрегация, транспонирование, pivot и так далее. Для формирования по-настоящему динамических потоков работ, на помощь приходят переменные — с их помощью можно изменять конфигурацию нод на лету. Подробнее об этом можно узнать в нашем практикуме «Аналитика интернет-магазина».

Alteryx

Alteryx открывает несколько окошек, которые позволяют легко перетаскивать и выбирать типы данных при помощи визуального программирования. То есть Alteryx предлагает полный набор возможностей для подготовки данных с помощью манипулирования графическими объектами – без необходимости программирования.

Обработка данных сводится к созданию интуитивных рабочих потоков.

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №4

Инструмент очистки данных Alteryx достаточно простой и понятный инструмент. Изменить типы данных легко, так как для выбора типа данных можно использовать раскрывающийся список.

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №5

Несмотря на то, что оба инструмента одинаково хорошо справляются с подготовкой и очисткой данных, интерфейс KNIME оказывается более запутанным — преобразование полей типов данных занимает много времени.

Подготовка данных для анализа — трудоемкий процесс Время, затрачиваемое на преобразование типов данных в правильный формат, может увеличить объем рабочей нагрузки и, как следствие, увеличить время, необходимое для начала фактического анализа. Именно по этой причине инструменты подготовки данных Alteryx кажутся немного лучше, чем KNIME. Однако Alteryx не хватает некоторых функций, которые есть в KNIME, например, повсеместной возможности конфигурировать ноды при помощи переменных.

Data Blending (смешивание данных)

И KNIME, и Alteryx предоставляют надежные инструменты для смешивания данных, однако функциональность и простота использования у них различаются.

KNIME

Инструмент соединения KNIME — простой в использовании инструмент для соединения нескольких наборов данных. Например, как показано ниже, есть два файла, которые содержат код города и номер телефона, исходя из предположения, что номер телефона является уникальным идентификатором, можно использовать их для соединения двух разных наборов данных.

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №6

Также существует возможность легко фильтровать данные из каждого набора данных и решать, включить или исключить эти данные в конечную базу данных.

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №7

Alteryx

Инструмент соединения Alteryx ведет себя аналогичным образом. Можно выбрать простой идентификатор (например, UserID, показанный ниже) и использовать его для соединения нескольких наборов данных.

Alteryx, как и KNIME, позволяет создавать запросы SQL без написания кода. Одним из преимуществ является то, что сами данные не нужно полностью преобразовывать в новый файл перед настройкой соединений между наборами данных — вся работа может выполняться с существующими данными.

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №8

KNIME рассматривает каждое действие, как отдельное действие в отдельной ноде. Сначала это кажется запутанным (особенно для тех, кто привык работать в SQL), но в результате производительность становится выше.

Таким образом, и KNIME, и Alteryx имеют надежные и простые в использовании возможности манипулирования данными и их соединения. Хотя интерфейсы инструментов немного отличаются, использовать любой из них достаточно просто и оба инструмента позволяют быстро объединять несколько наборов данных, однако при работе с наборами данных большего размера KNIME оказался сильнее.

Анализ данных

Python является мощным инструментом для программирования собственных модулей. Часто, писать собственные программы для определения поведения модели считается не слишком сложным процессом, но на самом деле сложность сильно варьируется в зависимости от пользователя.

KNIME

KNIME имеет множество разных инструментов прогнозного анализа. Исходный код открыт, сотни разработчиков работали над созданием широкого спектра плагинов и адаптеров, чтобы была возможность использовать многие уже существующие функции, которые будут делать почти всю работу за специалиста.

KNIME включает ряд инструментов в стиле машинного обучения, позволяющих учиться на существующих моделях и создавать новые прогнозные модели. KNIME обрабатывает различные регрессии, помогает в построении деревьев решений и участвует в оценке некоторых моделей.

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №9

KNIME включает в себя исключительно широкий набор инструментов. Ниже приведен общий список различных модулей интеллектуального анализа данных KNIME :

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №10

Они также включают в себя большой набор статистических инструментов:

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №11

Вот демонстрация модели логистической регрессии для решения задачи классификации:

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №12

Alteryx

Alteryx включает в себя несколько полезных инструментов исследования данных, в том числе корреляции Пирсона и Спирмена.

Alteryx позволяет загружать различные аналитические модели, а также имеет встроенную модель оценки для прогнозирования значений или классов наборов данных, ее также можно использовать для оценки новых моделей. Кроме этого Alteryx включает в себя выборку для моделирования.

В отличие от KNIME, Alteryx не предлагает такого же набора аналитических инструментов. При проведении моделирования и тестирования, рекомендуется использовать внешние инструменты. Однако Alteryx позволяет легко экспортировать данные для таких инструментов.

Выход

После ввода и преобразования данных третий сегмент процесса ETL включает «экспорт» или вывод данных. И Alteryx, и KNIME предоставляют эту функцию.

KNIME

В KNIME можно экспортировать свои данные в стандартный файл csv, в отчет BIRT (Business Intelligence Reporting Tool) , а также загрузить получившиеся таблицы в базы данных (как в типовые БД с имеющимися коннекторами в KNIME, например MS SQL, Postgres, Vertica, так и в любые другие БД при помощи JDBC драйвера).

Очевидно, что Tableau гораздо более эффективно справляется с решением задачи визуализации данных, ожидать от KNIME удобных, красивых и интерактивных отчетов не стоит.

Ниже приведен очень простой поток работ KNIME, который берет данные из базы данных SQLite, перегруппировывает их и записывает данные обратно в SQLite.

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №13

Alteryx

Для вывода данных Alteryx предоставляет простой в использовании «Инструмент вывода данных», который подключается к огромному количеству различных источников данных и форматов файлов. К ним относятся стандартные варианты файлов CSV для SQL и нереляционных баз данных, а также ряд облачных форматов больших данных от Google, Amazon и Microsoft.

Вот некоторые выходные форматы, которые можно использовать в Alteryx при выводе данных.

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №14

Графики / отчеты

Визуализация — важная часть любого анализа данных. Хотя это не является основной целью инструментов ETL, таких как KNIME или Alteryx, существует возможность создавать несколько быстрых графиков или визуализаций.

KNIME

KNIME, будучи гомункулом с открытым исходным кодом, может похвастаться широким спектром диаграмм и графиков, которые можно сгенерировать, при этом сгенерировать их достаточно просто. Например, вот простая гистограмма:

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №15

Объединение их в дашборд — гораздо более сложный процесс. Можно использовать внешнее программное обеспечение, которое предназначено для создания визуализаций и дашбордов удобных для бизнеса. KNIME обеспечивает простое подключение к BIRT и Tableau.

Alteryx

Alteryx также включает в себя ряд графических элементов, но он также не предназначен для этой цели. Тем не менее, Alteryx имеет много полезных функций . Например, вот карта торговой зоны вокруг магазина:

Сравнение аналитических платформ: KNIME VS Alteryx, изображение №16

Резюме / Заключение

И KNIME, и Alteryx являются мощными аналитическими платформами, которые могут взять на себя задачи по части ETL. Что касается их противостояния, выбор инструмента во многом зависит от того, кто и как их используют/собираются использовать.

KNIME полностью модульный — каждое действие зачастую является низкоуровневым (например создание одного строкового поля в ноде String Manipulation вместо создания множества полей различных типов в одной ноде Formula в Alteryx), Alteryx включил некоторые функциональные возможности более высокого уровня, объединив инструменты, которые используются вместе.

Если кто-то ищет инструмент, который очень удобен для пользователя и решает большинство задач подготовки данных, Alteryx выделяется как гораздо более доступный вариант. Тем не менее, KNIME применим для многих организаций. Однако этот инструмент нельзя рекомендовать новичкам или людям с ограниченными техническими навыками, KNIME требует твердого понимания науки о данных.

Если кто-то ищет инструмент, который может обрабатывать все функции ETL, и хотел бы иметь некоторые аналитические возможности, KNIME намного сильнее с точки зрения его возможностей, однако если основной целью является извлечение, подготовка, преобразование и загрузка данных, рекомендуется использовать Alteryx, который помогает пользователям быстро и без проблем выполнять эти функции (извлечение, подготовка, преобразование и загрузка данных), сокращая объем работы на каждом этапе.

Стоимость: Стоимость Alteryx начинается от 5000 евро в год за 1 ПК, KNIME Analytics Platform — бесплатно. KNIME может выполнять любые функции, которые выполнят Alteryx, поэтому, если организация готова потратить время на то, чтобы привыкнуть к его использованию (и справиться с головной болью при подготовке данных), KNIME полностью работоспособный инструмент.

Поддержка: KNIME имеет открытый исходный код и сообщество среднего размера, Alteryx имеет более адаптивную и удобную для пользователей среду поддержки.

Источник: https://xperra.com/blog/alteryx-vs-knime.html

x

Этот сайт использует файлы cookies, чтобы облегчить вам пользование нашим веб-сайтом.

Продолжая использовать этот веб-сайт, вы даете согласие на использование файлов cookies.