Рутограмма в Tableau — за 10 минут

Как построить Рутограмму — «висящую» гистограмму на нормальной кривой распределения? Разбираемся, как сделать это за 10 минут..
Данные
Сначала загружаем данные из источника Sample Superstore в Tableau.
Источник доступен по ссылке — Orders
Важно: Если у вас есть доступ к Tableau Desktop и источнику Sample Superstore, можете использовать их.
Вычисляемые поля
С помощью загруженного источника данных создаем вычисляемые поля:
Customer Count (Номер клиента)
COUNTD([Customer ID])
Sales by Customer (Продажи по клиентам)
{ FIXED [Customer Name]: SUM([Sales]) }
Мы используем выражение LOD для получения общей суммы продаж по клиентам (Sales by Customer).
Среднее значение
{ AVG([Sales by Customer]) }
У нас нет измерения (дименшена), так как нам нужно, чтобы среднее значение вычислялось по всему набору данных.
Стандартное отклонение
{ STDEV([Sales by Customer]) }
Параметр Size of Sales (bin)
К сожалению, Tableau не позволяет использовать готовые бины (контейнеры) в расчетах, поэтому мы будем создавать свои собственные бины; это достаточно просто сделать.
- Устанавливаем название (Name) на Size of Sales (bin)
- Тип даты (Data type) устанавливаем на Int.
- Current value — на 500
Sales (bin)
INT([Sales by Customer] / [Size of Sales (bin)]) * [Size of Sales (bin)]
Normal Curve
(
1/MAX([Standard Deviation])*SQRT(2*PI())
)
*
EXP
(
-SQUARE(MAX([Sales (bin)]) - MAX([Mean]))
/
(2 * SQUARE(MAX([Standard Deviation])))
)
Важно: это так называемое распределение Гаусса, также известное как нормальное распределение.
Normal (Adjusted)
WINDOW_MAX([Customer Count])/WINDOW_MAX([Normal])*[Normal]
После этого приступаем к самой визуализации.
Рабочий лист
Строим рабочий лист:
- Меняем Mark Type на Gantt.
- Перетаскиваем Sales (bin) на полку Columns (колонок). Кликаем правой кнопкой мыши на объекте и выбираем Dimension.
- Перетаскиваем Normal (Adjusted) на полку Rows (рядов).
- Перетаскиваем Customer Count на Size Mark.
- Двойной клик на объекте — чтобы открыть встроенное редактирование, добавляем значок «–» в начало выражения.
- Перетаскиваем Normal (Adjusted) на полку Rows (рядов).
- Меняем тип метки Mark Type этой второй пилюли на Line.
Если все сделано правильно, то должно получиться так:

Теперь наводим красоту и получаем нашу Рутограмму:
- Кликаем правой кнопкой мыши на Normal Adjusted Pill и выбираем Dual Axis.
- Клик правой кнопкой мыши на заголовок оси и выбираем Synchronize Axis.
- Настраиваем цвета
- Настраиваем размер Size
- Настраиваем всплывающие подсказки (Tooltips)
- Скрываем заголовки осей (Axis Headers)
- Удаляем нулевые линии (Column Zero Lines).
Должно получиться так:

Источник: tableaumagic.com
ЦИФРЫ О НАС
Мы, компания АНАЛИТИКА ПЛЮС, с 2012 года помогаем нашим клиентам работать с данными — находить полезные инсайты и использовать эту информацию для увеличения прибыли компании.
За это время мы разработали и внедрили решения для компаний из разных сфер бизнеса: ритейл, дистрибуция, логистика, e-commerce, банки и финансы, маркетинг, телеком, производство, логистика, транспорт.
Мы помогаем начать работу с инструментами BI, предоставляем услуги «под ключ» — от сбора данных до установки ПО и предоставления финального интерактивного отчета. И конечно — проводим обучение: наши клиенты ни от кого не зависят и умеют работать со своими данными самостоятельно!