Рутограмма в Tableau — за 10 минут

Как построить Рутограмму — «висящую» гистограмму на нормальной кривой распределения? Разбираемся, как сделать это за 10 минут..
Данные
Сначала загружаем данные из источника Sample Superstore в Tableau.
Источник доступен по ссылке — Orders
Важно: Если у вас есть доступ к Tableau Desktop и источнику Sample Superstore, можете использовать их.
Вычисляемые поля
С помощью загруженного источника данных создаем вычисляемые поля:
Customer Count (Номер клиента)
COUNTD([Customer ID])
Sales by Customer (Продажи по клиентам)
{ FIXED [Customer Name]: SUM([Sales]) }
Мы используем выражение LOD для получения общей суммы продаж по клиентам (Sales by Customer).
Среднее значение
{ AVG([Sales by Customer]) }
У нас нет измерения (дименшена), так как нам нужно, чтобы среднее значение вычислялось по всему набору данных.
Стандартное отклонение
{ STDEV([Sales by Customer]) }
Параметр Size of Sales (bin)
К сожалению, Tableau не позволяет использовать готовые бины (контейнеры) в расчетах, поэтому мы будем создавать свои собственные бины; это достаточно просто сделать.
- Устанавливаем название (Name) на Size of Sales (bin)
- Тип даты (Data type) устанавливаем на Int.
- Current value — на 500
Sales (bin)
INT([Sales by Customer] / [Size of Sales (bin)]) * [Size of Sales (bin)]
Normal Curve
(
1/MAX([Standard Deviation])*SQRT(2*PI())
)
*
EXP
(
-SQUARE(MAX([Sales (bin)]) - MAX([Mean]))
/
(2 * SQUARE(MAX([Standard Deviation])))
)
Важно: это так называемое распределение Гаусса, также известное как нормальное распределение.
Normal (Adjusted)
WINDOW_MAX([Customer Count])/WINDOW_MAX([Normal])*[Normal]
После этого приступаем к самой визуализации.
Рабочий лист
Строим рабочий лист:
— Меняем Mark Type на Gantt.
— Перетаскиваем Sales (bin) на полку Columns (колонок). Кликаем правой кнопкой мыши на объекте и выбираем Dimension.
— Перетаскиваем Normal (Adjusted) на полку Rows (рядов).
— Перетаскиваем Customer Count на Size Mark. Двойной клик на объекте — чтобы открыть встроенное редактирование, добавляем значок «–» в начало выражения.
— Перетаскиваем Normal (Adjusted) на полку Rows (рядов). Меняем тип метки Mark Type этой второй пилюли на Line.
Если все сделано правильно, то должно получиться так:

Теперь наводим красоту и получаем нашу Рутограмму:
— Кликаем правой кнопкой мыши на Normal Adjusted Pill и выбираем Dual Axis. Клик правой кнопкой мыши на заголовок оси и выбираем Synchronize Axis.
— Настраиваем цвета
— Настраиваем размер Size
— Настраиваем всплывающие подсказки (Tooltips)
— Скрываем заголовки осей (Axis Headers)
— Удаляем нулевые линии (Column Zero Lines).
Должно получиться так:

Источник: tableaumagic.com
Мы, компания АНАЛИТИКА ПЛЮС, с 2012 года помогаем нашим клиентам работать с данными — находить полезные инсайты и использовать эту информацию для увеличения прибыли компании.
За это время мы разработали и внедрили решения для компаний из разных сфер бизнеса: ритейл, дистрибуция, логистика, e-commerce, банки и финансы, маркетинг, телеком, производство, логистика, транспорт.
Мы помогаем начать работу с инструментами BI, предоставляем услуги «под ключ» — от сбора данных до установки ПО и предоставления финального интерактивного отчета. И конечно — проводим обучение: наши клиенты ни от кого не зависят и умеют работать со своими данными самостоятельно!
Хотите узнать, как провести анализ и сделать отчеты быстро?
Нам доверяют: