АНАЛИТИКА ПЛЮС
Профессиональные услуги в сфере BI

Диаграмма рассеяния: простой способ добавить референс-группы

Чтобы отобразить дополнительные значения, на диаграмме рассеяния можно использовать референс-линию. Также используют не только линию, но и референс-группу, или диапозон референсных значений (Reference Bands). Как одновременно отобразить и точечную диаграмму рассеяния, и ее референс-группы? Разбираем на примере данных результативности игры спортсменов NHL.

В основе сегодняшней визуализации — Reference Bands, которые обозначают диапазон количества голов игрока за сезон. Считаем их — как произведение бросков по воротам (ось x) и эффективности этих бросков (ось y).

Такие референс-полосы или референс-группы добавляют четвертое измерение к нашей диаграмме рассеяния: помимо двух осей и размера пузырьков (количество игр), появляется визуальное отображение количества голов.

Создаем данные для Reference Bands

Делаем это в Excel. Можно скачать файл здесь: Data curvy Reference Bands

Данные для линий

The lines I want to draw represent the results of a multiplication of shot efficiency and shots on goal. Therefore, I took one of my dimensions (shots on goal), set the number of goals (19, 20, … , 100), and calculated the shot efficiency as the dependent variable.

Линии, которые будем создавать, представляют собой произведение эффективности броска и общего количества бросков по воротам. Поэтому берем одно из своих измерений (броски по воротам), устанавливаем нужное количество голов (19, 20, … , 100) и рассчитываем эффективность броска как зависимую переменную.

Данные для референс-групп (Reference Bands)

Для этих данных нам понадобятся данные из первого шага — копируем их и добавляем на лист.

Удаляем последнюю линию (Goal = 100).

Сортируем скопированные данные по количеству голов и PointOrder (баллы) в порядке убывания…

…и вычисляем новый PointOrder в скопированных данных.

Эти данные помогут в создании референс-групп для ранжирования количества голов: 10-20, 20-30, … , 90-100.

Также «ручками» добавляем координаты для первой полосы — от 0 до 10 голов.

Теперь собираем все вместе — исходные данные для линий, скорректированную копию этих данных и три записи для первой референс-полосы.

Создаем рабочий лист с Reference Bands

С помощью нашего данных создаем в Tableau референс-группы (Reference Bands).

Чтобы использовать референс-группы на нашей точечной диаграмме рассеяния, экспортируем рабочий лист как картинку (Image).

Затем используем эту картинку как фон в уже построенной диаграмме рассеяния (на другом листе).

Убедитесь, что оси имеют одинаковые значения в обеих визуализациях —  в референс-полосах и в самой диаграмме рассеяния.

Источник: vizjockey.com

ЦИФРЫ О НАС

Мы, компания АНАЛИТИКА ПЛЮС, с 2012 года помогаем нашим клиентам работать с данными — находить полезные инсайты и использовать эту информацию для увеличения прибыли компании.

За это время мы разработали и внедрили решения для компаний из разных сфер бизнеса: ритейл, дистрибуция, логистика, e-commerce, банки и финансы, маркетинг, телеком, производство, логистика, транспорт.

Мы помогаем начать работу с инструментами BI, предоставляем услуги «под ключ» — от сбора данных до установки ПО и предоставления финального интерактивного отчета. И конечно — проводим обучение: наши клиенты ни от кого не зависят и умеют работать со своими данными самостоятельно!

Как мы помогаем в работе с данными? >>

x

Этот сайт использует файлы cookies, чтобы облегчить вам пользование нашим веб-сайтом.

Продолжая использовать этот веб-сайт, вы даете согласие на использование файлов cookies.