Smart Analytics | Статьи | Топ-9 диаграмм для визуализации данных

26 июня 2020 г.

Топ-9 диаграмм для визуализации данных

Рассказываем о визуализации данных. Познакомим вас с подборкой аналитических отчетов из наших решений, в которых используются разные инструменты для визуализации данных: от базовых до продвинутых.

Зачем нужна визуализация данных?

Люди лучше воспринимают и запоминают данные в визуальном формате. Информация становится привычнее и понятнее, если подать ее в виде красивых схем, графиков и диаграмм.

Данные визуализируют, чтобы в моменте получить представление о явлении или состоянии процесса, который мы анализируем. Визуализация данных позволяет нам сделать фотографию ситуации «здесь и сейчас», не погружаясь в цифры и таблицы.

Преобразование необработанной информации в графический формат помогает доступно объяснять сложные вещи для решения таких бизнес-задач, как анализ эффективности направлений деятельности, анализ динамики выполнения задач, анализ достижения целей. Успех визуализации напрямую зависит от правильности ее применения, а именно от выбора и грамотного использования типов графиков и диаграмм.

Осталось выяснить, какие методы интерпретаций данных подойдут вам. Для этого сначала перечислим традиционные способы визуализации данных на примере решения UN ESCWA Data Portal, а затем перейдем к более продвинутым, на примере решения 3M™ Benchmark Portal.

Самые популярные типы визуализации данных

Выше мы привели несколько примеров традиционных способов визуализации данных, взятых с Портала открытых данных, разработанного Smart Analytics для ЭСКЗА ООН. Пользователи данного портала – любые посетители, заинтересованные в изучении социальных и экономических статистических данных 18-ти Арабских государств.

Рис. 1. Круговая Диаграмма

Круговая диаграмма – это один из наиболее распространенных и простых способов графического представления количественных данных. Такие диаграммы легко считывать и воспринимать, потому что отношения частей от целого показаны на ней простым и наглядным образом. Круговые диаграммы идеально подходят для того, чтобы быстро сформировать представление о пропорциональном распределении данных. На нашем примере – распределение объемов выбросов CO2 в разрезе секторов экономики.

Рис. 2. Столбиковая Диаграмма

Столбиковая диаграмма или гистограмма – еще один популярный способ визуализации данных для быстрого восприятия информации. Гистограммы преобразовывают набор данных в прямоугольные столбцы, высоты или длины которых пропорциональны величинам, которые они отображают. Такие диаграммы значительно упрощают сравнение сопоставимых данных одной категории в рамках ограниченного периода времени. Пример — изменение численности населения страны за конкретный период или на нашем скриншоте – динамика изменения структуры ВВП стран Юго-Западной Азии за последние 18 лет.

Рис. 3. Линейный график

Как и столбиковые диаграммы, линейные графики помогают визуализировать данные в компактном и точном формате, что позволяет легко воспринимать информацию, отмечать тренды или соотношения показателей (при использовании нескольких линий). Линейные графики используются для отображения результирующих данных относительно непрерывной переменной – чаще всего времени. В этом типе визуализации необходимо правильное использование разных цветов, чтобы сделать анализ информации еще проще для пользователей. На нашем примере – линейный график, показывающий число прибывших и покинувших Арабские страны пассажиров с 2005 по 2018 гг.

Наш Портал открытых данных позволяет визуализировать информацию в виде таблиц, диаграмм, графиков и текстов. В ЭСКЗА ООН еще никогда не было настолько удобного и интуитивно-понятного инструмента для распространения данных.

Statistics Division

UN ESCWA

Типы визуализации данных для более глубокого анализа

Бывает, что при простой визуализации данных не хватает нужной детализации, и поэтому её недостаточно. Чтобы уточнить информацию, вынести на графики и диаграммы существенные детали, применяются продвинутые способы визуализации данных.

В качестве примера мы продемонстрировали решение, разработанное для отраслевого подразделения корпорации 3М (Health Information Systems). Это Бенчмаркинг-портал, предоставляющий пользователям эффективные и наглядные инструменты для анализа эффективности работы бельгийских госпиталей, их сравнительного анализа и принятия решений по управлению затратами. Решение также может применяться в разных индустриях.

Рис. 4. Диаграмма Санкей

Диаграмма Санкей – это специфический тип визуализации, используемый для отображения потока от одного набора значений к другому. Такой тип диаграмм часто используют для иллюстрации бизнес-процессов или движения потоков. Диаграмма Санкей показывает нагрузку, пропускную способность, эффективность, взаимосвязи, их силы и конкретный вклад в общий поток. Линии диаграммы могут соединяться или разветвляться. Ширина линий напрямую связана с долей потока: чем больше параметр, тем толще линия. Диаграмму часто используют для иллюстрации распределения бюджетных доходов и расходов. На нашем примере диаграмма отображает 2 модели финансирования госпиталей: слева – старый вариант, справа – новый вариант. Она позволяет анализировать изменение структуры финансирования из-за перехода к новому набору правил модели.

Рис. 5. Лепестковая или Радиальная Диаграмма

Радиальная диаграмма, которая также известна как паукообразная или лепестковая диаграмма, полезна для проведения сравнения между количественными переменными. Такие диаграммы позволяют легко сравнивать сразу несколько показателей и видеть, есть ли в них существенные отклонения, которые могут потребовать дальнейшего изучения. В нашем примере радиальная диаграмма сравнивает между собой профили ухода в госпитале. Она демонстрирует частоту оказания различных процедур в однотипных отделениях, например, в реанимации. Чем выше частота оказания процедур ухода, тем больше расходов требуется на ту или иную группу эпизодов ухода.

Pис. 6. Лепестковая Диаграмма

В следующем примере еще один аналитический отчет с использованием лепестковой диаграммы. Этот пример отображает обобщённую ситуацию в госпитале по ключевым характеристикам качества лечения: уровню повторных обращений пациентов, больничных осложнений, смертности и относительной продолжительности пребывания в госпитале. Красная линия соответствует усреднённым значениям, темно-синяя – текущему состоянию в госпитале, пунктир – ситуации в предыдущем квартале.

Рис. 7. Диаграмма Рассеяния

Диаграмма рассеяния или точечная диаграмма является одним из семи основных графических методов, которые наиболее полезны при устранении проблем с качеством. Она представляет собой график, на котором по горизонтальной и вертикальной оси откладываются значения, и каждая пара значений может быть представлена в виде точки. По разбросу точек на данном графике можно оценить точность модели. Если большая часть точек сосредоточена вдоль линии, а значительные отклонения редки или совсем отсутствуют, то модель работает хорошо. Если разброс точек велик, то точность модели низкая.

На скриншоте каждая линия представляет собой отдельную диаграмму рассеяния. Данный аналитический отчёт показывает распространённость ошибок кодирования по определённым категориям ухода в госпитале, где каждая категория ухода предполагает уход по соответствующей группе патологий, а также показывает качество кодирования в госпиталях. Красные окружности – это усредненные значения, а синие показывают состояние в текущем госпитале.

Рис. 8. Тепловая Карта

Тепловая карта служит для отображения больших объемов сравнительных данных с представлением значений в виде маркированных цветовых плиток. Тепловые карты удобны для демонстрации вариативности множества переменных, выявления паттернов, отображения сходств переменных друг с другом и определения наличия взаимосвязей между ними.

Тепловую карту удобно использовать для сравнения эффективности подразделений компании или для определения приоритетных направлений инвестирования и выявления проблемных областей. На примере карта показывает распространённость диагнозов пациентов по группам патологий.

Рис. 9. Скрипичная Диаграмма

И последний тип – скрипичная диаграмма. Эта статистическая диаграмма используется для визуализации распределения данных и их плотности вероятности. Каждая «скрипка» представляет группу или переменную. Форма представляет оценку плотности вероятности переменной: чем больше точек данных в определенном диапазоне, тем больше скрипка для этого диапазона. Несмотря на то, что график кажется необычным, он часто бывает достаточно полезен, особенно, когда нам важно показать форму распределения.

Скрипичная диаграмма используется для отображения сравнения переменного распределения по разным «категориям». Она помогает пользователю определить, возможна ли замена вероятностной оценки каким-либо средним значением.

В нашем примере каждая скрипка симметрична слева направо. Однако, в идеальной классификации – скрипки должны быть компактными с очень короткими “хвостами”. В нашем же случае, мы видим, что скрипки вытянутые, медианное значение сильно растянуто. Это значит, что категории были подобраны не самым лучшим образом.

Мы слышали только хорошие отзывы о нашем Портале.

Пользователи Портала

3M Health Information Systems

Визуализация данных для решения задач любой сложности

Визуализация данных – мощный инструмент демонстрации результатов бизнес-анализа, помогающего наглядно представлять данные и давать рекомендации пользователям.

Возможность визуализировать информацию разными способами: от круговых диаграмм, гистограмм до радиальных и скрипичных диаграмм, делает данные интерпретируемыми и наглядными для пользователей. А правильно подобранный тип аналитического отчета поможет сделать верные выводы и принять обоснованные решения. При этом важно, чтобы данные были понятны всем категориям пользователей: и аналитикам, и руководителям, и любым заинтересованным внешним пользователям. 

Решения в области визуализации и распространения данных, разрабатываемые Smart Analytics, позволяют работать с широким набором источников данных и дают возможность пользователям любого уровня – от новичков до продвинутых дата-аналитиков самостоятельно анализировать данные, конструировать интерактивные отчеты любой сложности и делиться информацией с заинтересованными пользователями по всему миру.

Теги

  • Визуализация данных
  • Дашборды
  • Анализ данных
  • Бизнес-аналитика

Подпишитесь на блог

Будем делиться с вами своими знаниями и открытиями. Никакого спама, только польза.