Smart Analytics | Статьи | Что такое предиктивная аналитика?

4 марта 2022 г.

Что такое предиктивная аналитика?

Сегодня, наверное, каждой компании знакомо понятие data-driven подхода. В условиях высокой конкуренции сложно принять верное управленческое решение, основываясь только лишь на интуиции, догадках и собственном мнении. И здесь на помощь приходит аналитика данных.

Давайте рассмотрим, какие виды аналитики данных существуют и какую пользу они могут принести. Как правило, выделяют 4 вида аналитики данных.

  • Дескриптивная (описательная) аналитика отвечает на вопрос о том, что произошло в тот или иной момент времени или за какой-либо период. Аналитика такого рода может быть проведена с использованием разного рода визуализаторов. Например, для выявления проблемы падения прибыли компании будет достаточно просмотреть таблицу с данными в динамике или линейный график.
  • Диагностическая аналитика используется для ответов на вопросы о том, почему произошло то или иное событие. Например, чем вызван рост затрат у компании? Диагностическая аналитика призвана объяснить причины произошедшего; для выявления основных факторов, оказавших влияние на анализируемое событие, используют статистические методы анализа данных.
  • Предиктивная (предсказательная, прогнозная) призвана спрогнозировать неизвестные события в будущем, отвечая тем самым на вопрос «Что произойдет?». Например, как изменятся продажи к концу текущего года? Предиктивная аналитика — это совокупность методов анализа данных с их интерпретацией, которая позволяет на основе накопленной информации определять тренды исследуемых показателей и прогнозировать будущие события.
  • Прескриптивная (предписывающая, предписательная) аналитика отвечает на вопрос «Что следует делать, чтобы добиться желаемого результата?». Например, какие потребуются мероприятия, чтобы достичь требуемого объема добычи? В рамках прескриптивной аналитики применяют различные методы искусственного интеллекта с использованием всего массива накопленных данных.

В рамках данной статьи мы бы хотели остановиться более детально на предиктивной аналитике и рассмотреть причины ее столь высокой востребованности и популярности сегодня, а также поделиться примером из нашей практики.

О предиктивной аналитике

Так почему же предиктивная аналитика столь востребована? Разберем простейшие кейсы. Компания произвела скоропортящуюся продукцию, но не смогла ее реализовать по причине сократившегося спроса. Или, наоборот спрос на услуги в выходной день был высоким, а доступных специалистов не хватило, чтобы полностью его удовлетворить. Этих проблем можно было бы избежать при наличии прогнозных оценок спроса на продукцию.

Предиктивная аналитика может использоваться в совершенно разных сферах деятельности: в здравоохранении для прогнозирования заболеваний и осложнений у пациентов; в промышленности для прогнозирования поломок оборудования, планирования технического обслуживания оборудования и оптимизация параметров его работы; в маркетинге для формирования персональных предложений клиентам, оптимизации маркетинговых каналов и для прогнозирования поведения потребительской аудитории; в страховании для определения размера страховой премии с учетом ожидаемых убытков. И этот список можно продолжать довольно долго...

Таким образом, не остается сомнений в том, что предиктивная аналитика дает компании преимущество перед конкурентами, не внедрившими ее в свою деятельность, поскольку руководители и сотрудники компании знают, что ожидать завтра и в более далеком будущем, и, как следствие, понимают, какое решение окажется оптимальным для той или иной ситуации. Компании используют предиктивную аналитику для нахождения закономерностей в данных с целью выявления потенциальных рисков и угроз в своей деятельности и новых возможностей, иными словами, данные могут позволить оптимизировать деятельность и способствовать росту прибыли компании.

Внедрение предиктивной аналитики

Так что же необходимо для того, чтобы внедрить предиктивный анализ данных? Процесс предиктивного анализа может быть описан как процесс, состоящий из нескольких шагов, в которых сырые необработанные данные верифицируются и обрабатываются с целью создать предсказания на основе математической модели.

Для начала необходима постановка задачи. Перед созданием предиктивной модели следует определиться, какие показатели мы хотим получить на выходе, для какого временного интервала, в каких динамике и разрезах. Кроме того, для целей последующего сбора данных необходимо сформулировать гипотезы о предполагаемом влиянии тех или иных факторов на исследуемые показатели.

После того, как будут поставлена задача и сформулирована гипотеза, можно приступать к сбору исторических (ретроспективных) данных как по исследуемым показателям, так и по предикторам (факторам). В последнее время вычислительные мощности компаний растут, компании собирают данные как по своим внутренним показателям и процессам, так и по внешним факторам, поэтому при сборе данных важно определить требуемые источники данных среди доступных корпоративных и при необходимости дополнить их внешними.

При сборе данных необходимо учитывать их объем (глубину ретроспективы) и их качество. Эффективный анализ, получение объективных выводов возможно при большом объеме актуальных данных. Что же касается качества данных, то данные должны быть точными и чистыми от ошибок, то есть такими, чтобы им можно было доверять и корректно интерпретировать. Собранные данные необходимо проверифицировать и «очистить» от разного рода ошибок (например, удалить дубликаты, проверить на выбросы, исправить некорректные форматы и т.д.).

После того, как все данные будут собраны, начинается работа с ними. Речь идет об исследовательском (разведочном) анализе данных. Это этап выявления закономерностей, скрытых взаимосвязей в данных - так называемых «инсайтов». На данном этапе строится предиктивная модель. При построении модели важно определить предикторы – факторы, влияющие на прогнозируемые показатели / явления. Например, для построения прогнозов спроса на продукцию можно рассматривать такие предикторы, как погодные условия, сезонные распродажи, дни недели и праздничные дни, времени года и времени суток, а также уровень цен, денежные доходы населения и др.

Надо заметить, что для моделей, содержащих среди предикторов социально-экономические показатели (переменные параметры внешней среды), целесообразно строить сценарные прогнозы (в зависимости от альтернативных вариантов развития ситуации). Сценарное прогнозирование позволяет использовать несколько вариантов наиболее вероятных сценариев (например, базовый, пессимистический и оптимистический), которые обеспечат в будущем компании возможность быстро переориентироваться в изменяющихся условиях. Например, нашей компанией была разработана предиктивная модель, предназначенная для прогнозирования региональных балансов трудовых ресурсов и уровня безработицы в разрезе отраслей экономики.

Мы определили сценарные и управляемые параметры, сформулировали сценарии анализа и построили модель прогнозирования на основе методов корреляционно-регрессионного анализа. Среди сценарных параметров использовались такие показатели, как динамика численности населения по группам возрастов, индекс физического объёма производства по отраслям, инвестиции, индекс реальных располагаемых денежных доходов.

На данном этапе применяются статистические методы, методы интеллектуального анализа данных (Data Mining); современным трендом становится использование машинного обучения. Независимо от используемого метода, важным шагом в построении предиктивной модели является ее тестирование – оценка точности выдаваемых ей результатов, при необходимости - корректировка модели и повторное ее тестирование.

Основываясь на нашем опыте, мы бы рекомендовали разрабатывать предиктивные модели в рамках единой аналитической системы, а именно совместно с разработкой единого хранилища данных, при необходимости – с настройкой автоматической загрузки данных с сайтов статистических ведомств, с внедрением инструментария валидации исходных данных, разработкой форм ввода для сценарных параметров и отчетных форм / дашбордов для отображения значений прогнозных показателей.


А наша компания с удовольствием поможет вам в разработке таких систем.

Подпишитесь на блог

Будем делиться с вами своими знаниями и открытиями. Никакого спама, только польза.