3.1. Визуализация процесса
Инструменты делятся на 3 категории:
Граф
Есть множество способов визуализировать бизнес-процесс. Существует множество известных нотаций: BPMN, EPC, IDEF0 и др. Несмотря на различия в деталях нотаций, основные элементы всегда одинаковы. Давайте разберем их на примере простейшего представления — графа процесса.
Граф — простейшее наглядное представление процесса в виде последовательности операций, связанных переходами, без дополнительных элементов, присущих некоторым нотациям.
Каждая нода графа — это операция, а ребро, связывающее две операции — переход. На ноды и рёбра можно вывести любые метрику: количество, длительность, вероятность, а также произвольный показатель, рассчитанный аналитиком.

Выделенные синим «Начало процесса» и «Конец процесса» — искусственные события. В логе данных их нет, но они позволяют воссоздать связную картину процесса и отследить все варианты начальных и конечных операций (пунктирные искусственные переходы). Метриками эти события не обладают.

Экземпляры, события в которых были одинаковыми и возникали в одном порядке, объединяются в пути. Каждый путь также можно охарактеризовать с помощью набора метрик, таких как популярность (число экземпляров в пути) и средняя длительность (средняя длительность входящих в путь экземпляров). Основные термина РМ описаны в глоссарии.
BPMN-диаграмма
В нотации BPMN также можно наблюдать операции (действия) и переходы (потоки управления). В отличие от графа, в этой нотации появляются дополнительные элементы, например, шлюзы, события и потоки.
Пример
Транскрибация
После загрузки датасета, если была включена опция «Автоматическое создание исследования», платформа сформировала типовой дашборд, которым можно воспользоваться, чтобы начать анализ процесса.

Если опция не была выбрана в ходе разметки, создать типовой дашборд можно на вкладке «Данные», «Источники данных». Нажмите на иконку «Создать дашборд», введите название и, при необходимости, описание, а затем нажмите на кнопку «Создать».

Чтобы открыть созданный дашборд, перейдите на вкладку «Дашборды» и найдите в списке интересующее вас исследование. Откройте созданный вами дашборд.

На первом листе, «Обзор», представлена основная статистическая информация о процессе — количество экземпляров, средняя длительность процесса, анализируемый период, а также анализ динамики деятельности и базовая статистика по операциям.

Перейдите на лист «Процесс». На первой странице вы видите граф процесса. На граф выведены количественные метрики — число операций и переходов, но эти показатели можно легко поменять. Откройте виджет в режиме редактирования. Это можно сделать, выбрав опцию «Изменить диаграмму» или просто кликнув на название виджета.

В левой части экрана находятся все доступные метрики. Средняя часть — окно настроек. В правой части располагается окно предпросмотра. Давайте изменим метрики и на нодах, и на ребрах на количество экземпляров.

Удалите метрику «Количество операций». Нажмите на поле для добавления новой метрики. В открывшемся окне есть три вкладки: преднастроенные показатели, базовые и SQL. Для замены метрики можно воспользоваться преднастроенным вариантом «Количество экземпляров» либо во вкладке «Базовые» выбрать столбец экземпляра и агрегат — COUNT_DISTINCT. Нажмите «Сохранить».

Проделайте то же самое с метриками ребер, после чего нажмите «Обновить диаграмму».

На экране предпросмотра вы видите граф процесса. По умолчанию отображены пять самых популярных путей. Можно видеть, какое количество экземпляров проходит по этим путям, а также основные характеристики каждого из них.

Наведение курсора на каждый из путей позволит изучить их подробнее. В нашем примере мы видим, что, во-первых, самый популярный путь состоит исключительно из технических операций. Это значит, что в большинстве случаев реальная продажа продукта не производилась. Во-вторых, часто — в более чем 10% случаев, происходит отмена операции, что сигнализирует об отказе клиента от покупки. В-третьих, нередким является путь, когда набор операций ограничивается только одной — вход в систему. Других действий сотрудник в этих экземплярах не производил.

Так, на основании всего лишь пяти самых частых путей, охватывающих только 68% всего датасета, мы уже обнаружили три неэффективности. Только в одном пути из пяти встречается операция, подтверждающая удачную продажу — «Подтверждение сотрудником загрузки скана документа».
3.2. Инструменты Business Intelligence (BI)
В основе применения методов BI-аналитики лежит расчет показателей (метрик) и их визуализация.

В нашем курсе мы сфокусируемся на специфике, которой обладает анализ процессов, когда между строками данных появляется дополнительная связь — экземпляр процесса.
Метрики для анализа
Последовательность операций в экземпляре кодируется в соответствии с этими буквами, формируя таким образом слово процесса, которое может служить идентификатором пути, и в то же время в простейшей форме визуализировать возвраты и циклы в процессе.
1. Выбросы
Выбросы — это наблюдения, выделяющиеся из общей выборки данных и оказывающие значительное влияние на средние показатели.
Например, при вычислении среднего возраста клиента — потребителя услуги, в выборку попали клиенты в возрасте 20, 22, 24, 25, 28 и 54 года. Средний возраст по всей выборке составил 28,8 лет. В то же время клиент 54 лет от роду явно выделяется из нашей выборки. Он оказался выбросом и значительно увеличивает средний показатель. Без учета этого клиента средний возраст составляет 23,8 лет (на 5 лет или 17% меньше).

Наиболее важно правильно определять значения-выбросы при расчете длительности совершения операций. Малейшее отклонение в показателях может завысить трудозатраты и оказать влияние на бюджетирование, планирование численности и расчеты по тарифным моделям.

В платформе Sber Process Mining реализовано три названных ниже подхода к расчету выбросов.

1) «Ручной ввод» — разметка указанной аналитиком доли наблюдений (по умолчанию 5%) самых маленьких и самых больших значений указанной метрики
2) Статистический алгоритм — с применением метода интерквартильного размаха
3) ML-алгоритм — инструмент машинного обучения, который сам определит, какие значения стоит считать выбросами

В результате расчета одним из методов платформа добавит набор метрик, разметит значения в датасете на «выбросы» и «невыбросы» для дальнейшего использования аналитиком.
2. Отраслевые / пользовательские метрики
Кроме метрик, рассчитанных платформой автоматически, пользователь может настраивать собственные аналитики благодаря встроенному SQL редактору метрик. Подробнее возможности редактора будут разобраны в следующих курсах по Process Mining.

Пример

Воспользуемся возможностью построения произвольных визуализаций и сопоставим для каждого сотрудника количество начатых им экземпляров, или контактов с клиентом, с числом реально совершённых продаж.
Транскрибация
Наведите курсор на знак «плюс» в правой верхней части экрана. Выберите пункт «Диаграмма». Для создания нового виджета необходимо сначала выбрать датасет-источник, а затем один из вариантов визуализации. Выберите загруженный вами датасет «Продажа продукта», а затем столбчатую диаграмму. Нажмите «Создать новую диаграмму».

Пролистайте список метрик и найдите в пользовательских атрибутах поле USER_NAME. Перенесите его на ось X. В метриках выберите «Количество экземпляров».

Настройте сортировку по количеству экземпляров, по убыванию, нажмите «Создать диаграмму». В настройках можно включить опцию для масштабирования графика. Сохраним созданный виджет на дашборд. Для этого нужно нажать «Сохранить», ввести название виджета и подтвердить сохранение.

Внесем изменения в наш график. В настройках найдите раздел «Фильтры по экземплярам». Добавьте фильтр по последовательности; в настройках добавьте операцию «Подтверждение сотрудником загрузки скана документа» в блок «Содержит любой из шагов». Примените настройки и сохраните фильтр. Обновите диаграмму. Сохраните этот виджет на дашборд как копию. Для этого не забудьте при сохранении переключить вариант сохранения на «Сохранить как» и сменить название. На этот раз сохраним график и сразу перейдем на дашборд.

После сохранения новые виджеты появляются в нижней части первой страницы дашборда. Режим редактирования позволяет настроить внешний вид дашборда по вкусу пользователя — создать новые вкладки, перенести виджеты с одной вкладки на другую, изменить размеры и расположение визуализаций.

Два построенных нами графика показывают, что сотрудники – лидеры по числу контактов с клиентом не попадают в число лучших по продажам. Например, лидерами по презентации продукта являются Бровкин Вячеслав и Васильев Игорь, на счету которого числится они провели 67 и 66 презентаций соответственно начатых экземпляров, продал всего одну единицу продукта.
3.3. Инструменты машинного обучения
Машинное обучение является частью науки о данных и позволяет обогащать инструменты Process Mining моделями и новыми инструментами. На момент составления данного курса в платформу Sber Process Mining встроено 7 ML- инструментов. Новые модели встраиваются регулярно. Ниже мы ознакомимся с основными, чаще всего используемыми в анализе инструментами ML. Познакомиться с полным списком, правилами настройки и интерпретации результатов можно в руководстве пользователя в платформе и на курсе «ML в Process Mining».
  • Факторный анализ
    Инструмент, позволяющий сравнить влияние различных факторов на интересующий аналитика целевой показатель

    В качестве целевой переменной можно выбрать любой атрибут из датасета или метрику анализируемого процесса.

    Чаще всего анализируются длительность процесса и его успешность. В качестве меры успешности можно выбрать операцию/операции, что в логике анализируемого процесса означает успешное достижение результата (например, подписание договора, корректное закрытие обращения, поставка ценностей); либо оставить это поле пустым, тогда модель определит операцию успеха сама.

    Набор факторов, или влияющих переменных, определяет пользователь. Выбирать можно любые показатели — численные, категориальные и даже даты.

    По результатам работы модели будет предоставлен отчет, сравнивающий влияние анализируемых переменных на целевой показатель. Чем выше значение, полученное в отчете, тем более значимое влияние анализируемый показатель оказывает на результат.

    Если при построении модели была выбрана опция «Добавить необъясненные данные», результаты будут содержать дополнительную строку «Прочее», которая позволит оценить, достаточный ли список факторов мы включили в анализ.

    Если доля прочих переменных значительно превышает 80% (или даже приближается к 1), значит, включенные в модель факторы слабо объясняют целевую переменную, нужны дополнительные данные.
  • Root Cause анализ
    Инструмент для поиска коренных причин, основанный на факторном анализе, но предоставляющий более подробные результаты. Помимо сравнения влияния факторов на целевую переменную, модель делит значения факторов на однородные группы, а результаты представляет в виде дерева решений.
  • Автоинсайты
    Инструмент автоматизирует поиск самых частых и типовых неэффективностей в процессах — высокие или растущие длительности, узкие места, циклы и возвраты, ошибки и инциденты. Модель определяет операции, в которых наблюдается неэффективность определенного типа, рассчитывает излишние затраты времени, вызванные ею, а также оценивает потенциальный финансовый эффект, которого можно достичь за счет устранения найденной проблемы.
  • Поиск счастливого пути
    Инструмент позволяет определить самый короткий, быстрый, наиболее прямой путь для успешного завершения процесса. Модель удобна для построения dream процесса на основе данных о реальном протекании деятельности и знания о желаемом результате исполнения процесса.
  • Автоматическое исследование
    Инструмент визуализирует найденные модулем автоинсайтов неэффективности, детализирует некоторые из них, используя факторный анализ, а также строит дополнительные аналитики для удобства интерпретации. В результате модель формирует презентацию с набором наблюдений и рекомендаций по улучшениям процесса.