Практический кейс по выполнению Conformance checking — проверки соответствия последовательности событий бизнес-процесса. Этап Conformance checking описан без расчёта процессных метрик длительности, зацикленности и прочего.
Conformance checking — это второй этап методологии Process Mining, проводится после Discovery — обнаружения. Задача Conformance checking — определить, в какой мере фактический процесс совпадает с эталонным, выявить критические отклонения, мешающие запланированному течению процедур, провести своеобразное сравнение «ожидание/реальность».
Анализ путей процесса может провести дата-сайентист, изучая граф процесса. Когда объём журнала событий мал, а граф обозрим, тогда используется визуальный анализ. Для объёмного журнала событий анализ путей процесса рациональней проводить полностью автоматически, а специалист должен получать результаты в виде отчёта с метриками и примерами выбросов.
Граф должен использоваться как инструмент иллюстрации найденных отклонений. Он не может являться средством обнаружения проблемных зон. Основная причина — «spagetti style» отображения графа. Конечно, при наложении различных фильтров на граф можно увидеть искомые нарушения последовательностей, но есть риск, что аналитик не переберет все фильтры и не составит полную картину нарушений. Работа с фильтрами требует значительного времени ручного труда и поэтому является достаточно дорогой процедурой. Таким образом, анализ отклонений и анализ соответствия должен быть выполнен полностью автоматически.
Рассмотрим алгоритм Conformance checking, который реализован с помощью решения для интеллектуального анализа бизнес-процессов Loginom Process Mining.
Для иллюстрации того, как можно выполнить проверку соответствия, выберем тестовый процесс приёмки товара на склад. Для проведения проверки необходимо иметь:
Таблица 1. Буквенные обозначения событий
Событие (Event) | Буква (Event letter) |
---|---|
Приемка | A |
Оформление документов контрагентов | B |
Оформление приходных документов | C |
Заменить | M |
Определение локации | N |
Вызов погрузчика | R |
Размещение груза | S |
Груз размещен | O |
Примечания:
В журнале событий каждому событию поставлена в соответствие буква события. Тогда для каждого экземпляра процесса можно составить «слово процесса». В таблице 2 приведен фрагмент изучаемого датасета: 3 экземпляра процесса. В полном журнале событий, который анализировался на практике было более 63 тыс. экз. процесса. Например, для экземпляров процесса с ID №1 слово процесса будет — «AECMNRSO», а для ID с №2 «ABCMNRSO».
Следует упомянуть, что эталонный путь, как правило, различается для различных измерений. Например, приёмка товаров может осуществляться складом через ЖД-поставки, грузовым или авиатранспортом. Для каждого вида транспорта (измерения) будет свой эталонный путь, но это усложнение для примера мы опускаем.
Таблица 2. Слово процесса
ID_Process | Слово процесса (Process word) |
---|---|
1 | AECMNRSO |
2 | ABCMNRSO |
3 | ACECECMNRSO |
Таблица 3. Экземпляры процессов с разбивкой по буквам
ID_Process | Cобытие (Event) | Буква события (Event letter) |
---|---|---|
1 | Приемка | A |
1 | Данные контрагента введены | E |
1 | Оформление приходных документов | C |
1 | Заменить | M |
1 | Определение локации | N |
1 | Вызов погрузчика | R |
1 | Размещение груза | S |
1 | Груз размещен | O |
2 | Приемка | A |
2 | Оформление документов контрагентов | B |
2 | Оформление приходных документов | C |
2 | Заменить | M |
2 | Определение локации | N |
2 | Вызов погрузчика | R |
2 | Размещение груза | S |
2 | Груз размещен | O |
3 | Приемка | A |
3 | Оформление приходных документов | C |
3 | Данные контрагента введены | E |
3 | Оформление приходных документов | C |
3 | Данные контрагента введены | E |
3 | Оформление приходных документов | C |
3 | Заменить | M |
3 | Определение локации | N |
3 | Вызов погрузчика | R |
3 | Размещение груза | S |
3 | Груз размещен | O |
Далее следует сравнить эталонный путь с каждым из путей (слов) процесса на наличие и степень отклонений. Меру отличия пути будем рассчитывать с помощью расстояния редактирования Дамерау-Левенштейна.
Отличие путей (слов) процесса от эталона рассчитано в таблице 4.
Таблица 4. Conformance checking
ID_Process | Слово процесса (Process word) | Эталонный путь (Reference path) | Отличие пути |
---|---|---|---|
2 | ABCMNRSO | ABCMNRSO | 0 |
1 | AECMNRSO | ABCMNRSO | 1 |
3 | ACECECMNRSO | ABCMNRSO | 4 |
На основе таблицы 4 можно делать сводные таблицы, рассчитывая средние и медианные отклонения путей от эталона и любые прочие метрики, которые могут быть полезны аналитику.
Мы предлагаем рассчитывать 3 KPI, наиболее полно описывающих отклонения путей.
Разнообразие путей = (количество путей) / количество экземпляров процесса.
Для приведенного фрагмента = 3/3 = 100%. То есть, каждый экземпляр процессе идёт по своему пути.
Рассчитывается как стандартный коэффициент вариации на основе данных по отличию путей.
Коэффициент вариации = стандартное отклонение / математическое ожидание
Для приведенного фрагмента = 5.16 / 6.39 = 0.802. Метрика вариации сама по себе является мало что говорящим значением. Вариацию следует рассчитать для различных аналитик, сравнивая их можно видеть разницу: на сколько отличаются реальные пути процесса от запроектированного эталона.
Это, наверно, самый адекватный показатель степени отличия путей от эталонного пути. Надо рассчитать не только долю путей, отличающихся от эталона, но и учесть степень отличия и агрегировать всё в один интуитивно понятный показатель. Рассчитаем показатель степени соответствия путей эталону. Он рассчитывается наподобие индекса Джини.
По оси «X» – откладываются ID процессов. По оси «Y» – отличие пути. (см. рис.1). Степень соответствия путей эталону выражается как доля площади закрашенной области прямоугольника. Для данного примера из 3-х экземпляров процесса степень отличия пути от эталона = 41.7%.
После Conformance checking реализуется этап Enhancement — улучшение, в рамках которого происходит изменение и оптимизация согласно полученным выводам. Далее проводится Monitoring — отслеживание, финальный этап, цель которого заключается в наблюдении за правильностью течения обновленного процесса.
Больше информации об интеллектуальном анализе процессов в выступлении Владимира Колдаева — разработчика решения Loginom Process Mining.
Если ваша компания заинтересована во внедрении Loginom Process Mining для глубинного анализа бизнес-процессов, свяжитесь с нами.
Другие материалы по теме: