Быстрая очистка, стандартизация, обогащение клиентских данных в миллионы строк с помощью аналитической low-code платформы Loginom. Практический кейс: как добиться обработки одной строки адреса всего за 250 миллисекунд.
Интер РАО-Онлайн — российская ИТ-компания, оператор цифровых решений ПАО «Интер РАО» и других предприятий в сфере энергетики, ЖКХ, рынка бытовых услуг. Интер РАО-Онлайн создает аналитические системы, цифровые платформы, мобильные приложения, сервисы по подписке.
По состоянию на начало 2022 года, Интер РАО-Онлайн это:
В процессе своей деятельности Интер РАО-Онлайн обрабатывает большие наборы данных от компаний-заказчиков цифровых решений. Подавляющее большинство запросов относится к тематике очистки,стандартизации, нормализации клиентских данных.
В Интер РАО-Онлайн типичный бизнес-процесс работы с данными строится следующим образом:
Основные проблемы, которые возникали у Интер РАО-Онлайн при текущей организации бизнес-процесса заключались в том, что заказчик цифровых решений:
95% заказчиков не доверяло автоматизированным решениям по улучшению качества данных. В этой ситуации специалистам Интер РАО-Онлайн требовался инструмент, который, с одной стороны, позволял продемонстрировать прозрачность процедуры работы с клиентскими данными. С другой — обосновывал корректность методологии очистки и стандартизации. С третьей — был достаточно простым для понимания бизнес-пользователей.
В качестве инструмента работы с большими данными компания Интер РАО-Онлайн выбрала аналитическую low-code платформу Loginom.
В Интер РАО-Онлайн концепция работы с клиентскими данными строится следующим образом:
Все вышеуказанные процедуры были спроектированы в виде сценариев в Loginom, что позволило автоматизировать очистку 95% клиентских данных, только 5% остаются для ручного разбора.
Подробный бизнес-процесс работы с клиентскими данными реализованный с помощью Loginom приведен в таблице.
Этап | Операции |
---|---|
Очистка и стандартизация | Создание полного адресного профиля клиента |
Проверка кода ФИАС (Федеральной информационной адресной системы) на действительность | |
Стандартизация и очистка ФИО, проверка на базе типовых и нетиповых имен | |
Стандартизация и очистка паспортных данных, проверка их на действительность | |
Стандартизация и очистка номеров телефонов, проверка их на существование | |
Стандартизация и очистка e-mail адресов, проверка по базе доменов | |
Стандартизация и очистка ИНН, СНИЛС | |
Обогащение данных | Построение витрины данных с учетом обогащения из внутренних источников (личный кабинет клиента, CRM, система управления электронным документооборотом, 1С) |
Дополнение витрины данных из внешних источников | |
Дедупликация данных | |
Загрузка данных | Подготовка данных для экспорта в БД по согласованным шаблонам |
Контроль исполнения работ по корректировке и обогащению данных |
Ниже приведен пример сценария очистки номеров телефонов в Loginom.
В качестве ключевых преимуществ Loginom как инструмента работы с большими данными специалисты компании Интер РАО-Онлайн выделяют следующее:
Например, при тестировании Loginom для пакетной очистки домашних адресов клиентов скорость обработки составила 4 адреса в секунду или 250 миллисекунд в пересчете на один.
Отдельно аналитики Интер РАО-Онлайн отмечают прозрачность расчетов платформы. Loginom — это полностью «белый ящик», который позволяет наглядно продемонстрировать методику обработки данных. Открытость платформы помогает специалистам Интер РАО-Онлайн легко обосновывать свои наработки, вызывает доверие заказчиков цифровых решений.
Подробнее о внедрении Loginom в выступлении Владимира Анисимова, директора по данным компании Интер РАО-Онлайн:
Если ваша компания заинтересована в использовании Loginom как инструмента очистки, стандартизации, обогащения и нормализации больших данных, свяжитесь с нами.
Другие материалы по теме:
Очистка данных. Кейс коллекторского агентства ЭОС
Очистка данных. Кейс медицинской лаборатории Инвитро
Нейросетевые технологии обработки больших геологических данных. Кейс компании Норильскгеология