Статьи

Статьи
3 июня 2020
Обработка пропусков в данных
На практике в реальных данных очень часто встречаются пропуски. Причинами могут быть ошибки ввода данных, сокрытие информации, фрод. Разбираем в статье, в каких случаях неправильная обработка...
Кластеризация категорийных данных: масштабируемый алгоритм CLOPE
Разбиение на группы со схожими характеристиками категорийных и транзакционных массивов данных в больших БД является важнейшей задачей Data Mining. Традиционные алгоритмы кластеризации в большинстве...
Алгоритмы кластеризации на службе Data Mining
Данный материал — попытка систематизировать и дать целостный взгляд на последние достижения в области разработки эффективных подходов к кластеризации данных. Целью материала не являлось подробное...
Apriori — масштабируемый алгоритм поиска ассоциативных правил
Apriori – один из наиболее популярных алгоритмов поиска ассоциативных правил. Благодаря использованию свойства анти-монотонности, он способен обрабатывать большие объемы данных за приемлемое время....
Как найти и объединить дубли клиентов
В этой статье расскажем, откуда берутся дубли, чем они мешают бизнесу и как Loginom помогает избавиться от дубликатов, консолидировать клиентскую базу и держать ее под постоянным контролем.
Выявление обобщенных ассоциативных правил
Методы поиска обобщенных правил при вычислении используют информацию о группировке элементов (таксономию), что позволяет значительно расширить круг задач, решаемых алгоритмами поиска ассоциативных...
Введение в анализ ассоциативных правил
Объемы современных баз данных, которые весьма внушительны, вызвали устойчивый спрос на новые масштабируемые алгоритмы анализа данных. Одним из популярных методов обнаружения знаний стали алгоритмы...
Применение логистической регрессии в медицине и скоринге
При помощи логистической регрессии можно тестировать линейную зависимость между зависимой и независимой переменными. Преимущество логистической регрессии заключается в том, что данная модель...
Логистическая регрессия и ROC-анализ — математический аппарат
Математический аппарат и назначение бинарной логистической регрессии — популярного инструмента для решения задач регрессии и классификации. ROC-анализ тесно связан с бинарной логистической регрессией и...
Деревья решений — C4.5 математический аппарат | Часть 2
Вторая часть математического аппарата построения деревьев решений — алгоритм C4.5. Рассмотрены вопросы улучшения критерия разбиения, работы с пропущенными данными и классификации новых объектов....
Деревья решений — C4.5 математический аппарат | Часть 1
Разбираем алгоритм обучения деревьев решений C4.5: требования для обучающего набора данных и классификация новых объектов.
Деревья решений: общие принципы
Деревья решений — один из методов автоматического анализа данных. Разбираем общие принципы работы и области применения.
ABC XYZ — анализ продаж для умного управления бизнесом
Совместное использование ABC и XYZ-анализа поможет не запутаться в товарном ассортименте, оптимизировать логистику и складские запасы, сегментировать клиентов и партнеров, правильно настроить...