Методика анализа данных
При анализе информации часто возникает ситуация, когда теоретическое великолепие методов анализа разбивается о действительность. Ведь вроде все давно решено, известно множество методов решения...
Самоорганизующиеся карты Кохонена — математический аппарат
Самоорганизующиеся карты Кохонена – это одна из разновидностей нейросетевых алгоритмов. Этот алгоритм решает задачи кластеризации и проецирования многомерного пространства в пространство с более низкой...
Обработка пропусков в данных
На практике в реальных данных очень часто встречаются пропуски. Причинами могут быть ошибки ввода данных, сокрытие информации, фрод. Разбираем в статье, в каких случаях неправильная обработка...
Кластеризация категорийных данных: масштабируемый алгоритм CLOPE
Разбиение на группы со схожими характеристиками категорийных и транзакционных массивов данных в больших БД является важнейшей задачей Data Mining. Традиционные алгоритмы кластеризации в большинстве...
Алгоритмы кластеризации на службе Data Mining
Данный материал — попытка систематизировать и дать целостный взгляд на последние достижения в области разработки эффективных подходов к кластеризации данных. Целью материала не являлось подробное...
Apriori — масштабируемый алгоритм поиска ассоциативных правил
Apriori – один из наиболее популярных алгоритмов поиска ассоциативных правил. Благодаря использованию свойства анти-монотонности, он способен обрабатывать большие объемы данных за приемлемое время....
Как найти и объединить дубли клиентов
В этой статье расскажем, откуда берутся дубли, чем они мешают бизнесу и как Loginom помогает избавиться от дубликатов, консолидировать клиентскую базу и держать ее под постоянным контролем.
Выявление обобщенных ассоциативных правил
Методы поиска обобщенных правил при вычислении используют информацию о группировке элементов (таксономию), что позволяет значительно расширить круг задач, решаемых алгоритмами поиска ассоциативных...
Введение в анализ ассоциативных правил
Объемы современных баз данных, которые весьма внушительны, вызвали устойчивый спрос на новые масштабируемые алгоритмы анализа данных. Одним из популярных методов обнаружения знаний стали алгоритмы...
Применение логистической регрессии в медицине и скоринге
При помощи логистической регрессии можно тестировать линейную зависимость между зависимой и независимой переменными. Преимущество логистической регрессии заключается в том, что данная модель...
Логистическая регрессия и ROC-анализ — математический аппарат
Математический аппарат и назначение бинарной логистической регрессии — популярного инструмента для решения задач регрессии и классификации. ROC-анализ тесно связан с бинарной логистической регрессией и...
Деревья решений — C4.5 математический аппарат | Часть 2
Вторая часть математического аппарата построения деревьев решений — алгоритм C4.5. Рассмотрены вопросы улучшения критерия разбиения, работы с пропущенными данными и классификации новых объектов....
Подписывайтесь на телеграмм-канал Loginom
Новости, материалы по аналитике, кейсы применения, активное сообщество
Подписаться