При анализе информации часто возникает ситуация, когда теоретическое великолепие методов анализа разбивается о действительность. Ведь вроде все давно решено, известно множество методов решения...
Самоорганизующиеся карты Кохонена – это одна из разновидностей нейросетевых алгоритмов. Этот алгоритм решает задачи кластеризации и проецирования многомерного пространства в пространство с более низкой...
На практике в реальных данных очень часто встречаются пропуски. Причинами могут быть ошибки ввода данных, сокрытие информации, фрод. Разбираем в статье, в каких случаях неправильная обработка...
Разбиение на группы со схожими характеристиками категорийных и транзакционных массивов данных в больших БД является важнейшей задачей Data Mining. Традиционные алгоритмы кластеризации в большинстве...
Данный материал — попытка систематизировать и дать целостный взгляд на последние достижения в области разработки эффективных подходов к кластеризации данных. Целью материала не являлось подробное...
Apriori – один из наиболее популярных алгоритмов поиска ассоциативных правил. Благодаря использованию свойства анти-монотонности, он способен обрабатывать большие объемы данных за приемлемое время....
В этой статье расскажем, откуда берутся дубли, чем они мешают бизнесу и как Loginom помогает избавиться от дубликатов, консолидировать клиентскую базу и держать ее под постоянным контролем.
Методы поиска обобщенных правил при вычислении используют информацию о группировке элементов (таксономию), что позволяет значительно расширить круг задач, решаемых алгоритмами поиска ассоциативных...
Объемы современных баз данных, которые весьма внушительны, вызвали устойчивый спрос на новые масштабируемые алгоритмы анализа данных. Одним из популярных методов обнаружения знаний стали алгоритмы...
При помощи логистической регрессии можно тестировать линейную зависимость между зависимой и независимой переменными. Преимущество логистической регрессии заключается в том, что данная модель...
Математический аппарат и назначение бинарной логистической регрессии — популярного инструмента для решения задач регрессии и классификации. ROC-анализ тесно связан с бинарной логистической регрессией и...
Вторая часть математического аппарата построения деревьев решений — алгоритм C4.5. Рассмотрены вопросы улучшения критерия разбиения, работы с пропущенными данными и классификации новых объектов....