Сбор данных для анализа
В статье рассказываем про основные этапы сбора информации, следуя которым, можно подготовить качественные данные в нужном для анализа объеме. Данная методика — не жесткий набор инструкций, а...
Метод касательных в ABC-анализе
Особенностью метода касательных в ABC-анализе является отсутствие фиксированных границ групп, благодаря чему отпадает необходимость в регулярном пересмотре пороговых значений групп A, B и C. Расскажем...
Классификация данных методом k-ближайших соседей
Преимуществом статистических методов является их хорошая математическая обоснованность, недостатком — низкая объясняющая способность. Использование вероятностных оценок позволяет с высокой точностью...
Классификация данных при помощи нейронных сетей
Определённым компромиссом между параметрическим и метрическими методами является использование для решении задач классификации нейронных сетей. Нейронные сети являются непараметрическими моделями, не...
Поиск последовательных шаблонов. Часть 2
В первой части статьи мы рассмотрели базовые понятия: частая последовательность, последовательный шаблон, длина последовательности и обсудили общую процедуру поиска последовательных шаблонов....
Поиск последовательных шаблонов. Часть 1
Для расширения возможностей анализа транзакционных данных с учетом временного аспекта, последовательности появления предметов и ориентированности на конкретного клиента существует задача Data...
Генетические алгоритмы — математический аппарат
Генетические алгоритмы предназначены для решения задач оптимизации и моделирования путём последовательного подбора, комбинирования и вариации искомых параметров с использованием механизмов, напоминающих...
EМ — масштабируемый алгоритм кластеризации
В основе EM кластеризации лежит масштабируемый алгоритм EM, который опирается на предположение, что исследуемое множество данных может быть смоделировано с помощью линейной комбинации...
Сегментация клиентов и автоматизация рассылок в Loginom
RFM-анализ и сегментация клиентов в Loginom. Настраиваем интеграцию с SendPulse для эффективной рассылки напрямую из сценария.
Нечеткая логика — математические основы
Математическая теория нечетких множеств и нечеткая логика являются обобщениями классической теории множеств и классической формальной логики. Изначально это была только теория, а в настоящее время она...
Очистка данных перед загрузкой в хранилище
При создании хранилищ данных все еще недостаточно внимания уделяется очистке поступающей в него информации. Видимо, считается, что чем больше размер хранилища, тем лучше. Это верный способ...
FPG — альтернативный алгоритм поиска ассоциативных правил
Кроме алгоритма Apriori для поиска ассоциативных правил существует алгоритм, получивший название Frequent Pattern-Growth (FPG), что можно перевести как «выращивание популярных (часто...