Статьи

Статьи
18 февраля 2021
Генетические алгоритмы — математический аппарат
Генетические алгоритмы предназначены для решения задач оптимизации и моделирования путём последовательного подбора, комбинирования и вариации искомых параметров с использованием механизмов, напоминающих...
EМ — масштабируемый алгоритм кластеризации
В основе EM кластеризации лежит масштабируемый алгоритм EM, который опирается на предположение, что исследуемое множество данных может быть смоделировано с помощью линейной комбинации...
Сегментация клиентов и автоматизация рассылок в Loginom
RFM-анализ и сегментация клиентов в Loginom. Настраиваем интеграцию с SendPulse для эффективной рассылки напрямую из сценария.
Нечеткая логика — математические основы
Математическая теория нечетких множеств и нечеткая логика являются обобщениями классической теории множеств и классической формальной логики. Изначально это была только теория, а в настоящее время она...
Очистка данных перед загрузкой в хранилище
При создании хранилищ данных все еще недостаточно внимания уделяется очистке поступающей в него информации. Видимо, считается, что чем больше размер хранилища, тем лучше. Это верный способ...
FPG — альтернативный алгоритм поиска ассоциативных правил
Кроме алгоритма Apriori для поиска ассоциативных правил существует алгоритм, получивший название Frequent Pattern-Growth (FPG), что можно перевести как «выращивание популярных (часто...
От нейросетей к Low-code: туда и обратно
Читая крутые истории о возможностях искусственного интеллекта, трудно не влюбиться в эту технологию: кажется, что нейросети можно применять для решения любой задачи. Нам тоже хочется верить во...
Из бизнес-пользователя в аналитики. Какую систему для анализа данных выбрать?
Хотите начать самостоятельно анализировать данные и не знаете, какой аналитический инструмент подойдёт? Где приручать питонов, а где ограничиться Excel? Мы подготовили обзор различных подходов к...
Технологии искусственного интеллекта для повышения эффективности эксплуатации сетей газораспределения и газопотребления
В статье приведены примеры решения задач предупреждения аварий на объектах газораспределения, оценки потерь газа при авариях, утечках и аварийных сбросах.
Методика анализа данных
При анализе информации часто возникает ситуация, когда теоретическое великолепие методов анализа разбивается о действительность. Ведь вроде все давно решено, известно множество методов решения...
Самоорганизующиеся карты Кохонена — математический аппарат
Самоорганизующиеся карты Кохонена – это одна из разновидностей нейросетевых алгоритмов. Этот алгоритм решает задачи кластеризации и проецирования многомерного пространства в пространство с более низкой...
Обработка пропусков в данных
На практике в реальных данных очень часто встречаются пропуски. Причинами могут быть ошибки ввода данных, сокрытие информации, фрод. Разбираем в статье, в каких случаях неправильная обработка...
Кластеризация категорийных данных: масштабируемый алгоритм CLOPE
Разбиение на группы со схожими характеристиками категорийных и транзакционных массивов данных в больших БД является важнейшей задачей Data Mining. Традиционные алгоритмы кластеризации в большинстве...