Предвзятость подтверждения в анализе данных связана со склонностью человека интерпретировать результаты аналитики таким образом, чтобы они подтверждали его существующие убеждения или ожидания. Это может приводить к тому, что два специалиста, работая с одними и теми же данными, истолковывают информацию по-разному и принимают противоположные решения.
В настоящее время данные становятся активом любой компании, а их интеллектуальный анализ — инструментом преобразования информации в знания, обеспечивающие поддержку управленческих бизнес-решений. Однако аналитические платформы не могут сами генерировать решения. Это задача специалистов, которые интерпретируют результаты анализа и делают суждения и выводы, лежащие в основе принимаемых решений.
Бытует расхожее мнение, что качественные результаты анализа сами по себе гарантируют качественные управленческие решения. С одной стороны, это правильно — на основе плохих результатов нельзя сделать правильные выводы и суждения, а следовательно принять верное решение. Однако, сами по себе корректные результаты еще ничего не гарантируют — подводные камни, о которые может разбиться успех аналитического проекта, подстерегают на этапе интерпретации результатов и формирования выводов.
Виной тому являются так называемые когнитивные искажения — систематические отклонения в восприятии и мышлении, обусловленные субъективными убеждениями (предубеждениями) и стереотипами, социальными, моральными и эмоциональными причинами, сбоями в обработке и анализе информации и т.д. Наиболее распространенными видами когнитивных сдвигов являются:
Когнитивные сдвиги, возникающие в процессе интерпретации результатов анализа, могут привести к формированию ошибочных выводов и суждений и к принятию неадекватных управленческих решений, даже если сами результаты корректные.
Опасным видом когнитивного сдвига с точки зрения подхода к управлению бизнесом на основе данных является предвзятость подтверждения (confirmation bias), которую также называют склонностью к подтверждению своей точки зрения.
Предвзятость подтверждения — это склонность аналитика данных или лица, принимающего решения, отдавать предпочтение тем результатам, которые соответствуют их убеждениям, мнениям или ценностям. При этом они могут игнорировать те результаты, которые противоречат этим характеристикам. Такая когнитивная предвзятость может исказить выводы и ухудшить качество принимаемых решений.
Психологи объясняют, что предвзятость подтверждения основывается на желании избежать когнитивного диссонанса — психологического дискомфорта, испытываемого при наличии двух или более противоречивых убеждений, идей или ценностей.
Ситуация усугубляется тем, что в некоторых случаях люди не только предвзято относятся к определенным результатам, но и дискредитируют их, убеждая в этом других.
Нетрудно представить, как это повлияет на процесс извлечения знаний из данных: аналитик будет отдавать приоритет выводам, которые подтверждают первоначальную гипотезу, игнорируя наблюдения, которые ей противоречат. Если результаты неоднозначны или расплывчаты, предвзятость подтверждения побуждает исследователя интерпретировать их так, чтобы они соответствовали его представлению о проблеме.
Снизить негативный эффект от когнитивных сдвигов в области науки о данных позволяет интерпретация одних и тех же результатов несколькими аналитиками или командами, имеющими разный опыт, точки зрения и взгляды на проблему.
Ошибки, связанные с предвзятостью подтверждения, могут иметь последствия. Например, бизнес может потерять значительные доходы на маркетинговых кампаниях, ориентированных на неправильную аудиторию. В то же время новые продукты и услуги могут не найти своих потребителей.
С психологической точки зрения предвзятость подтверждения имеет место, когда человек позволяет своим желаниям влиять на свои убеждения. Если кто-то хочет, чтобы определенное мнение или идея были правдой, он в конечном итоге верит, что это правда. Когда дело доходит до предвзятости подтверждения, принятие желаемого за действительное становится формой мотивации.
Рассмотрим пример. Пусть компания собирается вывести на рынок новый продукт. Ранее выпуск новинок имел успех. Тогда маркетинговая стратегия может оказаться ориентированной на подтверждение успеха, а противоположные результаты окажутся проигнорированы или признаны малозначительными.
Другая ситуация — оценка качества товара или услуги с помощью отзывов клиентов, когда учитываются в основном положительные комментарии, а негативные игнорируются.
Вот некоторые примеры того, как предвзятость подтверждения может повлиять на интерпретацию данных:
Каждый бизнес имеет свои индивидуальные особенности. Поэтому разработать какие-либо универсальные подходы к тому, чтобы предотвратить предвзятость подтверждения, довольно сложно. Тем не менее выработан ряд стратегий, применение которых если не позволит избежать ее полностью, то хотя бы уменьшить связанные с ней потенциальные потери:
Внедряя эти стратегии, аналитики смогут лучше ориентироваться в ловушках предвзятости подтверждения и повысить достоверность своих выводов, основанных на данных.
Например, компания, анализирующая отзывы клиентов, может использовать триангуляцию, сравнивая результаты опросов, интервью с потребителями и анализ настроений в социальных сетях. Если все три источника указывают на проблему с продуктом, компания может быть уверена в достоверности результатов, чем если бы они полагались на один источник.
Аналогично исследователь, изучающий действие нового препарата, может использовать слепой анализ, поручив отдельной команде обрабатывать данные, не зная ожидаемых результатов, тем самым защищаясь от предвзятых интерпретаций. Эти примеры подчеркивают важность многогранного подхода к смягчению предвзятости подтверждения при анализе данных.
Другие материалы по теме:
Loginom Community Edition — аналитика, доступная каждому
Предсказание рейтингов ТВ-программ: методы машинного обучения на платформе Loginom