Перед лицом потенциала анализа текста и языка искусственного интеллекта, как должен развиваться анализ настроений?
Недавний бум больших языковых моделей (LLM) открыл множество возможностей для анализа текстовых и языковых данных. Это идеальное время, чтобы вернуться к одному измерению, основанному на языке, которое укоренилось в современных исследованиях рынка, — настроению.
Анализ настроений использовался с помощью множества методов, включая опросы, социальное прослушивание и квалификацию, и традиционно включает в себя классификацию документов как положительные, отрицательные или нейтральные. Тем не менее, если бы мы исследовали, как эта информация используется на практике, был бы этот уровень анализа действительно проницательным? Когда в последний раз вы могли принимать бизнес-решения, зная, что X% сообщений положительные? Действительно ли эта информация помогает выстраивать стратегии каким-либо значимым образом?
Есть несколько основных проблем с этим историческим способом рассмотрения настроений. Во-первых, бинарная категоризация на самом деле не связана с нюансами языка. Рассмотрим фразы «Мне нравится бренд X» и «Я люблю бренд X». Оба они могут быть классифицированы как положительные, но очевидно, что один из них имеет больший эмоциональный вес, чем другой. Бинарная категоризация чрезмерно упрощает языковые данные и упускает много полезных различий.
Во-вторых, положительные и отрицательные конструкты легко измерить, но они редко связаны с тем, чего пытаются достичь компании или маркетинговые команды. Довольно часто целью брендов является создание восприятия вокруг воронки конверсии (осведомленность и внимание) или более глубоких эмоциональных понятий, таких как любовь, доверие или удовлетворение. Хотя чувства могут быть полезны как составная часть этих конструкций, очевидно, что их самих по себе недостаточно.
Что мы можем сделать как практики, чтобы превратить анализ настроений во что-то более эффективное? Чтобы решить первую основную проблему, мы могли бы попробовать рассматривать настроения как шкалу, а не как бинарную категоризацию. Существуют различные модели с открытым исходным кодом, которые нацелены на масштабирование настроений (например, от +1 до -1, где +1 означает полностью положительное, 0 означает действительно нейтральное, а -1 полностью отрицательное). Этот подход улавливает больше нюансов, а также обеспечивает более мощную аналитику.
Чтобы решить вторую проблему, мы можем сосредоточиться на измерении того, что имеет значение, вместо того, чтобы пытаться использовать чувства в качестве суррогата. Если вас интересует любовь к бренду, создайте для нее измерение. LLM и машинное обучение в целом облегчают эту задачу при низких затратах, и вы получите шкалу, которая действительно связана с мыслительным процессом бизнеса, что сразу же окажет большее влияние.
Существует также золотая середина между этими двумя подходами, которая включает в себя самозагрузку измерения тональности для других показателей или между источниками данных. Например, если вы измеряете сентиментальность по отношению к бренду или продукту в опросе, начните делать то же самое в социальных сетях и начните формальную количественную оценку отношений между ними.
Или, если у вас уже есть одно надежное измерение ключевого бизнес-индикатора, такого как Любовь или Удовлетворение, добавьте к нему настроение, чтобы попытаться понять, как они связаны и действительно ли настроение влияет на то, что важно для бизнеса. Чем больше источников и метрик мы добавляем к нашему анализу, тем более всеобъемлющим становится наш взгляд на мир.
В конечном счете, с начала 2023 года наша способность обрабатывать и анализировать текстовые данные коренным образом изменилась. Но это не означает, что мы выпиваем Kool-Aid и спешим интегрировать LLM в наши рабочие потоки без должной осмотрительности. Это означает, что, во-первых, мы должны сделать это сами, поскольку исследователи тщательно изучают методы, которые мы использовали до сих пор, и меняют наше представление о них, чтобы двигаться вперед и максимально использовать захватывающие новые возможности.
Помимо этого, это также означает, что мы сохраняем ценность человеческого контекста. У вас может быть лучшая модель в мире, но если вы не можете сформулировать, почему важны ее результаты, она не сможет полностью раскрыть свой потенциал. Будь то традиционные или современные подходы, нам необходимо инвестировать в человеческий слой, который устраняет разрыв между технологиями и смыслом.
Майк Тэпп, директор по данным в Capture Intelligence
Источник:
https://www.research-live.com/article/news/overly-positive-rethinking-sentiment-analysis/id/5115273