web analytics

Предварительный обзор 2026 года: Синтетические данные

Sztuczna Inteligencja (ИИ/AI)

Синтетические данные стали одним из самых значительных новых трендов последних двух лет. Наши авторы прогнозируют развитие синтетических данных в течение следующего года.

Хасдип Сети, руководитель группы ИИ и директор по анализу данных, Strat7:
Мы увидим больший эффект от инструментов для создания синтетических диалогов, чем от количественных опросов. Клиенты уже работают с нами над чат-ботами и синтетическими персонами, но они по-прежнему основаны на первичных исследованиях — они не являются заменой. Количественные исследования сложнее, потому что опросы фиксируют сложное поведение по нескольким параметрам. Для правильного воспроизведения этого потребуется больше времени.

Думаю, в 2026 году мы увидим улучшения, но я был бы удивлен, если бы к декабрю мы уже одобряли использование синтетических алгоритмов повышения точности во всей работе с клиентами. Наибольший потенциал заключается в потребительских, менее рискованных категориях (например, тестирование концепций), где точность уже высока. Но в высокорегулируемых или технических секторах по-прежнему необходимы исследования, проводимые исключительно людьми.

Сабина Кроник, генеральный директор 2CV
2025 в Великобритании/ЕС, проявила некоторую осторожность в этой области, но я думаю, что со временем мы будем видеть и слышать об этом все больше. Учитывая низкую посещаемость аудитории, проблемы с качеством выборки и значительное бюджетное давление по всему миру, неизбежно, что некоторые клиенты будут пробовать синтетические данные, чтобы проверить, достаточно ли они хороши. Лично я по-прежнему придерживаюсь подхода «человеческий голос — лучший вариант» и выступаю за меньшую по качеству выборку, а не за большие «нормализованные» данные, но я признаю, что для тех, чьи голоса недостаточно представлены, это может сыграть свою роль.

Александра Кузьмина, директор по инновациям, MMR Research:
Синтетические данные и целевые аудитории, безусловно, произведут фурор в 2026 году. Привлекательность очевидна: скорость, экономия средств и возможность моделирования этих труднодоступных потребительских сегментов.

Однако с точки зрения исследования пользовательского опыта синтетические данные — это не панацея. Да, они могут помочь нам расширить и обогатить наши наборы данных, но на самом деле не повышают статистическую достоверность, а лишь создают видимость этого. Реальная разница будет зависеть от того, насколько тщательно эти инструменты будут проверены и использованы. Синтетические аудитории могут быть отличным инструментом для раннего формирования идей, но для реального прогресса по-прежнему необходимы надежные, репрезентативные исследования и экспертная оценка.

Сабина Сторк, старший партнер Thinktank Research:
Меня завораживают синтетические данные – они обладают огромным потенциалом не только с точки зрения экономии бюджета, но и с точки зрения творческого потенциала исследователей. В то же время, существует огромный потенциал ввести в заблуждение – ИИ склонен к некоторой поверхностности, а синтетические ответы могут быть чрезмерно аккуратными, следуя логическим парадигмам, которые могут показаться привлекательными на первый взгляд, но которые не отражают сложную жизнь и образ мышления реальных людей.   

Сьюзи Хассан, управляющий директор и соучредитель Potentia: «
На основе проведенных Potentia испытаний, в которых сравнивались реальные и синтетические данные, мы обнаружили, что данные настолько сильно отличались, что на тот момент они не соответствовали поставленным задачам. Поэтому, исходя из наших выводов, существует вероятность повышения уровня контроля за синтетическими данными и аудиториями».

Однако, поскольку технологии быстро развиваются, они станут более надежными, что откроет явную возможность для использования синтетических данных для продвижения нишевых целей и достижения большего с меньшими затратами. Базовые данные из реального мира всегда будут ценны для поддержки этих синтетических моделей.

Джейн Фрост, генеральный директор MRS:
Синтетические данные, безусловно, имеют свои преимущества и открывают захватывающие возможности для сектора. Однако важно помнить, что синтетические респонденты не существуют изолированно; их создание стало возможным только благодаря высококачественным исследованиям в реальных условиях, на которых они основаны. Другими словами, вы можете использовать ИИ для прогнозирования мнения определенной группы по той или иной теме только потому, что кто-то уже задавал им подобный вопрос в реальной жизни.

По мере расширения использования данных в сфере искусственного интеллекта спрос на регулярно обновляемые высококачественные данные, необходимые для работы моделей ИИ, будет только расти – именно поэтому в прошлом году мы запустили Кампанию за лучшие данные, которую, как мы видим, активно поддерживает отрасль.

Келли Бивер, генеральный директор Ipsos в Великобритании и Ирландии: «
Синтетические данные обладают потенциалом стать весьма мощным инструментом в отрасли, позволяя масштабировать исследования по более доступным ценам для наших клиентов, но их эффективность зависит от качества используемых данных. Поэтому необходимо проявлять осторожность при их применении, чтобы избежать воспроизведения искажений или предвзятости, которые часто возникают из-за небольших или недостаточно надежных исходных выборок».

Мари Риджли, генеральный директор подразделения аналитики Kantar в Великобритании:
«При правильном подходе синтетические данные могут решить одну из самых сложных задач в этом секторе: охватить труднодоступные группы населения. Они позволяют масштабировать небольшие выборки в лонгитюдных исследованиях и открывают двери для недостаточно представленных сообществ». 

Чтобы эффективно использовать эти данные, нам необходимо уделить особое внимание стандартам. Синтетические аудитории и модели ИИ должны строиться на качественных, собственных данных. Мы сотрудничаем с MRS в рамках кампании «За лучшие данные», чтобы стандарты оставались в центре внимания, но весь сектор должен объединиться. Если мы позволим фундаментальным принципам ослабить контроль, мы рискуем не только упустить возможность, но и подорвать доверие и влияние нашей работы.

Фредерик-Шарль Пети, генеральный директор Toluna:
«Это самый масштабный сдвиг в исследованиях, обеспечивающий беспрецедентную скорость, качество и масштаб».

Бабита Эрл, международный управляющий директор Zappi: «
Использование синтетических данных будет расти, особенно для команд, испытывающих давление в связи с необходимостью сокращения затрат. Но это не панацея. Синтетические респонденты могут помочь подтвердить предположения, но их эффективность зависит от качества и актуальности используемых данных. Каждая идея, которую вы тестируете с помощью синтетических данных, проверяется на примере потребителя вчерашнего дня».

В нашей отрасли нельзя упускать из виду главное: принятие решений должно основываться на высококачественных данных о потребителях. Со временем мы найдем подходящую роль для синтетических данных, но они должны дополнять, а не заменять реальное понимание потребителей.

Уилл Ульштейн, генеральный директор YouGov в Великобритании:
В отрасли до сих пор существует глубокий скептицизм в отношении синтетических данных. Их неспособность отражать реальные изменения делает их плохой заменой высококачественным исследованиям, а недавние исследования показывают, что результаты часто не обладают необходимой согласованностью для принятия уверенных решений.

Вместо того чтобы стимулировать инновации, учитывающие вопросы конфиденциальности, или расширять доступ, существующие приложения рискуют дать вводящие в заблуждение результаты. Со временем синтетические данные могут сыграть вспомогательную роль, но для надежных и значимых исследований золотым стандартом остаются данные, основанные на реальных ответах реальных людей.

Аманда Робертс, специалист по качественным исследованиям, потребительской стратегии, Sky:
Я думаю, что все больше компаний начнут использовать синтетические данные/аудитории для имитации труднодоступных групп. Но я не думаю, что им обязательно следует это делать…

Для нас действительно важно, чтобы в наших исследованиях были представлены интересы этих людей, но я опасаюсь, что мы предпочтем более низкие затраты и большее удобство предвзятым результатам, лишенным глубины, нюансов и учета личного опыта.

Кристофер Барнс, президент Escalent:
Использование универсальных синтетических данных достигнет пика, а затем быстро сократится. Мощные, специализированные решения на основе ИИ, включающие синтетические данные, дадут исследователям на стороне клиента больше влияния в организациях, поскольку они обеспечат скорость и объем данных для нужных групп населения нужным способом.

Дэниел Сингхам, коммерческий директор Yonder Data Solutions:
Отрасль все еще находится на экспериментальной стадии использования синтетических данных, признавая их потенциал для ускорения сроков реализации проектов, снижения затрат и более точной сегментации. Однако обеспечение высоких стандартов качества и точности данных имеет важное значение для успешного внедрения.

По мере приближения 2026 года я ожидаю значительного развития синтетических данных и целевых аудиторий, а также формирования более четкого понимания и передовых методов их использования в отрасли.

Матильда Андерссон, управляющий директор Truth Consulting:
Я надеюсь, что [синтетические данные] будут использоваться больше на этапе внедрения – для тестирования, изучения и проверки идей под давлением – а не в качестве замены реального понимания людей или процесса принятия решений.

Ник Уайт, руководитель отдела стратегических исследований, Attest:
Нам необходимо отделить синтетические портреты пользователей от синтетических панелей. Синтетические портреты пользователей окажут большее влияние в краткосрочной перспективе, поскольку станут быстрой и ранней площадкой для тестирования креативных, концептуальных и стратегических идей. Они ускорят принятие решений и высвободят бюджеты для более ценных проектов, таких как сегментация, оценка размера рынка и конджойнт-анализ.

Синтетические панели по-прежнему будут находиться в режиме тестирования и обучения, переходя от общих, усредненных результатов к большей тонкости и реализму. 2026 год будет посвящен совершенствованию этих моделей, прежде чем они станут основными инструментами принятия решений.

Рэй Пойнтер, управляющий директор The Future Place и соучредитель ResearchWiseAI: «
В течение года оно будет стабильно расти; оно ничего не вытеснит, но будет развиваться».

Джеймс Эндерсби, генеральный директор Opinium.
Прежде чем синтетические данные смогут изменить отрасль, с ними нужно обращаться осторожно. Строгие этические нормы, прозрачность и проверка на основе реальных показателей являются обязательными. Они никогда не должны заменять свежие, непредвзятые первичные исследования; это инструмент для ранних этапов изучения, а не для принятия окончательных решений.

При ответственном использовании он может ускорить инновации, восполнить пробелы в недостаточно представленных демографических группах и защитить конфиденциальность. При правильном применении он является мощным дополнением к традиционным исследованиям, обеспечивая скорость и инклюзивность без ущерба для целостности.

Источник:
https://www.research-live.com/article/features/preview-of-2026-synthetic-data/id/5145656

Оцените статью
( Пока оценок нет )

Добавить комментарий