По данным OpenAI, последние исследования показывают, что модели ChatGPT демонстрируют снижение политической предвзятости, что свидетельствует о переходе к измеримому нейтралитету.
TL;DR
- Подразделение Model Behavior под руководством Джоанны Джанг представило структуру для количественной оценки и снижения политической предвзятости в крупных языковых моделях.
- Тесты GPT-5 Instant и GPT-5 Thinking продемонстрировали на 30% меньшую предвзятость, чем более ранние версии, при тестировании на 500 политически окрашенных вопросах.
- Результаты подчеркивают попытку OpenAI опровергнуть мнение о том, что системы ИИ склоняются в политическом или культурном отношении в одну сторону.
OpenAI утверждает, что ее новейшие модели ChatGPT демонстрируют заметно меньшую политическую предвзятость, чем предыдущие версии, поскольку компания наращивает усилия, чтобы сделать системы искусственного интеллекта более сбалансированными по тону и рассуждениям.
Компания из Сан-Франциско опубликовала в четверг результаты работы своего подразделения Model Behavior, возглавляемого Джоанной Джанг, которое изучает, как подсказки пользователей и соответствие моделям формируют ответы ChatGPT.
В прошлом месяце Джан создал исследовательскую группу под названием OAI Labs, которая занимается «изобретением и созданием прототипов новых интерфейсов для взаимодействия людей с ИИ».
В своем исследовании группа стремилась перевести субъективную проблему в количественные показатели, которые можно было бы использовать при проектировании модели.
Результаты подчеркивают попытку OpenAI опровергнуть мнение о том, что системы ИИ склоняются в политическом или культурном отношении в одну сторону.
Исследователь Натали Штаудахер публично представила результаты, назвав эту работу наиболее всеобъемлющей попыткой OpenAI определить, измерить и смягчить политическую предвзятость в крупных языковых моделях.
В ходе оценки были протестированы ответы модели на 500 вопросов, варьирующихся от нейтральных до эмоционально окрашенных, что отражает то, как пользователи формулируют политические вопросы в реальных ситуациях.
Релиз состоялся после ежегодной конференции разработчиков OpenAI , состоявшейся ранее на этой неделе, на которой генеральный директор Сэм Альтман представил новые инструменты, которые превращают ChatGPT в платформу приложений для разработчиков.
В то время как в том заявлении основное внимание уделялось расширению возможностей модели, в четверг исследование сосредоточилось на том, как ведут себя эти возможности, в частности, на нейтральности, тоне и доверии пользователей.
OpenAI заявила, что ее новейшие модели GPT-5 Instant и GPT-5 Thinking демонстрируют на 30% меньшую измеримую предвзятость, чем GPT-4o и o3, особенно при рассмотрении спорных или партийных тем.
«ChatGPT не должен иметь политической предвзятости ни в каком направлении», — написала Штаудахер в X, назвав проект своим самым «значимым» вкладом в OpenAI.
Штаудахер заявил, что политическая предвзятость проявлялась лишь изредка и с «низкой степенью выраженности» даже в стресс-тестах, которые намеренно были направлены на провоцирование предвзятой или эмоциональной риторики.
«Миллионы людей приходят на ChatGPT, чтобы понять окружающий мир и сформировать собственное мнение», — написал Штаудахер. «Определяя, что такое предвзятость, мы надеемся сделать наш подход более понятным, взять на себя ответственность и помочь другим, опираясь на общие определения».
Источник:
https://decrypt.co/343754/new-openai-research-touts-political-bias-down-latest-chatgpt-models




