Новое исследование OpenAI показывает снижение политической предвзятости на 30% в последних моделях ChatGPT

По данным OpenAI, последние исследования показывают, что модели ChatGPT демонстрируют снижение политической предвзятости, что свидетельствует о переходе к измеримому нейтралитету.

TL;DR

Подразделение Model Behavior под руководством Джоанны Джанг представило структуру для количественной оценки и снижения политической предвзятости в крупных языковых моделях.
Тесты GPT-5 Instant и GPT-5 Thinking продемонстрировали на 30% меньшую предвзятость, чем более ранние версии, при тестировании на 500 политически окрашенных вопросах.
Результаты подчеркивают попытку OpenAI опровергнуть мнение о том, что системы ИИ склоняются в политическом или культурном отношении в одну сторону.

OpenAI утверждает, что ее новейшие модели ChatGPT демонстрируют заметно меньшую политическую предвзятость, чем предыдущие версии, поскольку компания наращивает усилия, чтобы сделать системы искусственного интеллекта более сбалансированными по тону и рассуждениям.

Компания из Сан-Франциско опубликовала в четверг результаты работы своего подразделения Model Behavior, возглавляемого Джоанной Джанг, которое изучает, как подсказки пользователей и соответствие моделям формируют ответы ChatGPT.

В прошлом месяце Джан создал исследовательскую группу под названием OAI Labs, которая занимается «изобретением и созданием прототипов новых интерфейсов для взаимодействия людей с ИИ».

В своем исследовании группа стремилась перевести субъективную проблему в количественные показатели, которые можно было бы использовать при проектировании модели.

Результаты подчеркивают попытку OpenAI опровергнуть мнение о том, что системы ИИ склоняются в политическом или культурном отношении в одну сторону.

Исследователь Натали Штаудахер публично представила результаты, назвав эту работу наиболее всеобъемлющей попыткой OpenAI определить, измерить и смягчить политическую предвзятость в крупных языковых моделях.

В ходе оценки были протестированы ответы модели на 500 вопросов, варьирующихся от нейтральных до эмоционально окрашенных, что отражает то, как пользователи формулируют политические вопросы в реальных ситуациях.

Релиз состоялся после ежегодной конференции разработчиков OpenAI , состоявшейся ранее на этой неделе, на которой генеральный директор Сэм Альтман представил новые инструменты, которые превращают ChatGPT в платформу приложений для разработчиков.

В то время как в том заявлении основное внимание уделялось расширению возможностей модели, в четверг исследование сосредоточилось на том, как ведут себя эти возможности, в частности, на нейтральности, тоне и доверии пользователей.

OpenAI заявила, что ее новейшие модели GPT-5 Instant и GPT-5 Thinking демонстрируют на 30% меньшую измеримую предвзятость, чем GPT-4o и o3, особенно при рассмотрении спорных или партийных тем.

«ChatGPT не должен иметь политической предвзятости ни в каком направлении», — написала Штаудахер в X, назвав проект своим самым «значимым» вкладом в OpenAI.

Штаудахер заявил, что политическая предвзятость проявлялась лишь изредка и с «низкой степенью выраженности» даже в стресс-тестах, которые намеренно были направлены на провоцирование предвзятой или эмоциональной риторики.

«Миллионы людей приходят на ChatGPT, чтобы понять окружающий мир и сформировать собственное мнение», — написал Штаудахер. «Определяя, что такое предвзятость, мы надеемся сделать наш подход более понятным, взять на себя ответственность и помочь другим, опираясь на общие определения».

Источник:
https://decrypt.co/343754/new-openai-research-touts-political-bias-down-latest-chatgpt-models

Новое исследование OpenAI показывает снижение политической предвзятости на 30% в последних моделях ChatGPT

TL;DR

Похожее

Добавить комментарийОтменить ответ

Спасибо за ответ! ✨