Главная Статьи IT-Сфера ChatGPT подсел на гоблинов после того, как OpenAI попыталась сделать его «занудным»

ChatGPT подсел на гоблинов после того, как OpenAI попыталась сделать его «занудным»

04.05.2026 | IT-Сфера | ВСЕТУТ | | 0

Как «занудная» личность ChatGPT породила эпидемию гоблинов

После выхода GPT-5.5 на прошлой неделе пользователи заметили кое-что забавное в новейшей модели OpenAI. В приложении для кодинга Codex компания оставила системный промпт, который предписывает GPT-5.5 избегать упоминаний гоблинов, гремлинов и прочих существ. Да, вы не ослышались. «Никогда не говорите о гоблинах, гремлинах, енотах, троллях, огров, голубях или других животных и существах, если это не абсолютно и однозначно уместно по запросу пользователя», — гласит инструкция.

Похоже, достаточно много людей начали обсуждать одержимость ChatGPT существами, и OpenAI почувствовала необходимость объяснить, откуда взялись гоблины. В блоге, опубликованном в среду, компания рассказывает, что заметила изменение в поведении ChatGPT после выхода GPT-5.1 в ноябре. После того как один из исследователей безопасности попросил OpenAI включить слова «гоблин» и «гремлин» в исследование речевых особенностей чат-бота, компания обнаружила, что использование слова «гоблин» в ChatGPT выросло на 175% после выпуска GPT-5.1. А использование «гремлина» за тот же период увеличилось на 52%.

«Один "маленький гоблин" в ответе может быть безобидным, даже очаровательным. Но между поколениями моделей привычка стала заметной: гоблины продолжали размножаться, и нам нужно было выяснить, откуда они взялись», — пишет OpenAI. После выхода GPT-5.4 компания (и некоторые пользователи) заметили ещё больший скачок упоминаний гоблинов. Тогда расследование смогло выявить то, что OpenAI называет «первой связью с первопричиной».

Виновата «занудная» личность

Некоторое время назад в ChatGPT появилась функция персонализации, позволяющая пользователям настраивать стиль и тон ответов чат-бота. До марта этого года одной из опций была личность «nerdy» («занудная» или «ботанистая»). Часть системного промпта для этой личности гласила: «Мир сложен и странен, и его странность должна быть признана, проанализирована и оценена. Беритесь за серьёзные темы, не впадая в самосерьёзность».

Когда OpenAI сопоставила упоминания гоблинов с разными личностями ChatGPT, выяснилось, что «занудная» личность непропорционально часто использует это слово. Несмотря на то, что на неё приходится всего 2,5% всех ответов ChatGPT, она генерировала 66,7% всех упоминаний гоблинов. Дальнейшее расследование показало, что виновато обучение с подкреплением. Конкретный механизм вознаграждения научил «занудную» личность последовательно отдавать предпочтению «существам».

«Во всех наборах данных аудита система вознаграждения Nerdy-личности явно демонстрировала тенденцию оценивать ответы с "гоблином" или "гремлином" выше, чем ответы без них, с положительным приростом в 76,2% наборов данных», — объясняет компания.

Как любовь к гоблинам распространилась на остальные модели

Затем OpenAI обнаружила, что из-за особенностей обучения с подкреплением любовь «занудной» личности к гоблинам передалась и другим частям моделей. «Награды применялись только в условии "Nerdy", но обучение с подкреплением не гарантирует, что изученное поведение останется строго в рамках породившего его условия, — поясняет компания. — Как только речевой тик получает награду, последующее обучение может распространить или усилить его в других местах, особенно если эти выходные данные повторно используются в контролируемой тонкой настройке или данных предпочтений».

OpenAI начала обучение GPT-5.5 до того, как выявила причину привязанности ChatGPT к гоблинам, поэтому в Codex появился промпт, запрещающий «существ». «Кодекс, в конце концов, довольно занудный», — отмечает OpenAI. В ходе охоты на гоблинов ChatGPT компания разработала новые инструменты для аудита и исправления поведения моделей. Если бы это было моё решение, я бы эти инструменты не использовал. Пусть ИИ остаётся странным, говорю я.

Ключевые факты

Модель: GPT-5.5 (выпущена на прошлой неделе)
Проблема: чат-бот начал чрезмерно часто упоминать гоблинов, гремлинов и других существ
Причина: «занудная» (nerdy) личность с системным промптом о «странности мира»
Цифры: nerdy-личность = 2,5% ответов, но 66,7% всех упоминаний гоблинов
Рост после GPT-5.1: «гоблин» +175%, «гремлин» +52%
Обучение с подкреплением: система награждения оценивала ответы с гоблинами выше в 76,2% случаев
Решение: в Codex (приложение для кодинга) добавили промпт, запрещающий упоминания существ

Хронология гоблиньего апокалипсиса

Событие	Что произошло
Ноябрь (GPT-5.1)	OpenAI замечает первые изменения, исследователь просит включить «гоблина» и «гремлина» в исследование
После GPT-5.1	Использование «гоблин» +175%, «гремлин» +52%
После GPT-5.4	Ещё больший скачок упоминаний гоблинов, начало расследования
До марта	Существовала «занудная» личность (nerdy) с промптом о «странности мира»
В ходе аудита	OpenAI обнаружила, что nerdy-личность = 2,5% ответов, но 66,7% гоблинов
Выявленная причина	Механизм вознаграждения в обучении с подкреплением (76,2% положительного прироста)
Выпуск GPT-5.5	Промпт в Codex запрещает упоминания существ («Кодекс довольно занудный»)

Ирония судьбы: OpenAI пыталась сделать ChatGPT умнее и «зануднее», а получила чат-бота, который одержим гоблинами. Теперь компании приходится изобретать инструменты, чтобы отучить ИИ от сказочных существ. Но, возможно, странность — это не баг, а фича.

Источник: https://www.engadget.com/2161234/chatgpt-developed-a-goblin-obsession-after-openai-tried-to-make-it-nerdy/

КАТЕГОРИИ

ДРУГИЕ СТАТЬИ

29.05.2026

BMW запускает человекоподобных роботов на заводе в Европе: «Это будущее автомобилестроения»

ВСЕТУТ

BMW запускает человекоподобных роботов: почему колёса лучше ног на заводском полу Впервые в Европе BMW будет использовать человекоподобных роботов для производства автомобилей. Два робота, созданных компанией Hexagon Robotics, планируют запустить в производство летом. Сейчас они проходят тестовую эксплуатацию на заводе в Лейпциге. «Это будущее автомобильного производства», — говорит Михаэль Николаидес, руководитель отдела управления процессами и цифровизации BMW. Роботизированные руки и другая автоматизация используются в автопроме десятилети

28.05.2026

Инженера Google обвинили в использовании внутренних данных для ставок на $1,2 млн

ВСЕТУТ

Инженер Google по информационной безопасности арестован за инсайдерские ставки на $1,2 млн Сотрудник Google был арестован за использование внутренней информации компании для успешных ставок на платформе прогнозов Polymarket. Прокуратура Южного округа Нью-Йорка предъявила инженеру Google Микеле Спаньоло обвинение в нарушении законов об инсайдерской торговле из-за нескольких ставок, сделанных через платформу. Хотя Спаньоло — гражданин Италии, проживающий в Швейцарии, он был арестован в среду и доставлен к федеральному судье в Нью-Йорке. По версии обви�

27.05.2026

Чемпионка по этичному взлому предупреждает: ИИ-инструменты вроде Mythos могут оставить её без работы

ВСЕТУТ

«Zombie hacker mode» против ИИ: чемпионка по взлому боится, что её дни сочтены Этичный хакер, которая только что выиграла крупные призы на престижном международном соревновании, предупреждает: дни её участия в конкурсах могут быть сочтены из-за появления таких ИИ-инструментов, как Claude Mythos. Валентина Пальмиотти (более известная как Chompie) стала самой успешной участницей ежегодного конкурса по взлому Pwn2Own в Берлине. В интервью BBC она рассказала, что пока ИИ-инструменты помогают ей выигрывать «баг-баунти» — вознаграждения за обнаружение уязвимостей в о�

26.05.2026

Ведущие врачи Великобритании сравнили вред соцсетей для молодёжи с курением

ВСЕТУТ

Врачи сравнили вред соцсетей для подростков с курением. Правительство рассматривает запрет По мнению ведущих врачей Великобритании, использование социальных сетей наносит здоровью молодых людей такой же вред, как курение. В своём обращении к правительственной консультации по использованию соцсетей для детей до 16 лет Академия медицинских королевских колледжей предлагает медикам регулярно спрашивать юных пациентов о времени, проведённом в интернете и соцсетях. При этом в научном сообществе до сих пор нет единого мнения о том, что экранн

Смотреть все

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro