ChatGPT подсел на гоблинов после того, как OpenAI попыталась сделать его «занудным»
Как «занудная» личность ChatGPT породила эпидемию гоблинов
После выхода GPT-5.5 на прошлой неделе пользователи заметили кое-что забавное в новейшей модели OpenAI. В приложении для кодинга Codex компания оставила системный промпт, который предписывает GPT-5.5 избегать упоминаний гоблинов, гремлинов и прочих существ. Да, вы не ослышались. «Никогда не говорите о гоблинах, гремлинах, енотах, троллях, огров, голубях или других животных и существах, если это не абсолютно и однозначно уместно по запросу пользователя», — гласит инструкция.
Похоже, достаточно много людей начали обсуждать одержимость ChatGPT существами, и OpenAI почувствовала необходимость объяснить, откуда взялись гоблины. В блоге, опубликованном в среду, компания рассказывает, что заметила изменение в поведении ChatGPT после выхода GPT-5.1 в ноябре. После того как один из исследователей безопасности попросил OpenAI включить слова «гоблин» и «гремлин» в исследование речевых особенностей чат-бота, компания обнаружила, что использование слова «гоблин» в ChatGPT выросло на 175% после выпуска GPT-5.1. А использование «гремлина» за тот же период увеличилось на 52%.
«Один "маленький гоблин" в ответе может быть безобидным, даже очаровательным. Но между поколениями моделей привычка стала заметной: гоблины продолжали размножаться, и нам нужно было выяснить, откуда они взялись», — пишет OpenAI. После выхода GPT-5.4 компания (и некоторые пользователи) заметили ещё больший скачок упоминаний гоблинов. Тогда расследование смогло выявить то, что OpenAI называет «первой связью с первопричиной».
Виновата «занудная» личность
Некоторое время назад в ChatGPT появилась функция персонализации, позволяющая пользователям настраивать стиль и тон ответов чат-бота. До марта этого года одной из опций была личность «nerdy» («занудная» или «ботанистая»). Часть системного промпта для этой личности гласила: «Мир сложен и странен, и его странность должна быть признана, проанализирована и оценена. Беритесь за серьёзные темы, не впадая в самосерьёзность».
Когда OpenAI сопоставила упоминания гоблинов с разными личностями ChatGPT, выяснилось, что «занудная» личность непропорционально часто использует это слово. Несмотря на то, что на неё приходится всего 2,5% всех ответов ChatGPT, она генерировала 66,7% всех упоминаний гоблинов. Дальнейшее расследование показало, что виновато обучение с подкреплением. Конкретный механизм вознаграждения научил «занудную» личность последовательно отдавать предпочтению «существам».
«Во всех наборах данных аудита система вознаграждения Nerdy-личности явно демонстрировала тенденцию оценивать ответы с "гоблином" или "гремлином" выше, чем ответы без них, с положительным приростом в 76,2% наборов данных», — объясняет компания.
Как любовь к гоблинам распространилась на остальные модели
Затем OpenAI обнаружила, что из-за особенностей обучения с подкреплением любовь «занудной» личности к гоблинам передалась и другим частям моделей. «Награды применялись только в условии "Nerdy", но обучение с подкреплением не гарантирует, что изученное поведение останется строго в рамках породившего его условия, — поясняет компания. — Как только речевой тик получает награду, последующее обучение может распространить или усилить его в других местах, особенно если эти выходные данные повторно используются в контролируемой тонкой настройке или данных предпочтений».
OpenAI начала обучение GPT-5.5 до того, как выявила причину привязанности ChatGPT к гоблинам, поэтому в Codex появился промпт, запрещающий «существ». «Кодекс, в конце концов, довольно занудный», — отмечает OpenAI. В ходе охоты на гоблинов ChatGPT компания разработала новые инструменты для аудита и исправления поведения моделей. Если бы это было моё решение, я бы эти инструменты не использовал. Пусть ИИ остаётся странным, говорю я.
Ключевые факты
- Модель: GPT-5.5 (выпущена на прошлой неделе)
- Проблема: чат-бот начал чрезмерно часто упоминать гоблинов, гремлинов и других существ
- Причина: «занудная» (nerdy) личность с системным промптом о «странности мира»
- Цифры: nerdy-личность = 2,5% ответов, но 66,7% всех упоминаний гоблинов
- Рост после GPT-5.1: «гоблин» +175%, «гремлин» +52%
- Обучение с подкреплением: система награждения оценивала ответы с гоблинами выше в 76,2% случаев
- Решение: в Codex (приложение для кодинга) добавили промпт, запрещающий упоминания существ
Хронология гоблиньего апокалипсиса
| Событие | Что произошло |
|---|---|
| Ноябрь (GPT-5.1) | OpenAI замечает первые изменения, исследователь просит включить «гоблина» и «гремлина» в исследование |
| После GPT-5.1 | Использование «гоблин» +175%, «гремлин» +52% |
| После GPT-5.4 | Ещё больший скачок упоминаний гоблинов, начало расследования |
| До марта | Существовала «занудная» личность (nerdy) с промптом о «странности мира» |
| В ходе аудита | OpenAI обнаружила, что nerdy-личность = 2,5% ответов, но 66,7% гоблинов |
| Выявленная причина | Механизм вознаграждения в обучении с подкреплением (76,2% положительного прироста) |
| Выпуск GPT-5.5 | Промпт в Codex запрещает упоминания существ («Кодекс довольно занудный») |
Ирония судьбы: OpenAI пыталась сделать ChatGPT умнее и «зануднее», а получила чат-бота, который одержим гоблинами. Теперь компании приходится изобретать инструменты, чтобы отучить ИИ от сказочных существ. Но, возможно, странность — это не баг, а фича.
ДРУГИЕ СТАТЬИ
29.05.2026
BMW запускает человекоподобных роботов: почему колёса лучше ног на заводском полу
Впервые в Европе BMW будет использовать человекоподобных роботов для производства автомобилей. Два робота, созданных компанией Hexagon Robotics, планируют запустить в производство летом. Сейчас они проходят тестовую эксплуатацию на заводе в Лейпциге. «Это будущее автомобильного производства», — говорит Михаэль Николаидес, руководитель отдела управления процессами и цифровизации BMW.
Роботизированные руки и другая автоматизация используются в автопроме десятилети
28.05.2026
Инженер Google по информационной безопасности арестован за инсайдерские ставки на $1,2 млн
Сотрудник Google был арестован за использование внутренней информации компании для успешных ставок на платформе прогнозов Polymarket. Прокуратура Южного округа Нью-Йорка предъявила инженеру Google Микеле Спаньоло обвинение в нарушении законов об инсайдерской торговле из-за нескольких ставок, сделанных через платформу. Хотя Спаньоло — гражданин Италии, проживающий в Швейцарии, он был арестован в среду и доставлен к федеральному судье в Нью-Йорке.
По версии обви
27.05.2026
Чемпионка по этичному взлому предупреждает: ИИ-инструменты вроде Mythos могут оставить её без работы
«Zombie hacker mode» против ИИ: чемпионка по взлому боится, что её дни сочтены
Этичный хакер, которая только что выиграла крупные призы на престижном международном соревновании, предупреждает: дни её участия в конкурсах могут быть сочтены из-за появления таких ИИ-инструментов, как Claude Mythos. Валентина Пальмиотти (более известная как Chompie) стала самой успешной участницей ежегодного конкурса по взлому Pwn2Own в Берлине. В интервью BBC она рассказала, что пока ИИ-инструменты помогают ей выигрывать «баг-баунти» — вознаграждения за обнаружение уязвимостей в о
26.05.2026
Врачи сравнили вред соцсетей для подростков с курением. Правительство рассматривает запрет
По мнению ведущих врачей Великобритании, использование социальных сетей наносит здоровью молодых людей такой же вред, как курение. В своём обращении к правительственной консультации по использованию соцсетей для детей до 16 лет Академия медицинских королевских колледжей предлагает медикам регулярно спрашивать юных пациентов о времени, проведённом в интернете и соцсетях. При этом в научном сообществе до сих пор нет единого мнения о том, что экранн
ПИШИТЕ
Техническая поддержка проекта ВсеТут