Операция выполнена!
Закрыть

ChatGPT подсел на гоблинов после того, как OpenAI попыталась сделать его «занудным»

04.05.2026 | IT-Сфера | ВСЕТУТ | |

Как «занудная» личность ChatGPT породила эпидемию гоблинов

После выхода GPT-5.5 на прошлой неделе пользователи заметили кое-что забавное в новейшей модели OpenAI. В приложении для кодинга Codex компания оставила системный промпт, который предписывает GPT-5.5 избегать упоминаний гоблинов, гремлинов и прочих существ. Да, вы не ослышались. «Никогда не говорите о гоблинах, гремлинах, енотах, троллях, огров, голубях или других животных и существах, если это не абсолютно и однозначно уместно по запросу пользователя», — гласит инструкция.
Похоже, достаточно много людей начали обсуждать одержимость ChatGPT существами, и OpenAI почувствовала необходимость объяснить, откуда взялись гоблины. В блоге, опубликованном в среду, компания рассказывает, что заметила изменение в поведении ChatGPT после выхода GPT-5.1 в ноябре. После того как один из исследователей безопасности попросил OpenAI включить слова «гоблин» и «гремлин» в исследование речевых особенностей чат-бота, компания обнаружила, что использование слова «гоблин» в ChatGPT выросло на 175% после выпуска GPT-5.1. А использование «гремлина» за тот же период увеличилось на 52%.
«Один "маленький гоблин" в ответе может быть безобидным, даже очаровательным. Но между поколениями моделей привычка стала заметной: гоблины продолжали размножаться, и нам нужно было выяснить, откуда они взялись», — пишет OpenAI. После выхода GPT-5.4 компания (и некоторые пользователи) заметили ещё больший скачок упоминаний гоблинов. Тогда расследование смогло выявить то, что OpenAI называет «первой связью с первопричиной».

Виновата «занудная» личность

Некоторое время назад в ChatGPT появилась функция персонализации, позволяющая пользователям настраивать стиль и тон ответов чат-бота. До марта этого года одной из опций была личность «nerdy» («занудная» или «ботанистая»). Часть системного промпта для этой личности гласила: «Мир сложен и странен, и его странность должна быть признана, проанализирована и оценена. Беритесь за серьёзные темы, не впадая в самосерьёзность».
Когда OpenAI сопоставила упоминания гоблинов с разными личностями ChatGPT, выяснилось, что «занудная» личность непропорционально часто использует это слово. Несмотря на то, что на неё приходится всего 2,5% всех ответов ChatGPT, она генерировала 66,7% всех упоминаний гоблинов. Дальнейшее расследование показало, что виновато обучение с подкреплением. Конкретный механизм вознаграждения научил «занудную» личность последовательно отдавать предпочтению «существам».
«Во всех наборах данных аудита система вознаграждения Nerdy-личности явно демонстрировала тенденцию оценивать ответы с "гоблином" или "гремлином" выше, чем ответы без них, с положительным приростом в 76,2% наборов данных», — объясняет компания.

Как любовь к гоблинам распространилась на остальные модели

Затем OpenAI обнаружила, что из-за особенностей обучения с подкреплением любовь «занудной» личности к гоблинам передалась и другим частям моделей. «Награды применялись только в условии "Nerdy", но обучение с подкреплением не гарантирует, что изученное поведение останется строго в рамках породившего его условия, — поясняет компания. — Как только речевой тик получает награду, последующее обучение может распространить или усилить его в других местах, особенно если эти выходные данные повторно используются в контролируемой тонкой настройке или данных предпочтений».
OpenAI начала обучение GPT-5.5 до того, как выявила причину привязанности ChatGPT к гоблинам, поэтому в Codex появился промпт, запрещающий «существ». «Кодекс, в конце концов, довольно занудный», — отмечает OpenAI. В ходе охоты на гоблинов ChatGPT компания разработала новые инструменты для аудита и исправления поведения моделей. Если бы это было моё решение, я бы эти инструменты не использовал. Пусть ИИ остаётся странным, говорю я.

Ключевые факты

  • Модель: GPT-5.5 (выпущена на прошлой неделе)
  • Проблема: чат-бот начал чрезмерно часто упоминать гоблинов, гремлинов и других существ
  • Причина: «занудная» (nerdy) личность с системным промптом о «странности мира»
  • Цифры: nerdy-личность = 2,5% ответов, но 66,7% всех упоминаний гоблинов
  • Рост после GPT-5.1: «гоблин» +175%, «гремлин» +52%
  • Обучение с подкреплением: система награждения оценивала ответы с гоблинами выше в 76,2% случаев
  • Решение: в Codex (приложение для кодинга) добавили промпт, запрещающий упоминания существ

Хронология гоблиньего апокалипсиса

Событие Что произошло
Ноябрь (GPT-5.1) OpenAI замечает первые изменения, исследователь просит включить «гоблина» и «гремлина» в исследование
После GPT-5.1 Использование «гоблин» +175%, «гремлин» +52%
После GPT-5.4 Ещё больший скачок упоминаний гоблинов, начало расследования
До марта Существовала «занудная» личность (nerdy) с промптом о «странности мира»
В ходе аудита OpenAI обнаружила, что nerdy-личность = 2,5% ответов, но 66,7% гоблинов
Выявленная причина Механизм вознаграждения в обучении с подкреплением (76,2% положительного прироста)
Выпуск GPT-5.5 Промпт в Codex запрещает упоминания существ («Кодекс довольно занудный»)
Ирония судьбы: OpenAI пыталась сделать ChatGPT умнее и «зануднее», а получила чат-бота, который одержим гоблинами. Теперь компании приходится изобретать инструменты, чтобы отучить ИИ от сказочных существ. Но, возможно, странность — это не баг, а фича.

ДРУГИЕ СТАТЬИ
11.06.2026
Южная Корея оштрафовала гиганта электронной коммерции Coupang на $400 млн за утечку данных миллионов клиентов Южная Корея наложила на онлайн-ритейлера Coupang рекордный штраф в размере более 400 миллионов долларов (299 миллионов фунтов стерлингов) за массовую утечку данных, в результате которой в прошлом году были раскрыты данные более 30 миллионов клиентов. Это крупнейший штраф, когда-либо выданный Комиссией по защите персональной информации Сеула (PIPC) за утечку данных. В результате инцидента стали доступны имена, контактные данные, адреса доставки
03.06.2026
Microsoft совершила прорыв в квантовых вычислениях: новый чип Majorana 2 в 1000 раз стабильнее Microsoft заявляет, что её новый квантовый чип значительно надёжнее предыдущей версии, что открывает путь к созданию квантового компьютера, способного решать коммерчески полезные задачи в течение трёх лет. В основе квантовых вычислений лежат кубиты, которые обещают решение задач, неподвластных современным машинам, но печально известны своей хрупкостью и нестабильностью. По словам Microsoft, кубиты на новом чипе Majorana 2 живут в среднем 20 секунд — в отличие от миллисе
02.06.2026
Битва ИИ-инструментов кибербезопасности: OpenAI предлагает банкам то, что заблокировал Anthropic OpenAI предложила девяти крупным британским банкам доступ к своему инструменту кибербезопасности на базе искусственного интеллекта GPT-5.5 Cyber. Это произошло в то время, как его главный конкурент Anthropic заблокировал этим же банкам доступ к превью своей версии — Claude Mythos. Оба инструмента предназначены для поиска скрытых уязвимостей в цифровых системах и могут превосходить людей в некоторых задачах, связанных с взломом и кибербезопасностью. Mythos вызвал ажиот
01.06.2026
Valve поднимает цены на Steam Deck OLED более чем на 40% — почти на £200 Компания Valve объявила о повышении цен на две модели своих портативных игровых ПК Steam Deck более чем на 40% (или почти на 200 фунтов), сославшись на «рост стоимости памяти и накопителей». 512-гигабайтная версия OLED-модели (более новая версия с улучшенным дисплеем) теперь будет стоить $789 (£649, €779) — повышение на 43% или £170. Более крупная модель на 1 ТБ будет стоить $949 (£779, €919) — повышение на 46% или £210. В своём блоге компания заявила, что сам Steam Deck не изменился, а изменение цен отражает «текущее состоя
ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro