
Сегодняшние языковые модели, такие как ChatGPT и Gemini, умеют вести беседу с поразительной беглостью — почти как человек. Но внутренние механизмы, обеспечивающие эту беглость, по-прежнему остаются во многом загадкой. Новое исследование проливает свет на то, как нейросети учатся понимать язык — и обнаруживает в этом процессе неожиданный скачок, схожий с фазовым переходом в физике.
Учёные рассмотрели упрощённую модель ключевого элемента современных языковых моделей — механизма внимания, лежащего в основе архитектуры трансформеров. Эти модели анализируют текст как последовательность символов и слов, оценивая важность каждого слова относительно других. Именно трансформеры используются в большинстве популярных ИИ — от ChatGPT до Gemini.

Оказалось, что на ранних этапах обучения нейросеть выстраивает понимание предложений на основе положения слов. Например, в английском языке порядок «подлежащее — глагол — дополнение» часто сохраняется, и нейросеть это улавливает. Но по мере накопления обучающих данных модель неожиданно меняет стратегию: она начинает опираться на смысл слов, а не их порядок.
Это переключение происходит резко и без промежуточных состояний. Исследователи описывают его как фазовый переход — в духе того, как вода при определённой температуре мгновенно превращается в пар. Ниже критического объёма данных модель полагается только на позиции, выше — исключительно на значение слов.
«Мы хотели просто изучить, какие стратегии выбирает сеть, — рассказывает Хуго Цуй, постдок из Гарварда и главный автор статьи. — Но результат оказался неожиданным: модель в один момент полностью отказывается от одной стратегии и переходит к другой».
Подобные резкие переходы хорошо известны в статистической физике, где сложные системы из миллионов частиц описываются коллективным поведением. Нейросеть — тоже система из множества взаимосвязанных узлов (нейронов), чьё «интеллектуальное» поведение возникает из взаимодействия этих элементарных компонентов. Поэтому, считают авторы, подходы из физики можно применить и к пониманию работы ИИ.
Понимание того, при каких условиях модель «переключается» между стратегиями, может в будущем помочь сделать нейросети более предсказуемыми, эффективными и безопасными.
-
15.07.2025 12:25:00 | iXBT.com
15.07.2025 11:52:00 | iXBT.com
15.07.2025 11:44:00 | iXBT.com
15.07.2025 11:40:00 | iXBT.com
15.07.2025 11:28:00 | iXBT.com
15.07.2025 11:19:00 | iXBT.com
15.07.2025 11:04:00 | iXBT.com
15.07.2025 10:54:00 | iXBT.com
15.07.2025 10:41:00 | iXBT.com
15.07.2025 10:34:00 | iXBT.com
15.07.2025 10:24:00 | iXBT.com
15.07.2025 10:01:00 | iXBT.com
15.07.2025 09:55:00 | iXBT.com
15.07.2025 09:49:09 | TechCult.ru
15.07.2025 09:44:00 | iXBT.com
15.07.2025 09:43:00 | iXBT.com
15.07.2025 08:56:00 | iXBT.com
15.07.2025 08:51:00 | iXBT.com
15.07.2025 08:03:00 | iXBT.com
15.07.2025 07:27:00 | iXBT.com
15.07.2025 07:01:00 | iXBT.com
15.07.2025 06:46:00 | iXBT.com
15.07.2025 06:37:00 | iXBT.com
15.07.2025 06:11:00 | iXBT.com
15.07.2025 06:02:00 | iXBT.com
15.07.2025 05:50:00 | iXBT.com
15.07.2025 05:43:00 | iXBT.com
-
16.07.2025 21:57:04 | ferra.ru
16.07.2025 21:00:00 | ferra.ru
16.07.2025 20:15:00 | ferra.ru
16.07.2025 20:09:58 | it-world
16.07.2025 19:30:00 | ferra.ru
16.07.2025 19:00:30 | Хабр
16.07.2025 18:06:21 | Хабр
16.07.2025 18:00:24 | ferra.ru
16.07.2025 18:00:00 | Woman.ru
16.07.2025 17:45:06 | КИНО-ТЕАТР.РУ
16.07.2025 17:30:05 | КИНО-ТЕАТР.РУ
16.07.2025 17:22:22 | ferra.ru
16.07.2025 17:00:05 | КИНО-ТЕАТР.РУ
Техническая поддержка проекта ВсеТут