
Сегодняшние языковые модели, такие как ChatGPT и Gemini, умеют вести беседу с поразительной беглостью — почти как человек. Но внутренние механизмы, обеспечивающие эту беглость, по-прежнему остаются во многом загадкой. Новое исследование проливает свет на то, как нейросети учатся понимать язык — и обнаруживает в этом процессе неожиданный скачок, схожий с фазовым переходом в физике.
Учёные рассмотрели упрощённую модель ключевого элемента современных языковых моделей — механизма внимания, лежащего в основе архитектуры трансформеров. Эти модели анализируют текст как последовательность символов и слов, оценивая важность каждого слова относительно других. Именно трансформеры используются в большинстве популярных ИИ — от ChatGPT до Gemini.

Оказалось, что на ранних этапах обучения нейросеть выстраивает понимание предложений на основе положения слов. Например, в английском языке порядок «подлежащее — глагол — дополнение» часто сохраняется, и нейросеть это улавливает. Но по мере накопления обучающих данных модель неожиданно меняет стратегию: она начинает опираться на смысл слов, а не их порядок.
Это переключение происходит резко и без промежуточных состояний. Исследователи описывают его как фазовый переход — в духе того, как вода при определённой температуре мгновенно превращается в пар. Ниже критического объёма данных модель полагается только на позиции, выше — исключительно на значение слов.
«Мы хотели просто изучить, какие стратегии выбирает сеть, — рассказывает Хуго Цуй, постдок из Гарварда и главный автор статьи. — Но результат оказался неожиданным: модель в один момент полностью отказывается от одной стратегии и переходит к другой».
Подобные резкие переходы хорошо известны в статистической физике, где сложные системы из миллионов частиц описываются коллективным поведением. Нейросеть — тоже система из множества взаимосвязанных узлов (нейронов), чьё «интеллектуальное» поведение возникает из взаимодействия этих элементарных компонентов. Поэтому, считают авторы, подходы из физики можно применить и к пониманию работы ИИ.
Понимание того, при каких условиях модель «переключается» между стратегиями, может в будущем помочь сделать нейросети более предсказуемыми, эффективными и безопасными.
-
15.07.2025 12:25:00 | iXBT.com
15.07.2025 11:52:00 | iXBT.com
15.07.2025 11:44:00 | iXBT.com
15.07.2025 11:40:00 | iXBT.com
15.07.2025 11:28:00 | iXBT.com
15.07.2025 11:19:00 | iXBT.com
15.07.2025 11:04:00 | iXBT.com
15.07.2025 10:54:00 | iXBT.com
15.07.2025 10:41:00 | iXBT.com
15.07.2025 10:34:00 | iXBT.com
15.07.2025 10:24:00 | iXBT.com
15.07.2025 10:01:00 | iXBT.com
15.07.2025 09:55:00 | iXBT.com
15.07.2025 09:49:09 | TechCult.ru
15.07.2025 09:44:00 | iXBT.com
15.07.2025 09:43:00 | iXBT.com
15.07.2025 08:56:00 | iXBT.com
15.07.2025 08:51:00 | iXBT.com
15.07.2025 08:03:00 | iXBT.com
15.07.2025 07:27:00 | iXBT.com
15.07.2025 07:01:00 | iXBT.com
15.07.2025 06:46:00 | iXBT.com
15.07.2025 06:37:00 | iXBT.com
15.07.2025 06:11:00 | iXBT.com
15.07.2025 06:02:00 | iXBT.com
15.07.2025 05:50:00 | iXBT.com
15.07.2025 05:43:00 | iXBT.com
-
14.10.2025 07:57:55 | ferra.ru
14.10.2025 07:50:54 | ferra.ru
14.10.2025 07:43:53 | ferra.ru
14.10.2025 07:36:52 | ferra.ru
14.10.2025 07:29:52 | ferra.ru
14.10.2025 07:15:51 | ferra.ru
14.10.2025 07:08:51 | ferra.ru
14.10.2025 07:01:50 | ferra.ru
14.10.2025 06:10:01 | StopGame
14.10.2025 04:51:04 | Хабр
14.10.2025 04:03:54 | Хабр
14.10.2025 02:45:00 | Woman.ru
14.10.2025 00:24:39 | Хабр
13.10.2025 23:49:08 | ferra.ru
13.10.2025 23:15:56 | ferra.ru
13.10.2025 23:15:37 | ferra.ru
13.10.2025 23:15:13 | Woman.ru
13.10.2025 23:00:42 | КИНО-ТЕАТР.РУ
Техническая поддержка проекта ВсеТут