
Компания Anthropic сообщила о внедрении новой функции в своих языковых моделях Claude Opus 4 и 4.1, призванной пресекать «некорректные» беседы. Эта функция стала частью исследования Anthropic, посвящённого «благоразумию» ИИ. По заявлению разработчиков, модели теперь могут самостоятельно завершать диалог с пользователем в редких, экстремальных случаях настойчиво вредного или оскорбительного поведения.
Речь идёт о ситуациях, когда пользователь запрашивает контент сексуального характера с участием несовершеннолетних, пытается получить информацию, которая может быть использована для организации крупномасштабного насилия или террористических актов. Прерывание диалога – это крайняя мера, применяемая только после многократных попыток перенаправить диалог в конструктивное русло. Anthropic подчёркивает, что большинство пользователей не столкнутся с этим ограничением, даже при обсуждении спорных тем.

Если разговор прерывается моделью, то пользователь теряет возможность отправлять новые сообщения в этом конкретном чате, однако может начать новый диалог. При этом завершение одного диалога никак не влияет на другие, а пользователи могут вернуться к прерванному чату и отредактировать предыдущие сообщения, попытавшись изменить направление беседы.
Хотя антропоморфизация ИИ-моделей остаётся предметом дискуссий, компания считает, что возможность прерывать потенциально травмирующие взаимодействия — это недорогой способ управления рисками. Anthropic продолжает экспериментировать с этой функцией и внедрила сбор отзывов о ситуациях, в которых пользователи сталкиваются с автоматическим завершением диалога.
-
18.08.2025 12:07:00 | iXBT.com
18.08.2025 11:58:00 | iXBT.com
18.08.2025 11:56:16 | Ведомости
18.08.2025 11:53:00 | iXBT.com
18.08.2025 11:47:00 | iXBT.com
18.08.2025 11:33:00 | iXBT.com
18.08.2025 11:17:08 | Ведомости
18.08.2025 10:59:00 | iXBT.com
18.08.2025 10:55:50 | TechCult.ru
18.08.2025 10:50:00 | iXBT.com
18.08.2025 10:38:00 | iXBT.com
18.08.2025 10:18:00 | iXBT.com
18.08.2025 10:11:00 | iXBT.com
18.08.2025 09:54:00 | iXBT.com
17.08.2025 23:39:00 | iXBT.com
17.08.2025 23:29:00 | iXBT.com
17.08.2025 23:19:00 | iXBT.com
17.08.2025 22:48:00 | iXBT.com
17.08.2025 22:03:00 | iXBT.com
17.08.2025 21:52:00 | iXBT.com
17.08.2025 21:51:00 | iXBT.com
17.08.2025 21:40:00 | iXBT.com
17.08.2025 21:18:00 | iXBT.com
17.08.2025 21:02:00 | iXBT.com
17.08.2025 20:50:00 | iXBT.com
17.08.2025 20:46:00 | iXBT.com
17.08.2025 20:39:00 | iXBT.com
17.08.2025 20:31:00 | iXBT.com
-
18.08.2025 15:34:54 | it-world
18.08.2025 15:15:36 | vc.ru
18.08.2025 15:15:00 | vc.ru
18.08.2025 15:00:27 | ferra.ru
18.08.2025 14:15:26 | ferra.ru
18.08.2025 13:54:47 | it-world
18.08.2025 13:30:24 | ferra.ru
18.08.2025 12:45:23 | ferra.ru
18.08.2025 12:44:50 | КИНО-ТЕАТР.РУ
18.08.2025 12:13:31 | Хабр
18.08.2025 12:00:22 | ferra.ru
18.08.2025 12:00:16 | Хабр
18.08.2025 12:00:00 | ГАСТРОНОМЪ
18.08.2025 12:00:00 | Woman.ru
18.08.2025 11:58:56 | Хабр
18.08.2025 11:51:50 | Хабр
Техническая поддержка проекта ВсеТут