В многоагентных системах, где несколько агентов на базе искусственного интеллекта взаимодействуют в одной среде, часто возникает конкуренция между целями отдельных участников. Это приводит к ситуации, когда каждый агент стремится максимизировать собственную выгоду, что в итоге мешает достижению общего результата. Проблема особенно актуальна для децентрализованных систем, где у каждого агента есть только локальная информация.
Команда Paradigms of Intelligence из Google предложила альтернативу традиционным жёстким алгоритмам координации. Вместо ручного задания правил взаимодействия учёные обучили агентов с помощью метода Predictive Policy Improvement (PPI) в среде с разнообразным пулом противников — как обучающихся, так и статических моделей. Такой подход вынуждает каждого агента адаптироваться к поведению других в реальном времени, используя только историю собственных взаимодействий.

В качестве тестовой задачи использовалась дилемма заключённого (Iterated Prisoner's Dilemma, IPD) — классическая модель из теории игр, иллюстрирующая конфликт между индивидуальной выгодой и коллективным результатом. В ходе экспериментов агенты достигли устойчивой кооперации без необходимости жёстко фиксировать роли или закладывать информацию о внутренней логике соперников.
Ключевым элементом методики стало обучение на смешанном наборе противников с разными стратегиями и параметрами. Это позволило агентам выработать универсальные стратегии, устойчивые к появлению новых партнёров и изменению среды. При этом не требовалось увеличивать объём контекстного окна: агенты учились эффективно использовать уже доступную информацию.
В отличие от популярных фреймворков (например, LangGraph), где разработчик вручную задаёт логику переходов и координации, новый подход Google позволяет добиться кооперации с помощью стандартных алгоритмов обучения с подкреплением (например, GRPO). Роль разработчика смещается от «писателя правил» к архитектору среды обучения, где агенты самостоятельно осваивают полезные и безопасные формы взаимодействия.
Авторы отмечают, что их методика масштабируема и вычислительно эффективна для корпоративных многоагентных систем.
-
Представлен смартфон Motorola Edge 70 Fusion+: улучшенная камера с 3-кратным зумом, Snapdragon 7s Gen 4, IP69, 144 гц — 570 долларов
12.03.2026 16:55:00 | iXBT.com
Пользователь отправил Kingston бракованный комплект памяти DDR5 64 для замены по гарантии, а в итоге и новую память не получил, и лишился половины бракованной
12.03.2026 16:35:00 | iXBT.com
Пользователь отправил Kingston бракованный комплект памяти DDR5 64 ГБ для замены по гарантии, а в итоге и новую память не получил, и лишился половины бракованной
12.03.2026 16:35:00 | iXBT.com
Едины с народом: Госдума осталась без интернета, Telegram, Max и мобильной связи
12.03.2026 15:37:00 | iXBT.com
Больше не эксклюзив для Galaxy S25: Samsung расширила программу бета-теста One UI 8.5
12.03.2026 15:32:00 | iXBT.com
30 000 мАч, месяц автономности, 200 Мп и IP69K. Представлен неубиваемый смартфон Energizer P30K Apex
12.03.2026 15:24:00 | iXBT.com
Пользователь сдал память Corsair DDR5 по гарантии, но ритейлер вернул лишь пятую часть стоимости. И похоже, что это распространенная практика у продавца
12.03.2026 14:38:00 | iXBT.com
Нейроны против чипов: Cortical Labs строит биологические дата-центры на базе живых клеток
12.03.2026 14:10:00 | iXBT.com
«Прогресс МС-33» состыковали с переходным отсеком перед запуском к МКС
12.03.2026 14:04:00 | iXBT.com
Американский робот Figure 03 может самостоятельно прибраться в комнате, которую видит впервые в жизни
12.03.2026 13:50:16 | TechCult.ru
Тысячи жалоб за час: в Telegram масштабный сбой, мессенджер «упал» в России, США и Европе
12.03.2026 13:24:00 | iXBT.com
Неделя космических потерь: спутник NASA упал в Тихий океан, а зонд ЕКА перешел в «режим выживания»
12.03.2026 13:06:00 | iXBT.com
Видеокарты Radeon RX 9000 не будут поддерживать апскейер FSR Diamond. Новое поколение ПО будет эксклюзивом для карт на RDNA 5
12.03.2026 12:29:00 | iXBT.com
Одноплатный ПК с мощным APU и памятью LPCAMM2. SolidRun представила новую линейку P100 COM Express Type 6
12.03.2026 12:19:00 | iXBT.com
Убийца 8 детей обсуждал планы с ChatGPT, но OpenAI лишь заблокировала его аккаунт, не предупредив власти
12.03.2026 12:06:00 | iXBT.com
Представлена китайская видеокарта Lisuan LX 7G106 с 12 ГБ памяти, которая позволит играть в Cyberpunk 2077 и прочие игры из Steam
12.03.2026 12:05:00 | iXBT.com
Самый дешевый Geely Monjaro в России стал технологичнее: базовая версия получила адаптивный круиз-контроль, систему удержания в полосе и 3-зонный климат-контроль
12.03.2026 11:58:00 | iXBT.com
На MacBook Neo запустили 10 разных игр, включая Resident Evil Requiem. Тесты показывают, на что способен ноутбук Apple за 600 долларов
12.03.2026 11:47:00 | iXBT.com
Hyundai намерена разработать для Южной Кореи гиперзвуковую ракету к 2035 году
12.03.2026 11:46:56 | TechCult.ru
Таких не берут в космонавты: «Роскосмос» рассказал, что татуировки и большой размер ноги могут стать причиной отказа при отборе в космонавты
12.03.2026 11:35:00 | iXBT.com
Три новые OLED-монитора от лидера рынка по цене от 600 долларов. Asus представила модели XG27A
12.03.2026 11:35:00 | iXBT.com
Приготовит холодный кофе за 90 секунд и обычный за минуту. Представлена кофемашина Philips Baristina Bar Pro 500
12.03.2026 11:32:00 | iXBT.com
Крупнейшее обновление за год: «Алиса» в умных устройствах Яндекса перешла на продвинутую ИИ-модель
12.03.2026 11:25:00 | iXBT.com
Уровень подключения 1% от обычного и доступ только к ограниченному списку ресурсов из «белого списка». Интернета в Иране нет уже 13-е сутки
12.03.2026 11:10:00 | iXBT.com
7200 мАч, защита по военному стандарту MIL-STD-810H, IP69, Dimensity 7400 Turbo — за 230 долларов. Представлен защищенный смартфон iQOO Z11x 5G
12.03.2026 11:01:00 | iXBT.com
Honor 600e с очень узкой рамкой рассекречен ещё до презентации: появились характеристики и изображение смартфона
12.03.2026 10:55:00 | iXBT.com
Honor жалеет, что не может выпустить Robot Phone в марте. Но есть и хорошая новость: дополнительное время потратят на новую версию AiMAGE
12.03.2026 10:48:00 | iXBT.com
-
В Сеченовском университете нашли способ точнее назначать операции на носе
12.03.2026 23:13:27 | ferra.ru
В России создадут дрон для распознавания и точечного уничтожения сорняков
12.03.2026 22:19:36 | ferra.ru
От блокнота к CRM: как случайная аренда автосервиса привела к разработке собственной системы управления
12.03.2026 21:16:22 | Хабр
Пока бывший муж продает дом Лерчек за 225 млн, она сама живет с детьми у подруги
12.03.2026 21:04:43 | Woman.ru
9 агентов, 6 моделей, 1 сервер: как собрать ИИ-компанию на open-source в марте 2026
12.03.2026 21:03:32 | Хабр
ИИ из НовГУ научился определять уровень внимания человека в реальном времени
12.03.2026 20:25:55 | ferra.ru
ИИ помог выявить более 50 тысяч нарушений уборки во дворах Подмосковья
12.03.2026 20:25:43 | ferra.ru
Новая уязвимость в телефонах с чипами MediaTek: один такой взломали за 45 секунд
12.03.2026 20:16:09 | ferra.ru
75 проектов в IntelliJ IDEA: как я перестал тонуть в Recent Projects и написал свой плагин
12.03.2026 20:07:44 | Хабр
«Как видите, я справилась»: счастливая Долина представила новую песню
12.03.2026 19:20:21 | Woman.ru
Яндекс Карты с помощью ИИ отметили входы, доступные для людей на инвалидных креслах
12.03.2026 18:55:00 | ferra.ru
Российские ученые впервые применили дроны для подсчета корма для рыб в Енисее
12.03.2026 18:12:19 | ferra.ru
Так выглядит планшет Lenovo Tab Plus Gen 2 с гигантским динамиком сзади
12.03.2026 18:11:43 | ferra.ru
В Новосибирске создали нейросеть для анализа поведения покупателей в магазинах
12.03.2026 18:09:00 | ferra.ru
Рыба с запахом огурца — исследователи объяснили феномен — читать на Gastronom.ru
12.03.2026 18:00:00 | ГАСТРОНОМЪ
PMBoK 7 vs PMBoK 8: что изменилось и зачем это знать креативному PM в геймдеве
12.03.2026 17:10:55 | Хабр
Техническая поддержка проекта ВсеТут