Google обнаружила: ИИ-агенты лучше сотрудничают, если учатся в среде с непредсказуемыми противниками

12.03.2026 17:05:00 | iXBT.com

В многоагентных системах, где несколько агентов на базе искусственного интеллекта взаимодействуют в одной среде, часто возникает конкуренция между целями отдельных участников. Это приводит к ситуации, когда каждый агент стремится максимизировать собственную выгоду, что в итоге мешает достижению общего результата. Проблема особенно актуальна для децентрализованных систем, где у каждого агента есть только локальная информация.

Команда Paradigms of Intelligence из Google предложила альтернативу традиционным жёстким алгоритмам координации. Вместо ручного задания правил взаимодействия учёные обучили агентов с помощью метода Predictive Policy Improvement (PPI) в среде с разнообразным пулом противников — как обучающихся, так и статических моделей. Такой подход вынуждает каждого агента адаптироваться к поведению других в реальном времени, используя только историю собственных взаимодействий.

Иллюстрация: Grok

В качестве тестовой задачи использовалась дилемма заключённого (Iterated Prisoner's Dilemma, IPD) — классическая модель из теории игр, иллюстрирующая конфликт между индивидуальной выгодой и коллективным результатом. В ходе экспериментов агенты достигли устойчивой кооперации без необходимости жёстко фиксировать роли или закладывать информацию о внутренней логике соперников.

Ключевым элементом методики стало обучение на смешанном наборе противников с разными стратегиями и параметрами. Это позволило агентам выработать универсальные стратегии, устойчивые к появлению новых партнёров и изменению среды. При этом не требовалось увеличивать объём контекстного окна: агенты учились эффективно использовать уже доступную информацию.

В отличие от популярных фреймворков (например, LangGraph), где разработчик вручную задаёт логику переходов и координации, новый подход Google позволяет добиться кооперации с помощью стандартных алгоритмов обучения с подкреплением (например, GRPO). Роль разработчика смещается от «писателя правил» к архитектору среды обучения, где агенты самостоятельно осваивают полезные и безопасные формы взаимодействия.

Авторы отмечают, что их методика масштабируема и вычислительно эффективна для корпоративных многоагентных систем.

Подробнее

Читайте также

Представлен смартфон Motorola Edge 70 Fusion+: улучшенная камера с 3-кратным зумом, Snapdragon 7s Gen 4, IP69, 144 гц — 570 долларов
12.03.2026 16:55:00 | iXBT.com

Пользователь отправил Kingston бракованный комплект памяти DDR5 64 для замены по гарантии, а в итоге и новую память не получил, и лишился половины бракованной
12.03.2026 16:35:00 | iXBT.com

Пользователь отправил Kingston бракованный комплект памяти DDR5 64 ГБ для замены по гарантии, а в итоге и новую память не получил, и лишился половины бракованной
12.03.2026 16:35:00 | iXBT.com

Игровой коврик GAMR может заменить контроллер во множестве игр
12.03.2026 15:46:35 | TechCult.ru

Едины с народом: Госдума осталась без интернета, Telegram, Max и мобильной связи
12.03.2026 15:37:00 | iXBT.com

Больше не эксклюзив для Galaxy S25: Samsung расширила программу бета-теста One UI 8.5
12.03.2026 15:32:00 | iXBT.com

30 000 мАч, месяц автономности, 200 Мп и IP69K. Представлен неубиваемый смартфон Energizer P30K Apex
12.03.2026 15:24:00 | iXBT.com

Nvidia вложит $2 млрд в Nebius Group — бывшую Yandex N.V.
12.03.2026 15:02:00 | iXBT.com

Продажи пейджеров и раций выросли на фоне ограничений в Москве
12.03.2026 14:58:41 | Ведомости

Пользователь сдал память Corsair DDR5 по гарантии, но ритейлер вернул лишь пятую часть стоимости. И похоже, что это распространенная практика у продавца
12.03.2026 14:38:00 | iXBT.com

Нейроны против чипов: Cortical Labs строит биологические дата-центры на базе живых клеток
12.03.2026 14:10:00 | iXBT.com

«Прогресс МС-33» состыковали с переходным отсеком перед запуском к МКС
12.03.2026 14:04:00 | iXBT.com

В работе Telegram вновь наблюдается масштабный сбой
12.03.2026 13:50:51 | Ведомости

Американский робот Figure 03 может самостоятельно прибраться в комнате, которую видит впервые в жизни
12.03.2026 13:50:16 | TechCult.ru

Депутаты возмутились отсутствием Wi-Fi в Госдуме
12.03.2026 13:34:32 | Ведомости

Тысячи жалоб за час: в Telegram масштабный сбой, мессенджер «упал» в России, США и Европе
12.03.2026 13:24:00 | iXBT.com

Неделя космических потерь: спутник NASA упал в Тихий океан, а зонд ЕКА перешел в «режим выживания»
12.03.2026 13:06:00 | iXBT.com

Видеокарты Radeon RX 9000 не будут поддерживать апскейер FSR Diamond. Новое поколение ПО будет эксклюзивом для карт на RDNA 5
12.03.2026 12:29:00 | iXBT.com

Одноплатный ПК с мощным APU и памятью LPCAMM2. SolidRun представила новую линейку P100 COM Express Type 6
12.03.2026 12:19:00 | iXBT.com

Выручка VK Tech выросла на 38% в 2025 году
12.03.2026 12:10:03 | Ведомости

Убийца 8 детей обсуждал планы с ChatGPT, но OpenAI лишь заблокировала его аккаунт, не предупредив власти
12.03.2026 12:06:00 | iXBT.com

Представлена китайская видеокарта Lisuan LX 7G106 с 12 ГБ памяти, которая позволит играть в Cyberpunk 2077 и прочие игры из Steam
12.03.2026 12:05:00 | iXBT.com

Самый дешевый Geely Monjaro в России стал технологичнее: базовая версия получила адаптивный круиз-контроль, систему удержания в полосе и 3-зонный климат-контроль
12.03.2026 11:58:00 | iXBT.com

На MacBook Neo запустили 10 разных игр, включая Resident Evil Requiem. Тесты показывают, на что способен ноутбук Apple за 600 долларов
12.03.2026 11:47:00 | iXBT.com

Hyundai намерена разработать для Южной Кореи гиперзвуковую ракету к 2035 году
12.03.2026 11:46:56 | TechCult.ru

В России готовят новый завод по изготовлению солнечных панелей
12.03.2026 11:41:00 | iXBT.com

Таких не берут в космонавты: «Роскосмос» рассказал, что татуировки и большой размер ноги могут стать причиной отказа при отборе в космонавты
12.03.2026 11:35:00 | iXBT.com

Три новые OLED-монитора от лидера рынка по цене от 600 долларов. Asus представила модели XG27A
12.03.2026 11:35:00 | iXBT.com

Приготовит холодный кофе за 90 секунд и обычный за минуту. Представлена кофемашина Philips Baristina Bar Pro 500
12.03.2026 11:32:00 | iXBT.com

Крупнейшее обновление за год: «Алиса» в умных устройствах Яндекса перешла на продвинутую ИИ-модель
12.03.2026 11:25:00 | iXBT.com

Уровень подключения 1% от обычного и доступ только к ограниченному списку ресурсов из «белого списка». Интернета в Иране нет уже 13-е сутки
12.03.2026 11:10:00 | iXBT.com

Huawei тестирует смартфоны с двухслойным OLED-дисплеем и стилусом
12.03.2026 11:03:00 | iXBT.com

7200 мАч, защита по военному стандарту MIL-STD-810H, IP69, Dimensity 7400 Turbo — за 230 долларов. Представлен защищенный смартфон iQOO Z11x 5G
12.03.2026 11:01:00 | iXBT.com

Honor 600e с очень узкой рамкой рассекречен ещё до презентации: появились характеристики и изображение смартфона
12.03.2026 10:55:00 | iXBT.com

Honor жалеет, что не может выпустить Robot Phone в марте. Но есть и хорошая новость: дополнительное время потратят на новую версию AiMAGE
12.03.2026 10:48:00 | iXBT.com

Все новости

ЛЕНТА

В Сеченовском университете нашли способ точнее назначать операции на носе
12.03.2026 23:13:27 | ferra.ru

В России создадут дрон для распознавания и точечного уничтожения сорняков
12.03.2026 22:19:36 | ferra.ru

Следующий Xbox получит апскейл AMD нового поколения FSR Diamond
12.03.2026 22:16:11 | ferra.ru

Точка опоры
12.03.2026 22:03:44 | Хабр

Вот что я понял, когда стал автором на Хабре
12.03.2026 21:32:28 | Хабр

SLAY-ASR, или как я перестал волноваться и полюбил тренировать модели
12.03.2026 21:25:49 | Хабр

От блокнота к CRM: как случайная аренда автосервиса привела к разработке собственной системы управления
12.03.2026 21:16:22 | Хабр

Взаимное исключение в Java: от synchronized к Lock
12.03.2026 21:15:20 | Хабр

Пока бывший муж продает дом Лерчек за 225 млн, она сама живет с детьми у подруги
12.03.2026 21:04:43 | Woman.ru

9 агентов, 6 моделей, 1 сервер: как собрать ИИ-компанию на open-source в марте 2026
12.03.2026 21:03:32 | Хабр

CyberChef — инструмент, который заменяет десятки утилит
12.03.2026 20:27:04 | Хабр

ИИ из НовГУ научился определять уровень внимания человека в реальном времени
12.03.2026 20:25:55 | ferra.ru

ИИ помог выявить более 50 тысяч нарушений уборки во дворах Подмосковья
12.03.2026 20:25:43 | ferra.ru

Новая уязвимость в телефонах с чипами MediaTek: один такой взломали за 45 секунд
12.03.2026 20:16:09 | ferra.ru

75 проектов в IntelliJ IDEA: как я перестал тонуть в Recent Projects и написал свой плагин
12.03.2026 20:07:44 | Хабр

В России впервые отредактировали геном пшеницы методом CRISPR-Cas
12.03.2026 19:31:24 | ferra.ru

«Как видите, я справилась»: счастливая Долина представила новую песню
12.03.2026 19:20:21 | Woman.ru

Kawai-Focus 2.4: сборка приложения под Arch Linux
12.03.2026 18:58:42 | Хабр

Яндекс Карты с помощью ИИ отметили входы, доступные для людей на инвалидных креслах
12.03.2026 18:55:00 | ferra.ru

Топ нейросетей для SEO-обработки текста: обзор и сравнение
12.03.2026 18:53:37 | Хабр

На Сахалине отберут 500 специалистов по ИИ на базе «Школы 21»
12.03.2026 18:42:31 | ferra.ru

Dreame F20: мощность 20 000 Па и длинные усы
12.03.2026 18:32:36 | it-world

Пермские ученые создали алгоритм для плавной работы лифтов
12.03.2026 18:27:15 | ferra.ru

Первый за три года: Xiaomi показала новый ноутбук Book Pro 14
12.03.2026 18:16:07 | ferra.ru

Российские ученые впервые применили дроны для подсчета корма для рыб в Енисее
12.03.2026 18:12:19 | ferra.ru

Первые кадры из больницы, где Лерчек будет проходить химиотерапию
12.03.2026 18:11:58 | Woman.ru

Так выглядит планшет Lenovo Tab Plus Gen 2 с гигантским динамиком сзади
12.03.2026 18:11:43 | ferra.ru

Git для новичков: ветки, коммиты и первый pull request
12.03.2026 18:11:07 | Хабр

В Новосибирске создали нейросеть для анализа поведения покупателей в магазинах
12.03.2026 18:09:00 | ferra.ru

Рыба с запахом огурца — исследователи объяснили феномен — читать на Gastronom.ru
12.03.2026 18:00:00 | ГАСТРОНОМЪ

Telegram в России не будет работать даже с VPN
12.03.2026 17:54:19 | it-world

В МГУ создали наносенсор для анализа воды за две минуты
12.03.2026 17:46:41 | ferra.ru

Доступное нагрузочное тестирование: опенсорс-инфраструктура
12.03.2026 17:34:10 | Хабр

Россияне смогут отказаться от услуг, которые оказывают с помощью ИИ
12.03.2026 17:25:00 | ferra.ru

PMBoK 7 vs PMBoK 8: что изменилось и зачем это знать креативному PM в геймдеве
12.03.2026 17:10:55 | Хабр

Смотреть все

ВСЯ ЛЕНТА

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro