Операция выполнена!
Закрыть

Учёные из Google DeepMind и Университета Торонто представили алгоритм DreamerV3, способный за 9 дней стать экспертом в Minecraft, самостоятельно научившись добывать алмазы без подсказок. Эта разработка — шаг к созданию универсального искусственного интеллекта, который осваивает задачи любого уровня сложности, от управления роботами до анализа данных, используя единый набор правил.

DreamerV3 работает через «внутренний симулятор» — нейросеть, которая предсказывает последствия действий, как шахматист просчитывает ходы. Представив виртуальный сценарий, алгоритм оценивает его ценность второй сетью («критиком») и выбирает оптимальное решение третьей («актором»). Например, чтобы найти алмаз в Minecraft, система последовательно учится добывать дерево, создать кирку, исследовать пещеры — без внешних указаний, лишь через пробуждение интереса к цели.

Источник: Leonardo

Ключевое преимущество DreamerV3 — стабильность. В отличие от классических алгоритмов вроде PPO, требующих тонкой настройки под каждую задачу, он сохраняет одни и те же параметры для всех 150 тестовых сценариев, от аркадных игр до управления роботами. Это достигнуто за счёт балансировки данных: система автоматически корректирует масштаб наград, избегая перекосов в обучении. Например, в средах, где награды редки (как алмазы в Minecraft), алгоритм усиливает «любопытство», исследуя больше вариантов.

Фрагменты экспериментов DreamerV3. Кадры иллюстрируют ключевую идею: DreamerV3 не привязан к конкретной области, а его «внутренний симулятор» одинаково эффективен и в добыче редких ресурсов, и в точном управлении механизмами. Источник: Nature (2025). DOI: 10.1038/s41586-025-08744-2

Прорывом стал результат в Minecraft: DreamerV3 первым собрал алмазы «с нуля», преодолев 12 этапов — от рубки деревьев до поиска редких минералов. Это демонстрирует способность к долгосрочному планированию в непредсказуемых условиях, что важно для реальных роботов, работающих в меняющейся среде.

Учёные видят будущее технологии в объединении обучения с видео из интернета — например, робот-помощник мог бы осваивать навыки, наблюдая за людьми. Уже сейчас DreamerV3 масштабируется: чем больше вычислительных ресурсов, тем выше эффективность. Это открывает путь к системам, которые не просто выполняют задачи, но адаптируются к новым вызовам — от умных фабрик до автономных автомобилей, способных «мыслить» на шаг вперёд.

Читайте также
СТАТЬ АВТОРОМ
ЛЕНТА

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro