Новый ИИ-агент AlphaEvolve от Google DeepMind продемонстрировал масштабное ускорение работы в чистой математике, решив десятки сложных задач и предложив новые подходы к старым проблемам — в тесном сотрудничестве с ведущими математиками.
В опубликованной на этой неделе статье, среди авторов которой — профессор Терренс Тао, описывается, как AlphaEvolve справился с 67 нетривиальными задачами: заново обнаружил лучшие известные решения и предложил новые конструкции для ряда давних вопросов геометрии и теории множеств. Авторы работы подчёркивают, что система не заменяет человека, а выступает инструментом для более быстрой и систематической проверки идей.
В отличие от привычных чат-ботов, которые часто ошибаются в строгих логических выкладках, AlphaEvolve работает как «универсальный эволюционный кодирующий агент». Он использует большие языковые модели, в том числе Gemini, чтобы генерировать, запускать и поэтапно улучшать программы на Python, ищущие решения в огромном пространстве вариантов. Этот подход развивает представленный DeepMind в мае 2025 года прототип и, по формулировке авторов статьи, делает AlphaEvolve «мощным новым инструментом для математических открытий», способным исследовать сложные задачи оптимизации в больших масштабах.
Ключевая идея состоит в том, что ИИ не конструирует математический объект напрямую, а создаёт код, который сам выполняет поиск подходящих примеров или оптимальных фигур. В «режиме поиска» одна относительно редкая и ресурсоёмкая генерация кода запускает затем длинный, но дешёвый перебор миллионов вариантов с помощью созданного эвристического алгоритма. В «режиме обобщения» агент нацелен на формулы и конструкции, которые работают для целых классов чисел, а не единичных случаев. По словам авторов, подготовка постановки многих задач для AlphaEvolve обычно укладывалась в несколько часов, что резко снижает порог для запуска масштабных вычислительных экспериментов.

Система показала себя не только в воспроизведении известных результатов, но и в создании новых. В статье выделяются свежая перспективная конструкция для множеств Никодима и улучшенные конструкции для конечнопольной версии задачи Какея в размерностях 3, 4 и 5. Эти задачи относятся к аналитической и геометрической теории множеств и традиционно требуют сложных комбинаций интуиции и вычислений, AlphaEvolve здесь выступил источником идей, которые уже легли в основу готовящейся научной публикации Тао.
AlphaEvolve одинаково уверенно работает и с более наглядной геометрией. Агент заново нашёл известный «диван Гервер» — фигуру максимальной площади, которую можно протащить через прямоугольный поворотный коридор («задача движущегося дивана»), а также «диван Ромика» для амбидекстричного варианта задачи. Для трёхмерной версии проблема стала ещё сложнее, но система выдала новую конструкцию со строго проверенным объёмом не менее 1,81 (в кубических единицах), которую авторы рассматривают как улучшение по сравнению с ранее известными кандидатами.
Важная часть работы — связка нескольких специализированных ИИ-инструментов в единую цепочку. AlphaEvolve предлагает многообещающую конструкцию, далее такие системы, как Deep Think (используемая ранее DeepMind для задач уровня Международной математической олимпиады), помогают получить доказательства её корректности, после чего инструменты вроде AlphaProof переводят эти доказательства в формальные языки типа Lean для машинной проверки. При этом, как подчёркивает Тао в своём блоге, требуется значительный профессиональный контроль: ИИ склонен искать обходные пути и эксплуатировать слабости проверяющих процедур, поэтому создание «недоминируемого» (необманываемого) проверяющего контура требует серьёзных усилий.
Авторы прямо отмечают, что AlphaEvolve — это новый тип «проверки здравого смысла» для математиков: система может быстро перебирать очевидные и неочевидные контрпримеры к гипотезе до того, как на неё будут потрачены месяцы человеческой работы. При этом в ходе экспериментов ни одна крупная открытая гипотеза опровергнута не была, и статья аккуратно фиксирует этот результат, выделяя его как свидетельство строгости подхода на фоне недавних публичных ошибок других компаний, уже вынужденных отзывать завышенные заявления о «решении» задач Эрдёша.
В совокупности работа над AlphaEvolve продолжает линию проверяемых достижений DeepMind в математике и предлагает практическую модель сотрудничества.
-
Ответ Tesla из Китая: новые версии Xpeng P7+ объединяют ИИ, рекордную зарядку и гибридный запас хода до 1400 км
09.11.2025 16:22:00 | iXBT.com
Новая гипотеза призывает SETI перестать «слушать пустоту» и искать технологические маркеры самовоспроизводящихся зондов прямо на Луне и астероидах
09.11.2025 16:00:00 | iXBT.com
Пользователи Windows наконец получат собственную версию Magic Trackpad от Apple
09.11.2025 15:44:40 | TechCult.ru
Пользователи Windows наконец получат аналог Magic Trackpad от Apple
09.11.2025 15:44:09 | TechCult.ru
Сэм Альтман против «спасения OpenAI» за счёт бюджета — но настаивает на господдержке ИИ-инфраструктуры США
09.11.2025 12:50:00 | iXBT.com
SpaceX покупает радиочастоты EchoStar за $2,6 млрд для глобальной спутниковой связи напрямую с телефонами
09.11.2025 12:35:00 | iXBT.com
Quantinuum представила квантовый процессор Helios с 96 кубитами и новой архитектурой перемещения ионов
09.11.2025 12:24:00 | iXBT.com
Россияне бросились скупать Rolls-Royce: в годовом выражении продажи взлетели в три раза
09.11.2025 12:11:00 | iXBT.com
Alfa Romeo и Maserati объединяются для создания ультраэксклюзивных автомобилей
09.11.2025 12:10:00 | iXBT.com
Флагманская платформа MediaTek Dimensity 9600 превзойдет Snapdragon 8 Elite Gen 6 по производительности
09.11.2025 12:01:00 | iXBT.com
На Солнце произошел сильный взрыв высшего уровня X — и как раз по линии Солнце-Земля
09.11.2025 11:48:00 | iXBT.com
Formula E представила новый электроболид GEN4 — самый мощный и экологичный в истории серии
09.11.2025 11:48:00 | iXBT.com
В России взлетели продажи Volkswagen, самая популярная модель — Volkswagen Tiguan
09.11.2025 11:29:00 | iXBT.com
Веселая и хаотичная игра Overcooked ляжет в основу нового реалити-шоу Netflix
09.11.2025 09:54:49 | TechCult.ru
Теперь ещё сложнее отличать от реальности. Вышло большое обновление для Grok и Grok Imagine
09.11.2025 09:22:00 | iXBT.com
270 л.с. 165 км без бензина, максимальная скорость 190 км/ч и пятиметровый кузов. Представлен Geely Galaxy Starshine 7 PHEV
09.11.2025 08:59:00 | iXBT.com
Робот Iron с женским телом, покачивающий бёдрами при походке, вызвал вопросы. Разработчики объяснили, почему он двигается как человек
09.11.2025 08:30:00 | iXBT.com
Samsung собирается не только продавать своих гуманоидных роботов, но и использовать их на производстве
09.11.2025 08:22:00 | iXBT.com
АКБ автомобильного класса, 120 Вт, 25000 мАч и светодиодный дисплей — дешевле 30 долларов. Представлен внешний аккумулятор Cuktech 25 Super Power Block SE
09.11.2025 08:16:00 | iXBT.com
1600 км на баке бензина, пневмоподвеска, полноуправляемое шасси, топове оснащение и королевский простор. Новый XPeng X9 Extended Range появился у дилеров в Китае
09.11.2025 00:25:00 | iXBT.com
7000 мАч, 80 Вт, IP69, много памяти — всего 225 долларов. Представлен Oppo A6
08.11.2025 23:06:00 | iXBT.com
Kia поставила исторический рекорд октябрьских продаж в США, Kia Sportage — абсолютный хит
08.11.2025 22:49:00 | iXBT.com
Инсайдер сообщил, что характеристики основной камеры Samsung Galaxy S27 Ultra будут определяться с оглядкой на камеру iPhone 18 Pro Max
08.11.2025 21:48:00 | iXBT.com
Это карманный Windows-ПК с экраном 5,7 дюйма, физической клавиатурой и массой 330 г. Представлен OmniOne Pocket PC
08.11.2025 21:45:00 | iXBT.com
Microsoft хочет ослабить монополию Nvidia. Компания разработала ПО, которое позволяет запускать код CUDA на ускорителях AMD
08.11.2025 21:32:00 | iXBT.com
Перед повышением утильсбора в России взлетели продажи Mercedes-Benz, самая популярная модель — дорогущий Mercedes-Benz G-класса
08.11.2025 21:22:00 | iXBT.com
Samsung Galaxy S26 станет тоньше и получит магнитную беспроводную зарядку Qi2
08.11.2025 21:06:00 | iXBT.com
Тёмная энергия сдает позиции: анализ 300 галактик и данных DESI намекает, что космическое расширение уже замедляется
08.11.2025 19:54:00 | iXBT.com
14-дюймовый ноутбук массой 1 кг с шестиядерным Ryzen и ценой 500 долларов. Представлен Chuwi CoreBook Air
08.11.2025 19:01:00 | iXBT.com
Большой, изогнутый, но 16 : 9. LG представила игровой монитор UltraGear 37800A
08.11.2025 18:12:00 | iXBT.com
-
ИИ Google начали добавлять в старые умные колонки сторонних производителей
07.12.2025 21:45:09 | ferra.ru
Фильм «Цинга» с Никитой Ефремовым стал триумфатором фестиваля «Зимний»
07.12.2025 20:30:01 | КИНО-ТЕАТР.РУ
Galaxy S26 с фирменным чипом Exynos 2600 выйдет только в Южной Корее — слухи
07.12.2025 20:15:07 | ferra.ru
Учёный РАН: земные сутки будут длиться больше месяца, но очень нескоро
07.12.2025 19:50:21 | ferra.ru
ИИ не стоит доверять предсказание землетрясений, считает российский ученый
07.12.2025 19:45:23 | ferra.ru
Ученые выяснили, что саблезубые кошки жили и выводили потомство в Сибири
07.12.2025 19:40:24 | ferra.ru
Российские ученые создали гель, ускоряющий заживление сложных ран в два раза
07.12.2025 19:35:57 | ferra.ru
Театр абсурда в современных театральных постановках: к 95 летию со дня рождения Славомира Мрожека
07.12.2025 19:24:58 | КИНО-ТЕАТР.РУ
Waymo объявила отзыв ПО роботакси из-за их «поведения» возле школьных автобусов
07.12.2025 18:45:03 | ferra.ru
Индийский Галустян, собака-бухгалтер и новый фильм Джима Джармуша: главные трейлеры за неделю
07.12.2025 18:30:02 | КИНО-ТЕАТР.РУ
Много солнца и никаких городских протестов: помогут ли орбитальные дата-центры решить нехватку мощностей для ИИ на Земле
07.12.2025 18:07:49 | vc.ru
Народный выбор: Анна Пересильд, Сергей Шнуров и Регина Тодоренко
07.12.2025 17:00:02 | КИНО-ТЕАТР.РУ
Айза выступила против Ларисы Долиной и назвала еще звезд, которых следует «отменить»
07.12.2025 16:46:49 | Woman.ru
MSI представила лёгкий ноутбук Prestige 13 с Panther Lake и OLED-дисплеем
07.12.2025 16:30:59 | ferra.ru
Техническая поддержка проекта ВсеТут