67 сложных задач и ни одной фальшивой сенсации: ИИ-напарник математика AlphaEvolve от DeepMind помогает решать сложные задачи

09.11.2025 16:31:00 | iXBT.com

Новый ИИ-агент AlphaEvolve от Google DeepMind продемонстрировал масштабное ускорение работы в чистой математике, решив десятки сложных задач и предложив новые подходы к старым проблемам — в тесном сотрудничестве с ведущими математиками.

В опубликованной на этой неделе статье, среди авторов которой — профессор Терренс Тао, описывается, как AlphaEvolve справился с 67 нетривиальными задачами: заново обнаружил лучшие известные решения и предложил новые конструкции для ряда давних вопросов геометрии и теории множеств. Авторы работы подчёркивают, что система не заменяет человека, а выступает инструментом для более быстрой и систематической проверки идей.

В отличие от привычных чат-ботов, которые часто ошибаются в строгих логических выкладках, AlphaEvolve работает как «универсальный эволюционный кодирующий агент». Он использует большие языковые модели, в том числе Gemini, чтобы генерировать, запускать и поэтапно улучшать программы на Python, ищущие решения в огромном пространстве вариантов. Этот подход развивает представленный DeepMind в мае 2025 года прототип и, по формулировке авторов статьи, делает AlphaEvolve «мощным новым инструментом для математических открытий», способным исследовать сложные задачи оптимизации в больших масштабах.

Ключевая идея состоит в том, что ИИ не конструирует математический объект напрямую, а создаёт код, который сам выполняет поиск подходящих примеров или оптимальных фигур. В «режиме поиска» одна относительно редкая и ресурсоёмкая генерация кода запускает затем длинный, но дешёвый перебор миллионов вариантов с помощью созданного эвристического алгоритма. В «режиме обобщения» агент нацелен на формулы и конструкции, которые работают для целых классов чисел, а не единичных случаев. По словам авторов, подготовка постановки многих задач для AlphaEvolve обычно укладывалась в несколько часов, что резко снижает порог для запуска масштабных вычислительных экспериментов.

Иллюстрация: Google

Система показала себя не только в воспроизведении известных результатов, но и в создании новых. В статье выделяются свежая перспективная конструкция для множеств Никодима и улучшенные конструкции для конечнопольной версии задачи Какея в размерностях 3, 4 и 5. Эти задачи относятся к аналитической и геометрической теории множеств и традиционно требуют сложных комбинаций интуиции и вычислений, AlphaEvolve здесь выступил источником идей, которые уже легли в основу готовящейся научной публикации Тао.

AlphaEvolve одинаково уверенно работает и с более наглядной геометрией. Агент заново нашёл известный «диван Гервер» — фигуру максимальной площади, которую можно протащить через прямоугольный поворотный коридор («задача движущегося дивана»), а также «диван Ромика» для амбидекстричного варианта задачи. Для трёхмерной версии проблема стала ещё сложнее, но система выдала новую конструкцию со строго проверенным объёмом не менее 1,81 (в кубических единицах), которую авторы рассматривают как улучшение по сравнению с ранее известными кандидатами.

Важная часть работы — связка нескольких специализированных ИИ-инструментов в единую цепочку. AlphaEvolve предлагает многообещающую конструкцию, далее такие системы, как Deep Think (используемая ранее DeepMind для задач уровня Международной математической олимпиады), помогают получить доказательства её корректности, после чего инструменты вроде AlphaProof переводят эти доказательства в формальные языки типа Lean для машинной проверки. При этом, как подчёркивает Тао в своём блоге, требуется значительный профессиональный контроль: ИИ склонен искать обходные пути и эксплуатировать слабости проверяющих процедур, поэтому создание «недоминируемого» (необманываемого) проверяющего контура требует серьёзных усилий.

Авторы прямо отмечают, что AlphaEvolve — это новый тип «проверки здравого смысла» для математиков: система может быстро перебирать очевидные и неочевидные контрпримеры к гипотезе до того, как на неё будут потрачены месяцы человеческой работы. При этом в ходе экспериментов ни одна крупная открытая гипотеза опровергнута не была, и статья аккуратно фиксирует этот результат, выделяя его как свидетельство строгости подхода на фоне недавних публичных ошибок других компаний, уже вынужденных отзывать завышенные заявления о «решении» задач Эрдёша.

В совокупности работа над AlphaEvolve продолжает линию проверяемых достижений DeepMind в математике и предлагает практическую модель сотрудничества.

Подробнее