Новый ИИ-агент AlphaEvolve от Google DeepMind продемонстрировал масштабное ускорение работы в чистой математике, решив десятки сложных задач и предложив новые подходы к старым проблемам — в тесном сотрудничестве с ведущими математиками.
В опубликованной на этой неделе статье, среди авторов которой — профессор Терренс Тао, описывается, как AlphaEvolve справился с 67 нетривиальными задачами: заново обнаружил лучшие известные решения и предложил новые конструкции для ряда давних вопросов геометрии и теории множеств. Авторы работы подчёркивают, что система не заменяет человека, а выступает инструментом для более быстрой и систематической проверки идей.
В отличие от привычных чат-ботов, которые часто ошибаются в строгих логических выкладках, AlphaEvolve работает как «универсальный эволюционный кодирующий агент». Он использует большие языковые модели, в том числе Gemini, чтобы генерировать, запускать и поэтапно улучшать программы на Python, ищущие решения в огромном пространстве вариантов. Этот подход развивает представленный DeepMind в мае 2025 года прототип и, по формулировке авторов статьи, делает AlphaEvolve «мощным новым инструментом для математических открытий», способным исследовать сложные задачи оптимизации в больших масштабах.
Ключевая идея состоит в том, что ИИ не конструирует математический объект напрямую, а создаёт код, который сам выполняет поиск подходящих примеров или оптимальных фигур. В «режиме поиска» одна относительно редкая и ресурсоёмкая генерация кода запускает затем длинный, но дешёвый перебор миллионов вариантов с помощью созданного эвристического алгоритма. В «режиме обобщения» агент нацелен на формулы и конструкции, которые работают для целых классов чисел, а не единичных случаев. По словам авторов, подготовка постановки многих задач для AlphaEvolve обычно укладывалась в несколько часов, что резко снижает порог для запуска масштабных вычислительных экспериментов.

Система показала себя не только в воспроизведении известных результатов, но и в создании новых. В статье выделяются свежая перспективная конструкция для множеств Никодима и улучшенные конструкции для конечнопольной версии задачи Какея в размерностях 3, 4 и 5. Эти задачи относятся к аналитической и геометрической теории множеств и традиционно требуют сложных комбинаций интуиции и вычислений, AlphaEvolve здесь выступил источником идей, которые уже легли в основу готовящейся научной публикации Тао.
AlphaEvolve одинаково уверенно работает и с более наглядной геометрией. Агент заново нашёл известный «диван Гервер» — фигуру максимальной площади, которую можно протащить через прямоугольный поворотный коридор («задача движущегося дивана»), а также «диван Ромика» для амбидекстричного варианта задачи. Для трёхмерной версии проблема стала ещё сложнее, но система выдала новую конструкцию со строго проверенным объёмом не менее 1,81 (в кубических единицах), которую авторы рассматривают как улучшение по сравнению с ранее известными кандидатами.
Важная часть работы — связка нескольких специализированных ИИ-инструментов в единую цепочку. AlphaEvolve предлагает многообещающую конструкцию, далее такие системы, как Deep Think (используемая ранее DeepMind для задач уровня Международной математической олимпиады), помогают получить доказательства её корректности, после чего инструменты вроде AlphaProof переводят эти доказательства в формальные языки типа Lean для машинной проверки. При этом, как подчёркивает Тао в своём блоге, требуется значительный профессиональный контроль: ИИ склонен искать обходные пути и эксплуатировать слабости проверяющих процедур, поэтому создание «недоминируемого» (необманываемого) проверяющего контура требует серьёзных усилий.
Авторы прямо отмечают, что AlphaEvolve — это новый тип «проверки здравого смысла» для математиков: система может быстро перебирать очевидные и неочевидные контрпримеры к гипотезе до того, как на неё будут потрачены месяцы человеческой работы. При этом в ходе экспериментов ни одна крупная открытая гипотеза опровергнута не была, и статья аккуратно фиксирует этот результат, выделяя его как свидетельство строгости подхода на фоне недавних публичных ошибок других компаний, уже вынужденных отзывать завышенные заявления о «решении» задач Эрдёша.
В совокупности работа над AlphaEvolve продолжает линию проверяемых достижений DeepMind в математике и предлагает практическую модель сотрудничества.
-
Ответ Tesla из Китая: новые версии Xpeng P7+ объединяют ИИ, рекордную зарядку и гибридный запас хода до 1400 км
09.11.2025 16:22:00 | iXBT.com
Новая гипотеза призывает SETI перестать «слушать пустоту» и искать технологические маркеры самовоспроизводящихся зондов прямо на Луне и астероидах
09.11.2025 16:00:00 | iXBT.com
Пользователи Windows наконец получат собственную версию Magic Trackpad от Apple
09.11.2025 15:44:40 | TechCult.ru
Сэм Альтман против «спасения OpenAI» за счёт бюджета — но настаивает на господдержке ИИ-инфраструктуры США
09.11.2025 12:50:00 | iXBT.com
SpaceX покупает радиочастоты EchoStar за $2,6 млрд для глобальной спутниковой связи напрямую с телефонами
09.11.2025 12:35:00 | iXBT.com
Quantinuum представила квантовый процессор Helios с 96 кубитами и новой архитектурой перемещения ионов
09.11.2025 12:24:00 | iXBT.com
Россияне бросились скупать Rolls-Royce: в годовом выражении продажи взлетели в три раза
09.11.2025 12:11:00 | iXBT.com
Alfa Romeo и Maserati объединяются для создания ультраэксклюзивных автомобилей
09.11.2025 12:10:00 | iXBT.com
Флагманская платформа MediaTek Dimensity 9600 превзойдет Snapdragon 8 Elite Gen 6 по производительности
09.11.2025 12:01:00 | iXBT.com
На Солнце произошел сильный взрыв высшего уровня X — и как раз по линии Солнце-Земля
09.11.2025 11:48:00 | iXBT.com
Formula E представила новый электроболид GEN4 — самый мощный и экологичный в истории серии
09.11.2025 11:48:00 | iXBT.com
В России взлетели продажи Volkswagen, самая популярная модель — Volkswagen Tiguan
09.11.2025 11:29:00 | iXBT.com
Веселая и хаотичная игра Overcooked ляжет в основу нового реалити-шоу Netflix
09.11.2025 09:54:49 | TechCult.ru
Теперь ещё сложнее отличать от реальности. Вышло большое обновление для Grok и Grok Imagine
09.11.2025 09:22:00 | iXBT.com
270 л.с. 165 км без бензина, максимальная скорость 190 км/ч и пятиметровый кузов. Представлен Geely Galaxy Starshine 7 PHEV
09.11.2025 08:59:00 | iXBT.com
Робот Iron с женским телом, покачивающий бёдрами при походке, вызвал вопросы. Разработчики объяснили, почему он двигается как человек
09.11.2025 08:30:00 | iXBT.com
Samsung собирается не только продавать своих гуманоидных роботов, но и использовать их на производстве
09.11.2025 08:22:00 | iXBT.com
АКБ автомобильного класса, 120 Вт, 25000 мАч и светодиодный дисплей — дешевле 30 долларов. Представлен внешний аккумулятор Cuktech 25 Super Power Block SE
09.11.2025 08:16:00 | iXBT.com
1600 км на баке бензина, пневмоподвеска, полноуправляемое шасси, топове оснащение и королевский простор. Новый XPeng X9 Extended Range появился у дилеров в Китае
09.11.2025 00:25:00 | iXBT.com
7000 мАч, 80 Вт, IP69, много памяти — всего 225 долларов. Представлен Oppo A6
08.11.2025 23:06:00 | iXBT.com
Kia поставила исторический рекорд октябрьских продаж в США, Kia Sportage — абсолютный хит
08.11.2025 22:49:00 | iXBT.com
Инсайдер сообщил, что характеристики основной камеры Samsung Galaxy S27 Ultra будут определяться с оглядкой на камеру iPhone 18 Pro Max
08.11.2025 21:48:00 | iXBT.com
Это карманный Windows-ПК с экраном 5,7 дюйма, физической клавиатурой и массой 330 г. Представлен OmniOne Pocket PC
08.11.2025 21:45:00 | iXBT.com
Microsoft хочет ослабить монополию Nvidia. Компания разработала ПО, которое позволяет запускать код CUDA на ускорителях AMD
08.11.2025 21:32:00 | iXBT.com
Перед повышением утильсбора в России взлетели продажи Mercedes-Benz, самая популярная модель — дорогущий Mercedes-Benz G-класса
08.11.2025 21:22:00 | iXBT.com
Samsung Galaxy S26 станет тоньше и получит магнитную беспроводную зарядку Qi2
08.11.2025 21:06:00 | iXBT.com
Тёмная энергия сдает позиции: анализ 300 галактик и данных DESI намекает, что космическое расширение уже замедляется
08.11.2025 19:54:00 | iXBT.com
14-дюймовый ноутбук массой 1 кг с шестиядерным Ryzen и ценой 500 долларов. Представлен Chuwi CoreBook Air
08.11.2025 19:01:00 | iXBT.com
Большой, изогнутый, но 16 : 9. LG представила игровой монитор UltraGear 37800A
08.11.2025 18:12:00 | iXBT.com
Скоро SSD и DRAM будут по талонам? В Японии магазины ограничивают количество накопителей и модулей памяти, которые может купить один человек
08.11.2025 18:05:00 | iXBT.com
-
Учёный объяснил, почему исследований, посвящённых головным болям, сейчас всё ещё мало
09.11.2025 18:00:11 | ferra.ru
Названы 10 лучших сочетаний моделей видеокарт + процессоров на конец 2025 года
09.11.2025 17:15:55 | ferra.ru
«Её английский был прекрасен, а мой русский — ужасен»: Вольфганг Черни рассказал, как познакомился с женой
09.11.2025 17:00:53 | КИНО-ТЕАТР.РУ
Самую популярную видеокарту по статистике «железа» в Steam протестировали в играх 2025 года
09.11.2025 16:30:09 | ferra.ru
Обзорщик перечислил 10 лучших смартфонов для покупки на распродаже 11.11
09.11.2025 15:45:02 | ferra.ru
«Во мне есть принципы»: Марк Богатырёв объяснил, почему отказался сниматься у Сарика Андреасяна
09.11.2025 15:35:44 | КИНО-ТЕАТР.РУ
«Это очень сложное дело»: Марк Богатырёв рассказал о своём ресторане испанской кухни
09.11.2025 15:19:43 | КИНО-ТЕАТР.РУ
«Возможности безграничны»: пациент Neuralink показал, как управляет мини-моделью самолёта «силой мысли»
09.11.2025 15:14:45 | vc.ru
Эксперт предупредил об опасности отравления собак грибами во время прогулки
09.11.2025 15:00:13 | ferra.ru
[Перевод] Самовоспроизводящиеся зонды могут работать прямо сейчас в Солнечной системе. Вот как мы можем их искать
09.11.2025 14:50:33 | Хабр
Павел Устинов сыграет в спектакле Эдуарда Боякова «Хорошие фото»
09.11.2025 14:45:53 | КИНО-ТЕАТР.РУ
Синдром самозванца? Вернитесь к тому моменту в карьере, когда вы потеряли себя
09.11.2025 14:15:54 | Хабр
Как сделать видео с нейросетями: простой гайд от идеи до финального ролика через ChatGPT
09.11.2025 14:09:33 | Хабр
Сложности при просмотре телевизионных программ назвали одним из ранних признаков деменции
09.11.2025 13:30:45 | ferra.ru
Да здравствует будущий король! В 12 лет принц Джордж заменил отца на важном мероприятии
09.11.2025 13:19:17 | Woman.ru
Закончились съемки комедии «Между нами, девочками» с Татьяной Догилевой и Степаном Девониным
09.11.2025 13:15:53 | КИНО-ТЕАТР.РУ
BBRv3, FEC и QUIC: как мы удержали jitter <1 мс и стабилизировали RU<->EU
09.11.2025 13:15:43 | Хабр
Рейтинг контента и пользователей на основе офелократии. Часть 2. Реализация на SQL
09.11.2025 13:01:40 | Хабр
Здоровый завтрак и другие правила питания, которые избавят от висящего живота после 45 лет
09.11.2025 12:45:33 | ferra.ru
Техническая поддержка проекта ВсеТут