[Перевод] GEPA вместо RL: как рефлексивная эволюция промптов обгоняет обучение с подкреплением

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

[Перевод] GEPA вместо RL: как рефлексивная эволюция промптов обгоняет обучение с подкреплением

11.09.2025 11:00:37 | Хабр

Хабы: Data Engineering, Big Data, Машинное обучение, Искусственный интеллект, Data Mining

Большие языковые модели (LLM) всё чаще адаптируются к downstream-задачам с помощью методов RL, таких как Group Relative Policy Optimization (GRPO), которые нередко требуют тысячи прогонов для освоения новых задач. Мы утверждаем, что интерпретируемая природа языка может предоставлять LLM куда более богатую обучающую среду по сравнению с policy gradient’ами, основанными на разреженных скалярных наградах.

Чтобы проверить эту гипотезу, мы представляем GEPA (Genetic-Pareto) — оптимизатор промптов, который системно использует natural language reflection для извлечения высокоуровневых правил из trial-and-error процесса. Для любой AI-системы, содержащей один или несколько промптов LLM, GEPA сэмплирует траектории на уровне системы (например, рассуждения, вызовы инструментов и их выводы) и анализирует их на естественном языке, чтобы диагностировать проблемы, предлагать и тестировать обновления промптов, а также объединять комплементарные инсайты с границы Парето собственных попыток.

Благодаря такому дизайну GEPA нередко превращает даже несколько прогонов в существенный прирост качества. На четырёх задачах GEPA в среднем превосходит GRPO на 10% и до 20% максимум, при этом используя до 35× меньше прогонов. GEPA также опережает ведущий оптимизатор промптов MIPROv2 более чем на 10% на двух LLM и демонстрирует обнадёживающие результаты как стратегия поиска на этапе инференса для задач оптимизации кода.

Читать далее

Подробнее

Читайте также

Портим данные с удовольствием
11.09.2025 11:00:36 | Хабр

Как научиться писать хорошие промпты для генерации изображений
11.09.2025 11:00:29 | Хабр

Как устроено техническое интервью в отделе тестирования веб-приложений
11.09.2025 10:59:44 | Хабр

Как мы изобрели свой велосипед с vuls и запустили сканирование уязвимого ПО на базе OpenSource решения
11.09.2025 10:57:48 | Хабр

Тестируем пять моделей DeepSeek R1 и Qwen3 на серверах YADRO
11.09.2025 10:54:06 | Хабр

Тестирование в условиях отсутствия технической документации
11.09.2025 10:46:17 | Хабр

История oVirt: как развивалось решение и почему мы выбрали его как базу
11.09.2025 10:42:30 | Хабр

Как ежемесячный «ретроспективный день» оживил старый код и вернул мотивацию
11.09.2025 10:35:27 | Хабр

Google Pixel 10 Pro сравнили по камерам со складным Samsung Fold7
11.09.2025 10:30:00 | ferra.ru

Мониторинг и анализ производительности бэкенда с помощью ClickHouse и Grafana. Часть 3
11.09.2025 10:26:06 | Хабр

«Группа Астра» вложит миллиард в развитие Astra Cloud
11.09.2025 10:05:18 | it-world

Новый мощный мини-компьютер iRU получил Ryzen 9 и DDR5
11.09.2025 10:00:52 | ferra.ru

«Яндекс Книги» обновили дизайн и объявили о новом слогане — «Только Я и Книги»
11.09.2025 10:00:16 | vc.ru

Обзорщик объяснил, стоит ли переходить с iPhone 16 Pro Max на 17 Pro Max
11.09.2025 09:45:58 | ferra.ru

Как правильная настройка TDP добавляет до 30% производительности в играх
11.09.2025 09:23:36 | Хабр

Алгоритмы в повседневной жизни
11.09.2025 09:22:15 | Хабр

NASA рассказало о возможных признаках древних форм жизни на Марсе
11.09.2025 09:15:03 | vc.ru

ИИ и свобода воли: иллюзия выбора в мире предсказательных алгоритмов
11.09.2025 09:14:29 | Хабр

Попробовал библиотеку Motion в React: делюсь обзором
11.09.2025 09:14:20 | Хабр

Китайский многофазный DC/DC источник — двойник с сюрпризом
11.09.2025 09:12:32 | Хабр

[Перевод] Как Netflix добивается корректной атрибуции в журналах сетевых потоков eBPF
11.09.2025 09:07:47 | Хабр

[Перевод] Почему браузеры ограничивают JavaScript таймеры?
11.09.2025 09:05:12 | Хабр

МТС Музыка запустила клипы: теперь песни можно не только слушать
11.09.2025 09:01:55 | ferra.ru

Сборка тревел-гитары из запчастей с Aliexpress
11.09.2025 09:01:11 | Хабр

Учёные обнаружили, что болезни сердца у женщин часто возникают из-за воспаления
11.09.2025 09:00:52 | ferra.ru

10 качественных CRM-систем в 2025 году: мой обзор российских сервисов
11.09.2025 09:00:11 | Хабр

Как CEO и CFO смотрят на кибербез и как извлечь из этого пользу?
11.09.2025 09:00:10 | Хабр

[Перевод] «Капли» тёмной материи могут разгадать множество космических загадок
11.09.2025 08:58:09 | Хабр

Антенны для вашего приёмника SDR
11.09.2025 08:45:06 | Хабр

Практические кейсы применения нового модуля «СХД» в DCImanager: от проблем к решениям
11.09.2025 08:30:18 | Хабр

Белок с углеводами и другие вещи, которые помогут вашему мозгу оставаться в форме в течение дня
11.09.2025 08:15:33 | ferra.ru

[Перевод] За пределами отладчика: полное руководство по отладке Go-приложений
11.09.2025 08:15:00 | Хабр

Нейро-дайджест: ключевые события мира AI за 2 неделю сентября 2025
11.09.2025 08:05:58 | Хабр

[Перевод] Intel Arc Pro B50: 16 ГБ низкопрофильная видеокарта для мини-ПК
11.09.2025 08:05:08 | Хабр

Как мы в ВТБ автоматизировали мажорное обновление PostgreSQL
11.09.2025 08:03:58 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Минпросвещения создает Совет по наставничеству
03.03.2026 22:14:25 | ТАСС

Трамп раскритиковал Испанию и Британию за "несговорчивость" в военной сфере
03.03.2026 22:13:47 | ТАСС

Умер художник-иллюстратор «Вечерней Москвы» Дмитрий Захаров
03.03.2026 22:11:30 | Life.ru

Макрон распорядился передислоцировать авианосец "Шарль де Голль" в Средиземное море
03.03.2026 22:10:09 | ТАСС

В России школьные звонки заменят произведениями Чайковского, Глинки и Бородина
03.03.2026 22:09:49 | Life.ru

В Музее музыки презентовали собрание сочинений композитора Арно Бабаджаняна
03.03.2026 22:09:47 | ТАСС

Фидан: конфликт вокруг Ирана может расшириться, если страны региона начнут обороняться
03.03.2026 22:09:13 | ТАСС

Над Белгородской и Орловской областями сбили два украинских дрона
03.03.2026 22:08:52 | Life.ru

Франция сбивала беспилотники Ирана в небе над дружественными ей странами
03.03.2026 22:07:35 | ТАСС

Украинцу во Львове отказали в записи к врачу из-за русского языка
03.03.2026 22:05:56 | Life.ru

Цена нефти Brent на ICE замедлила рост до 3,3%
03.03.2026 22:05:40 | ТАСС

На юго-западе Москвы горят частный дом и бытовки
03.03.2026 22:03:19 | ТАСС

Спустя 16 лет актёр озвучки Джона Марстона прошёл Red Dead Redemption до конца и не сдержал эмоций
03.03.2026 22:02:03 | PlayGround.ru

Reuters: США не прибегают к посредничеству для организации контактов с Ираном
03.03.2026 22:01:29 | ТАСС

Украинская молодежь начала массово покидать страну
03.03.2026 22:01:07 | Lenta.ru

Россияне пустили в квартиры 146 мигрантов и поплатились
03.03.2026 22:00:38 | Lenta.ru

"Зенит" вышел в полуфинал "пути регионов" Кубка России по футболу
03.03.2026 22:00:37 | ТАСС

Названо число пострадавших от ударов Израиля и США иранских школьников
03.03.2026 22:00:17 | Lenta.ru

Правительство определило приоритеты в Год единства народов России
03.03.2026 21:59:35 | Life.ru

Отменённое DLC для Cyberpunk 2077 могло превзойти Phantom Liberty - считает креативный директор Cyberpunk 2
03.03.2026 21:59:25 | PlayGround.ru

КСИР заявил о новой масштабной волне ударов ракетами и БПЛА по Израилю
03.03.2026 21:57:49 | ТАСС

Фидан: формирование нового руководства в Иране может дать возможности для решения кризиса
03.03.2026 21:57:39 | ТАСС

Сийярто: деньги у Украины закончатся раньше, чем нефть у Венгрии
03.03.2026 21:56:28 | ТАСС

Владимир Путин разрешил продажу до 40% «Эльгаугля»
03.03.2026 21:56:06 | Коммерсантъ

Застрявшие в Дубае Медведев и Рублев покинули ОАЭ
03.03.2026 21:55:58 | РБК

ATP отменила два турнира в ОАЭ по соображениям безопасности
03.03.2026 21:55:11 | РБК

США отказались от посредничества третьих стран для контактов с Ираном
03.03.2026 21:54:19 | Lenta.ru

Франция направит вертолетоносец для эвакуации своих граждан с Ближнего Востока
03.03.2026 21:54:00 | Российская Газета

Fars: Совет экспертов Ирана скоро объявит имя нового лидера исламской республики
03.03.2026 21:53:30 | ТАСС

Израиль в течение дня сбросили на Иран больше бомб, чем за 12-дневную операцию 2025 года
03.03.2026 21:53:17 | ТАСС

ЦАХАЛ: Израиль за день сбросил на Иран больше бомб, чем за 12 дней войны в 2025 году
03.03.2026 21:53:17 | ТАСС

Politico узнало об идее США о военной защите танкеров в Ормузском проливе
03.03.2026 21:53:08 | РБК

Может ли Куба стать следующей целью Трампа
03.03.2026 21:52:59 | РБК

ВВС США выкупили у частника стекло для бомбардировщика B-2, проданное по недальновидности
03.03.2026 21:51:15 | Life.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro