Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Pollux: LLM-as-a-judge для русского

19.05.2026 09:00:56 | Хабр

Хабы: Блог компании Сбер, Natural Language Processing, Машинное обучение, Искусственный интеллект, Open source

Прошло несколько лет с тех пор, как нейросетевые модели стали применимы в генерации текста. Сегодня языковые модели уверенно решают задачи написания кода, поддержки диалогов и планирования маршрутов. Тем не менее, до сих пор не сложилось универсального подхода для валидации LLM перед их внедрением в цифровые продукты.

Но у нас есть решение! В этой статье я расскажу, как мы в Sber AI обучили специализированного LLM-судью (LLM-as-a-Judge) Pollux для оценки русскоязычных LLM. Мы выложили его в открытый доступ и вы можете встроить его в свой продукт уже сегодня.

Читать далее и оценивать

Подробнее

Читайте также

YARL: как мы развиваем распределённый Rate Limiter
19.05.2026 09:00:54 | Хабр

М.Видео открыла предзаказ на ультратонкий планшет HUAWEI MatePad Mini
19.05.2026 09:00:47 | ferra.ru

Realme 16 5G с «зеркалом» рядом с камерами вышел в России
19.05.2026 09:00:44 | ferra.ru

Выгорание — главная IT-эпидемия нашей бытности
19.05.2026 09:00:32 | Хабр

Строим машину времени для данных (SCD-2) на движке Trino под управлением Airflow
19.05.2026 08:59:51 | Хабр

Почему 4 сеньёра могут быть эффективнее команды из 15 человек
19.05.2026 08:58:52 | Хабр

ИИ не разгружает сотрудников. Он просто повышает планку ожиданий
19.05.2026 08:55:58 | Хабр

«Норма» как закономерный результат закона о норме
19.05.2026 08:54:47 | Хабр

Устройства дополненной реальности в патентах на изобретения (в мире и в России)
19.05.2026 08:48:27 | Хабр

Не могла найти стильную одежду 60-го размера — и создала бренд с оборотом 1,7 млн рублей
19.05.2026 08:30:07 | Хабр

Тянем-потянем, вытянуть не можем. Или можем? ;-)
19.05.2026 08:24:32 | Хабр

День 1546: спрос на деловые поездки в Санкт-Петербург в дни проведения ПМЭФ снизился вдвое год к году
19.05.2026 08:22:29 | vc.ru

Агент — это не новый пользователь. Это новый посредник. Что медицина знает об этом 100 лет
19.05.2026 08:00:22 | Хабр

Цены на SSD в Японии взлетели втрое. Разбираемся, что происходит
19.05.2026 08:00:19 | Хабр

Почему нельзя штрафовать за непропуск пешеходов?
19.05.2026 07:51:18 | Хабр

Кинематика вместо нейросетей: швейцарский фреймворк против vendor lock-in в робототехнике
19.05.2026 07:50:47 | Хабр

Миграции конфигурации Битрикс24 CRM: как мы перестали делать это руками
19.05.2026 07:45:43 | Хабр

Honor 600 для Китая оснастят 7-кратным зумом и селфи-камерой с 4K
19.05.2026 07:42:42 | ferra.ru

Лидогенерация девелопера в 2026 году: как продвигать недвижимость в новых условиях
19.05.2026 07:41:00 | Хабр

Полиморфные ссылки в реляционных базах данных, или об ещё одном узком месте в 1С
19.05.2026 07:40:16 | Хабр

От карантина до нейтрализации: автоматика против фишинга
19.05.2026 07:36:43 | Хабр

DoH на роутере OpenWRT, Mikrotik и Asus: пошаговая инструкция от того, кто сам хостит резолвер
19.05.2026 07:34:14 | Хабр

Сквозная аутентификация в Linux: настройка Kerberos, интеграция с браузером и автоматизация через Keytab
19.05.2026 07:33:23 | Хабр

Владимир Крылов: «Считать современные LLM просто предсказателями токенов — это техническая безграмотность»
19.05.2026 07:01:07 | Хабр

Создание и сохранение типовых обвязок отопительных приборов в базе данных nanoCAD BIM Отопление
19.05.2026 07:01:07 | Хабр

Что вы не знаете о СНИЛС – и почему это самый важный документ
19.05.2026 07:00:07 | Хабр

Что находится внутри бесплатной части курса «Системный аналитик»
19.05.2026 07:00:06 | Хабр

[Перевод] Промпты — это рекомендации, а не правила. Структура — это обязательное условие
19.05.2026 06:55:00 | Хабр

Зеленые потоки Celery. Gevent и Eventlet
19.05.2026 06:49:59 | Хабр

Мои новые правила найма в ИТ
19.05.2026 06:45:14 | Хабр

Самовлюблённые числа: когда нарциссизм и бесполезность вдохновляют
19.05.2026 06:41:08 | Хабр

SUM() OVER (ORDER BY...) считает не то, что вы думаете: кадр оконной функции
19.05.2026 06:40:57 | Хабр

Пользовательское соглашение на сайт: когда нужно и что учесть, чтобы защитить владельца сайта?
19.05.2026 05:58:05 | Хабр

Как я совмещаю работу в ИТ и спорт
19.05.2026 05:56:47 | Хабр

«Сундук полиглота» — еще одно приложение для изучения языков
19.05.2026 05:48:46 | Хабр

Смотреть все

НОВОСТИ

Армия Израиля заявила о нанесении ударов по складам оружия ХАМАС в Газе
01.08.2026 19:08:03 | ТАСС

Зоидзе: мировой футзал станет богаче после возвращения сборной России
01.08.2026 19:02:36 | ТАСС

Альпинист-рекордсмен Нирмал Пурджа погиб под лавиной в Пакистане
01.08.2026 19:01:00 | Российская Газета

Синхронистки Дорошко и Шмидт завоевали бронзу ЧЕ в произвольной программе дуэтов
01.08.2026 19:00:08 | ТАСС

У российской аспирантки в грузинском СИЗО случился гипертонический криз
01.08.2026 18:58:45 | Life.ru

Эксперт заявил о работе российской спутниковой сети «Рассвет» над Украиной
01.08.2026 18:57:44 | Life.ru

Племянник Карапетяна возглавил фракцию "Сильная Армения" в новом парламенте
01.08.2026 18:57:17 | ТАСС

УЕФА начал искать замену президенту ФИФА Инфантино
01.08.2026 18:56:01 | Life.ru

Штурмовые отряды идут вперёд: Белоусов сообщил о продвижении Армии России на Запорожье
01.08.2026 18:54:42 | Life.ru

Российские синхронисты заявили, что их засудили в микст-дуэте на ЧЕ
01.08.2026 18:53:36 | РБК

Замглавы «Газпром энергохолдинг — закупки» Моисеенко арестовали по делу о взятке
01.08.2026 18:53:35 | Life.ru

В Приангарье до конца августа благоустроят памятник участникам СВО и сквер
01.08.2026 18:53:01 | ТАСС

В Запорожье поднимается столб дыма
01.08.2026 18:52:57 | ТАСС

Синхронист Трофимов отметил, что в бассейне на ЧЕ много хлорки
01.08.2026 18:51:25 | ТАСС

Ученые впервые оценили состояние популяции кумжи на Соловках
01.08.2026 18:50:22 | ТАСС

Биолог рассказал об опасности встречи с лисами
01.08.2026 18:49:45 | Lenta.ru

Синхронист Трофимов не ожидал, что останется без медали в дуэтах на ЧЕ
01.08.2026 18:48:28 | ТАСС

Сотрудник МЧС ДНР ранен при атаке дрона в Волновахском районе
01.08.2026 18:46:23 | Life.ru

Плакал и предлагал деньги: Стало известно о новых жертвах иркутского психолога-домогателя, среди них — мужчины*
01.08.2026 18:46:12 | Life.ru

Samsung предупредила: дефицит памяти продлится до 2028 года
01.08.2026 18:46:00 | iXBT.com

Кадры взрыва грузовика после аварии в Пермском крае. Видео
01.08.2026 18:45:54 | РБК

Топор XV века и украшения обнаружили на месте Борисоглебского храма в Великом Новгороде
01.08.2026 18:44:55 | ТАСС

В КОНКАКАФ призвали проанализировать вопрос о пребывании Инфантино в ФИФА
01.08.2026 18:43:33 | ТАСС

В Пермском крае грузовик взорвался после аварии
01.08.2026 18:43:11 | РБК

Mechanics VoiceOver успешно завершила сбор на Cronos: The New Dawn
01.08.2026 18:42:10 | PlayGround.ru

В ВСУ рассказали о беззащитном Киеве
01.08.2026 18:41:36 | Lenta.ru

В Днепропетровской области повреждены предприятие и АЗС
01.08.2026 18:40:57 | ТАСС

Игрок "Родины" Сокол верит, что клубу по силам сохранить прописку в РПЛ
01.08.2026 18:39:55 | ТАСС

Удары по портам добрались до банков: На Украине предупредили о проблемах у бизнеса
01.08.2026 18:38:22 | Life.ru

При атаках дронов ВСУ на Белгородскую область 1 августа ранены четыре человека
01.08.2026 18:37:48 | Life.ru

Полиция установила участников стрельбы с питбайкерами в Калуге
01.08.2026 18:35:40 | Life.ru

Российского топ-менеджера арестовали
01.08.2026 18:33:31 | Lenta.ru

Гашек обвинил IIHF в трусости после продления отстранения российских хоккеистов
01.08.2026 18:33:01 | Life.ru

ТАСС: ЕС созывает экстренную видеоконференцию глав МВД по кризису в Сеуте
01.08.2026 18:31:28 | ТАСС

Snapdragon 8 Elite обходит по производительности Snapdragon 8 Elite Gen 5 и Apple A19 Pro, но есть нюанс — для этого нужно установить башенный кулер
01.08.2026 18:30:00 | iXBT.com

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro