SLAVA — бенчмарк социально‑политического ландшафта и ценностного анализа

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

SLAVA — бенчмарк социально‑политического ландшафта и ценностного анализа

17.06.2025 13:56:11 | Хабр

Хабы: Искусственный интеллект, GitHub, Natural Language Processing

Большой обзор: от идеи и структуры — до неожиданных выводов и практических сценариев применения

SLAVA — это открытый русскоязычный бенчмарк, разработанный экспертами РАНХиГС и ИСП РАН для проверки, как большие языковые модели справляются с фактологическими и ценностно нагруженными вопросами по истории, обществознанию, географии и политологии.

В корпусе — 14 199 заданий пяти форматов и трёх уровней провокационности. Уже протестировано более 40 моделей: от GPT‑4o и Claude‑3.5 до GigaChat и Llama‑3 8B. Это открытый русскоязычный бенчмарк, созданный для проверки, как большие языковые модели справляются с фактологическими и ценностно нагруженными вопросами из истории, географии, обществознания и политологии.

Мы расскажем:

Читать далее

Подробнее

Читайте также

В России выросли продажи умных часов для детей перед каникулами
17.06.2025 13:41:53 | ferra.ru

Слайды вместо фактов: как Infinite Reality без продукта «поднял» $3 миллиарда — и все поверили
17.06.2025 13:37:46 | Хабр

Миндальная и другие полезные для похудения виды муки
17.06.2025 13:30:09 | ferra.ru

Регистрация программного обеспечения в Роспатенте или Минцифры: что лучше в 2025 году
17.06.2025 13:08:09 | Хабр

В России создали малотоксичное противораковое соединение
17.06.2025 13:03:53 | ferra.ru

В «Яндекс Книги» добавили функцию пересказа предыдущих глав
17.06.2025 13:02:57 | vc.ru

WSJ: смартфон T1 от семейной компании Дональда Трампа вряд ли будут производить в США
17.06.2025 13:02:54 | vc.ru

Что такое CDN и как она работает: объяснение на примере доставки котиков
17.06.2025 13:01:04 | Хабр

Функциональное и объектно-ориентированное проектирование
17.06.2025 12:56:13 | Хабр

Неработающие принципы Agile. Когда Agile не принесет ожидаемого эффекта
17.06.2025 12:51:22 | Хабр

Корица и другие специи, которые ускорят метаболизм и помогут сбросить вес
17.06.2025 12:45:23 | ferra.ru

[Перевод] 5 техник, применяемых в анализе временных рядов, которые должен знать каждый. Часть 1
17.06.2025 12:39:57 | Хабр

Азы контейнеризации: namespaces и cgroups
17.06.2025 12:19:00 | Хабр

Создание плагина для Keycloak: Загрузка пользователей из внешнего API
17.06.2025 12:17:16 | Хабр

Газпромбанк вошёл в состав совладельцев Cognitive Pilot
17.06.2025 12:03:42 | it-world

Искусственный интеллект, прощай безопасность! И это не то, о чем вы сейчас подумали
17.06.2025 12:02:40 | Хабр

Электронный компромисс: США и Китай смягчают взаимные ограничения
17.06.2025 12:00:52 | Хабр

Помидоры, персики и не только: названы полезные для сердца летние овощи и фрукты
17.06.2025 12:00:45 | ferra.ru

мы внедрили Telegram-бота с ИИ в федеральной компании
17.06.2025 11:51:42 | Хабр

Любовь, платежи и профит: как романтическая игра внедрила новый Pay SDK от RuStore
17.06.2025 11:34:55 | Хабр

Что такое eSIM и как она меняет мобильную связь в России
17.06.2025 11:32:02 | it-world

Параллельный импорт в августе снова поредеет
17.06.2025 11:28:53 | it-world

Анемичные модели с логикой в сервисах: плюсы и минусы одного из самых популярных подходов к разработке на PHP
17.06.2025 11:21:38 | Хабр

Витамины, минералы, клетчатка: какие питательные вещества снизят риск развития деменции
17.06.2025 11:15:55 | ferra.ru

strlen() vs mb_strlen(): Почему 71% PHP-разработчиков ошибаются
17.06.2025 11:11:48 | Хабр

Как купец из Архангельска нефть добывал
17.06.2025 11:00:41 | Хабр

Как мы учили нейросеть отвечать на вопросы
17.06.2025 10:49:00 | Хабр

Функциональное программирование в Android. Знакомство с парадигмой
17.06.2025 10:42:31 | Хабр

100-минутная ходьба в день помогла защититься от болей в пояснице
17.06.2025 10:30:53 | ferra.ru

«Лаборатория Касперского» запустила eSIM для интернета за рубежом
17.06.2025 10:23:03 | it-world

Как мы распилили монолит на микрофронтенды с Vite и не сошли с ума
17.06.2025 10:19:44 | Хабр

Тысячи часов экономии для UX-исследователя: как мы научили ИИ делать рутину (и наши системные промты)
17.06.2025 10:19:38 | Хабр

Взгляд со стороны: зачем айтишнику идти в гору 3 дня, вставать в 6 утра и любить позу голубя
17.06.2025 10:19:22 | Хабр

Почему Exceptions в Java не взлетели — и что с этим делать в 2025 году
17.06.2025 10:19:21 | Хабр

Как Музей криптографии сохраняет цифровое искусство и технологии
17.06.2025 10:17:52 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Ключевые события эскалации на Ближнем Востоке к этому часу
07.03.2026 07:36:12 | Life.ru

Россиянам назвали приводящие к налоговым проверкам действия
07.03.2026 07:30:47 | Lenta.ru

Красносельский: Молдавия не решит проблему Приднестровья, не считаясь с ним
07.03.2026 07:29:13 | ТАСС

США решили перебросить на Ближний Восток третий ударный авианосец
07.03.2026 07:26:28 | Lenta.ru

Глава МИД Италии опозорился, объявив 31 февраля датой начала атаки на Иран
07.03.2026 07:25:59 | Life.ru

Опасность атаки БПЛА и режим "Ковер" отменили в Самарской области
07.03.2026 07:23:18 | ТАСС

Эксперт Антипов допустил снижение активнисти рынка недвижимости в Дубае
07.03.2026 07:22:58 | ТАСС

OneTwoTrip: вдвое больше россиян предпочтут вузы Москвы Оксфорду и Кембриджу
07.03.2026 07:22:12 | ТАСС

Администрация Дубая сообщила об инциденте из-за падения обломков сбитой цели
07.03.2026 07:21:58 | ТАСС

Четыре человека устроили перестрелку в Дагестане из-за денег, двое ранены
07.03.2026 07:21:04 | Life.ru

В "Опорах России" рассказали о предпочтениях предпринимательниц на 8 Марта
07.03.2026 07:18:51 | ТАСС

В Киеве предсказали возвращение на Украину только ненужных Европе беженцев-пенсионеров
07.03.2026 07:18:45 | Lenta.ru

AFP: в Дубае и Манаме произошли взрывы
07.03.2026 07:17:52 | ТАСС

Ничушкин забросил шайбу и победный буллит в матче НХЛ с "Далласом"
07.03.2026 07:14:02 | ТАСС

Эксперт Вароли: иностранные журналисты могут защитить россиян от пропаганды Запада
07.03.2026 07:13:45 | ТАСС

Епископ Иннокентий: сладкое и морепродукты можно есть в Великий пост на 8 Марта
07.03.2026 07:11:27 | ТАСС

В Иране произошло землетрясение магнитудой 4,1
07.03.2026 07:11:15 | ТАСС

В Дубае произошёл взрыв на американской военной базе
07.03.2026 07:09:43 | Life.ru

В СФ рассказали о мошенничестве с QR-кодом от "налоговой"
07.03.2026 07:08:46 | ТАСС

В РФ число разводов в семьях с детьми стало самым низким за 20 лет
07.03.2026 07:08:15 | ТАСС

В РФ в 202 году число разводов в семьях с детьми стало самым низким за 20 лет
07.03.2026 07:08:15 | ТАСС

В Москве поздравления женщинам с 8 Марта разместили на дорожных табло
07.03.2026 07:05:08 | ТАСС

Туадера: ЦАР сделает упор на экономическое сотрудничество с Россией
07.03.2026 07:01:10 | ТАСС

В Дубае вновь произошли взрывы
07.03.2026 07:01:02 | Lenta.ru

На Украине испугались последствий конфликта на Ближнем Востоке
07.03.2026 07:00:35 | Lenta.ru

Россиянки рассказали о недовольстве зарплатой
07.03.2026 07:00:15 | Lenta.ru

Fox: третий авианосец ВМС США готовится к отправке на Ближний Восток
07.03.2026 07:00:08 | ТАСС

"Изначально готовы к серьезным испытаниям": как девушки-машинисты работают в метро
07.03.2026 07:00:01 | ТАСС

Только 8% мужчин в России помогают жене по дому, «чтобы не орала», остальные делают это добровольно
07.03.2026 07:00:00 | Life.ru

AFP: взрыв прогремел в Иерусалиме
07.03.2026 06:59:09 | ТАСС

AFP: в Иерусалиме произошел взрыв
07.03.2026 06:59:09 | ТАСС

Компактный неубиваемый зверь с огромным аккумулятором. OnePlus 15T показал возможности до анонса
07.03.2026 06:59:00 | iXBT.com

CNN узнала о данных разведки США о планах Китая помочь Ирану
07.03.2026 06:58:51 | РБК

Пять регионов России преодолели планку средней зарплаты в 200 тысяч рублей
07.03.2026 06:55:08 | Life.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro