Хабы: Python, Искусственный интеллект, Natural Language Processing
Здарова хабровчане! На связе лаборатория Вихрей, сегодня мы расскажем про наш бенчмарк, Шлёпа - большой русский бенчмарк
Что есть сейчас для оценки русскоязычных LLM
Mera - бенчмарк от Сбера, использует тесты и генерацию, сабмит через сайт, сайт почти не обновлялся с зимы. Почитать про него можно тут
Читать далее