MWS Vision Bench: первый русскоязычный бенчмарк для бизнес‑OCR в эпоху мультимодалок

info@vsetut.pro

Стать автором

Вернуться

09.10.2025 09:40:18 | Хабр

Хабы: Блог компании MWS AI, Искусственный интеллект, Машинное обучение, Управление разработкой

Мультимодальные LLM уже умеют «читать» документы — от договоров и таблиц до рукописей и диаграмм. Но измерять их качество на реальных бизнес‑сценариях негде и нечем, особенно если дело касается работы с тяжелым OCR-контентом на русском. Мы собрали MWS Vision Bench — бенчмарк из 5 практических заданий: полностраничный OCR (страница→текст), структурированный OCR (страница→markdown), grounding (координаты текста), KIE/JSON (извлечение ключей) и VQA (вопрос‑ответ). Размер: 800 изображений, 2580 вопросов (валидация - 1 302, тест - 1 278). Код и валидационный сплит открываем; приватный тест — по запросу. Повторить запуск можно менее чем за 1 час.

За подробностями

Подробнее

Читайте также

[Перевод] PEP 8 как религия: почему Python сам не соблюдает свои же правила
09.10.2025 09:30:52 | Хабр

[Перевод] Как работает Context Engineering в Claude и других агентах
09.10.2025 09:30:51 | Хабр

Как действовать, если вам нужно закрывать десятки (или сотни) вакансий каждый месяц
09.10.2025 09:24:14 | Хабр

Дизайн вне времени: как оставаться актуальным в эпоху перемен
09.10.2025 09:23:50 | Хабр

Как внедрить автоворонку и не потерять личный подход к клиенту
09.10.2025 09:23:33 | Хабр

Забудь про облачные подписки! Полный переход с Google Photos на Immich. Мой личный опыт
09.10.2025 09:00:42 | Хабр

От техлида до IT-директора: как растут лидеры в корпорациях
09.10.2025 09:00:39 | Хабр

Отжимания и другие упражнения, которые нарастят мышцы после 50 лет
09.10.2025 09:00:36 | ferra.ru

Как выбор стратегии внедрения IDM влияет на итоговый результат
09.10.2025 08:56:43 | Хабр

Вселенная как самопознающая нейросеть: гипотеза Виталия Ванчурина и её философские последствия
09.10.2025 08:55:13 | Хабр

Книга: «Грокаем структуры данных»
09.10.2025 08:54:23 | Хабр

Мониторинг истории активных сессий в базах данных
09.10.2025 08:46:29 | Хабр

Как мы автоматизировали парковку на хакатоне 2ГИС: BLE-маячки, безлимитные печеньки и топ-20
09.10.2025 08:42:14 | Хабр

Что требуется знать о семантическом версионировании (SemVer)
09.10.2025 08:41:54 | Хабр

Игровая реклама, которую мы потеряли
09.10.2025 08:40:47 | Хабр

[Перевод] Чёрная дыра, которая может переписать космологию
09.10.2025 08:40:34 | Хабр

День 1324: российский рынок грузовых автоперевозок в 2025 году вырастет только на 1%
09.10.2025 08:35:49 | vc.ru

Ученый из Google получил Нобелевскую премию 2025 года по физике
09.10.2025 08:25:35 | ferra.ru

В Казахстане нейросеть включили в совет директоров фонда «Самрук-Казына»
09.10.2025 08:18:34 | ferra.ru

Добавленный сахар и другие ингредиенты, которые сделают протеиновый батончик вредным для здоровья
09.10.2025 08:15:55 | ferra.ru

2-нм чипы TSMC подорожают лишь на 10–20%, а не на 50%
09.10.2025 08:11:33 | ferra.ru

Мини-ПК DGX Spark с ИИ от NVIDIA снова не вышел — задержка превысила полгода
09.10.2025 08:04:33 | ferra.ru

Подход к анализу требований в проектах внедрения ERP-систем
09.10.2025 08:00:25 | Хабр

BI в закрытом контуре: технические вызовы развертывания и эксплуатации
09.10.2025 08:00:19 | Хабр

ReVu — Open Source AI-ревьюер для ваших Pull Request
09.10.2025 08:00:06 | Хабр

Вышла Left 4 Dead RTX NTD — кампания «No Mercy» получила поддержку трассировки лучей
09.10.2025 07:57:33 | ferra.ru

Microsoft добавила Hogwarts Legacy и Ninja Gaiden 4 в Xbox Game Pass
09.10.2025 07:43:32 | ferra.ru

Vivaldi 7.6 для мобильных устройств — Всё в ваших руках
09.10.2025 07:36:59 | Хабр

Почему ваш код похож на вашу оргструктуру: история о кувалде, микросервисах и 4000 китайских стартапов
09.10.2025 07:35:22 | Хабр

[Перевод] «Эффект неудачника». Как мозг переобучается после поражений и можем ли мы на это повлиять?
09.10.2025 07:32:40 | Хабр

HMD представила Touch 4G — гибрид кнопочного телефона и смартфона с облачными приложениями
09.10.2025 07:29:31 | ferra.ru

Грядущий Intel Panther Lake будет на 50% мощнее и на 30% энергоэффективнее предшественника
09.10.2025 07:22:31 | ferra.ru

Оптимизация источников данных для ML моделей
09.10.2025 07:16:17 | Хабр

В сеть «слили» фото Galaxy S26 Ultra в ярко-оранжевом цвете как у iPhone 17 Pro
09.10.2025 07:15:30 | ferra.ru

Накануне крупная DDoS-атака парализовала Steam, PlayStation Network и EA — кто стоит за атакой
09.10.2025 07:08:30 | ferra.ru

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Иран вновь атаковал военную базу американцев в Ираке
07.03.2026 00:56:12 | Lenta.ru

Сейсмолог допустила сильное землетрясение в Сочи в обозримом будущем
07.03.2026 00:56:06 | Lenta.ru

Иравани: Свыше 180 детей в Иране погибли в результате ударов США и Израиля
07.03.2026 00:54:51 | Life.ru

Пезешкиан в разговоре с Путиным попросил поддержать права Тегерана на международной арене
07.03.2026 00:52:41 | ТАСС

ВС США утверждают, что с начала конфликта потопили или повредили 43 иранских корабля
07.03.2026 00:51:39 | ТАСС

Al-Markaziya: из-за израильских авиаударов за сутки погибли 30 ливанцев
07.03.2026 00:48:56 | ТАСС

Дмитриев уверен, что энергетические провалы будут преследовать фон дер Ляйен
07.03.2026 00:48:18 | Life.ru

США могут принять решение о смягчении санкций в отношении нефти РФ
07.03.2026 00:47:51 | ТАСС

В Ульяновской области ввели беспилотную опасность
07.03.2026 00:47:02 | ТАСС

Чёрный квадрат, особняк за 170 млн и разнос народников: почему Лазарев вечно в центре скандалов
07.03.2026 00:45:00 | Life.ru

Глава МПК назвал Паралимпийскую деревню примером модели для общества
07.03.2026 00:43:55 | ТАСС

Иравани: Жертвами ударов в Иране стали не менее 1332 мирных жителей
07.03.2026 00:43:29 | Life.ru

Постпред Ирана призвал страны ООН осудить агрессию в адрес исламской республики
07.03.2026 00:43:28 | ТАСС

Лидеры Британии и Саудовской Аравии обсудили расширение обмена разведданными
07.03.2026 00:41:30 | ТАСС

Иран обвинил США в ударах по школам и больницам
07.03.2026 00:39:54 | Lenta.ru

В Китае рассказали о помогающих России действиях Трампа на Ближнем Востоке
07.03.2026 00:39:22 | Lenta.ru

Огонь Паралимпийских игр 2026 года зажгли на церемонии открытия в Италии
07.03.2026 00:34:40 | Life.ru

США запустят программу по страхованию судов в Персидском заливе
07.03.2026 00:33:23 | ТАСС

Сотрудников посольства Азербайджана эвакуировали из Ирана
07.03.2026 00:33:00 | Lenta.ru

Россиян призвали не ездить через Шри-Ланку из-за обострения на Ближнем Востоке
07.03.2026 00:25:30 | ТАСС

Россиян призвали не рассматривать Шри-Ланку как транзитный пункт
07.03.2026 00:25:30 | ТАСС

У берегов Швеции задержали грузовое судно под гвинейским флагом
07.03.2026 00:25:23 | ТАСС

Иран назвал число погибших в ходе атак США и Израиля мирных жителей
07.03.2026 00:25:21 | Lenta.ru

Меликов доложил Путину о пятилетних итогах развития Дагестана
07.03.2026 00:24:44 | Life.ru

Байден похвастался своей забывчивостью
07.03.2026 00:23:44 | Lenta.ru

Головин забил Сафонову
07.03.2026 00:21:41 | Lenta.ru

Кувейт заявил об уничтожении 14 запущенных из Ирана ракет
07.03.2026 00:20:22 | ТАСС

Льготы на транспорт для пенсионеров. Кто сможет не платить за проезд в 2026 году и какие выплаты можно снизить
07.03.2026 00:20:00 | Life.ru

В Германии школьника обвинили в оскорблении Мерца из-за плаката на демонстрации
07.03.2026 00:18:12 | Life.ru

Постпред при ООН: Иран не позволит иностранным силам вмешиваться во внутренние дела страны
07.03.2026 00:15:54 | ТАСС

Постпред при ООН: Иран не позволит иностранным силам вмешиваться в его дела
07.03.2026 00:15:54 | ТАСС

Постпред при ООН: Иран не бьет по гражданским
07.03.2026 00:14:52 | ТАСС

На Украине сотрудники ТЦК забрали мужчину с эпилепсией на пути в больницу
07.03.2026 00:13:17 | Lenta.ru

Астрономы обнаружили потенциально обитаемую планету поблизости от Земли
07.03.2026 00:12:30 | Life.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro