Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Как мы оценивали OCR на русских документах — и почему все, что «распозналось», можно читать без смеха

24.04.2026 12:30:27 | Хабр

Хабы: Блог компании 43Tech, Искусственный интеллект, Обработка изображений, Подготовка технической документации

Каждый день через системы «Честного знака» проходят тысячи страниц: контракты, акты, техдокументация, анкеты. Всё это нужно не просто перевести в текст — а сразу пустить в работу: поиск, анализ, генерация выжимок, передача в другие сервисы. Одна ошибка OCR — и вместо «субподрядчика» система получает «cy6пoдpялчика», а дальше никакие регулярки не спасут.

Меня зовут Искандер, я - AI-инженер в Лаборатории искусственного интеллекта «Честного знака». Мы протестировали лучшие open-source OCR-движки на реальных русскоязычных документах — от простых текстов до многостраничных PDF со сложными таблицами и изображениями. Специфика задачи: кириллица, широкий разброс форматов, нулевая терпимость к ошибкам на продакшне.

Чтобы получить честные результаты, мы собрали собственный модуль тестирования и сформировали репрезентативный датасет из 6 наборов реальных документов. В статье — методология, метрики и то, кто из движков реально справился, а кто только обещал «максимальную точность даже на луне».

Читать далее

Подробнее

Читайте также

Алексей Молодых, МАРМП: рынок e-commerce окончательно входит в фазу стабилизации и замедления
24.04.2026 12:26:00 | it-world

Tesla начала массовое производство электромобиля Cybercab — двухдверного седана с двумя сиденьями без руля и педалей
24.04.2026 12:24:54 | vc.ru

Работа с легаси кодом: не переписывать, а приручить
24.04.2026 12:24:31 | Хабр

«Геоскан» запустил цифровую платформу «Пионер хаб» для обучения робототехнике
24.04.2026 12:22:36 | ferra.ru

Gemini (Джимини) нейросеть: выбор версии в 2026 году и сценарии использования в работе
24.04.2026 11:53:25 | Хабр

VPN и облака разгоняют рост зарубежного трафика в российских сетях
24.04.2026 11:44:24 | it-world

Реализация автоудаления блокирующих сессий в MS SQL
24.04.2026 11:40:28 | Хабр

Лечим загрузчик часов Redmi Watch 5 от падений
24.04.2026 11:24:37 | Хабр

Смартфон Vivo Y600 Pro с аккумулятором на 10 200 мА·ч представят 27 апреля
24.04.2026 11:23:17 | ferra.ru

Suricata IPS NFQueue with nDPI. Часть I
24.04.2026 11:15:56 | Хабр

Перестановка наличных: что это значит и как работает в 2026 году
24.04.2026 11:10:25 | Хабр

В рекламную платформу «Т-Банка» добавили возможность таргетинга рекламы на сторонних площадках
24.04.2026 11:01:48 | vc.ru

«ВКонтакте» добавила возможность подключать донаты на личных страницах пользователей
24.04.2026 11:00:02 | vc.ru

Китайский DeepSeek показал самую мощную открытую модель
24.04.2026 10:57:22 | it-world

Российские СУБД выходят на этап зрелости и готовятся к ускоренному росту
24.04.2026 10:53:41 | it-world

Переаккредитация ИТ-компаний в 2026 году. Что изменилось?
24.04.2026 10:47:56 | Хабр

Поиск и устранение коллизий в архитектурной модели в рамках nanoCAD BIM Строительство
24.04.2026 10:41:06 | Хабр

Как стартовать в 1С, если курсы пройдены, а на работу не берут?
24.04.2026 10:34:46 | Хабр

Интеграция MULTIDIRECTORY и MULTIFACTOR: двухфакторная аутентификация в Kerberos
24.04.2026 10:08:15 | Хабр

Озвучка текста голосом ИИ: нейросеть для озвучки онлайн
24.04.2026 09:50:49 | Хабр

Нейросеть для аудио: Топ-4 нейросетей для генерации аудио
24.04.2026 09:48:52 | Хабр

Промты ChatGPT для фото и картинок: обработка и улучшение изображений с помощью чат GPT
24.04.2026 09:46:16 | Хабр

Какую видеокарту под какой бюджет купить: иерархия лучших GPU с российскими ценами
24.04.2026 09:37:23 | Хабр

Глухарь ESPшный — мемуары охотника
24.04.2026 09:28:12 | Хабр

Oppo выпустила компактные часы с eSIM Watch X3 Mini
24.04.2026 09:23:16 | ferra.ru

DLSS 5: будущее игровой индустрии или тупик?
24.04.2026 09:16:53 | Хабр

Разворачиваем RAG на Java без боли: практический гайд
24.04.2026 09:15:51 | Хабр

Как я разрабатывал отказоустойчивый промышленный контроллер. Ч1
24.04.2026 09:15:48 | Хабр

[Перевод] Книга «Изучаем DDD — предметно-ориентированное проектирование». Подробный читательский обзор
24.04.2026 09:15:26 | Хабр

Первое решение суда поразило всех, но второе оказалось еще хлеще: иск на 766 000 000 ₽ за надпись «Я люблю свою семью»
24.04.2026 09:14:09 | Хабр

Kawai-Focus 2.6: путь к MVP1 — создание экрана Таймер
24.04.2026 09:00:34 | Хабр

Архитектура тестового фреймворка
24.04.2026 08:50:24 | Хабр

AI в iOS-разработке: что у меня реально закрепилось в 2026, а что я выкинул
24.04.2026 08:15:13 | Хабр

День 1520: налоговые поступления от малого бизнеса и самозанятых в первом квартале 2026-го сократились на 22,2% год к году
24.04.2026 08:15:06 | vc.ru

Новинки КОМПАС-3D v24 Home
24.04.2026 08:11:04 | Хабр

Смотреть все

НОВОСТИ

Женатый мужчина завел трех любовниц и выманил у них 90 миллионов рублей
13.06.2026 16:30:43 | Lenta.ru

«Дополнительная нагрузка»: Названа неочевидная причина быстрой разрядки смартфона
13.06.2026 16:30:31 | Life.ru

ВС России уничтожили пункты дислокации ВСУ в Сумах
13.06.2026 16:28:07 | Lenta.ru

В День России в Москве прошёл концерт классической музыки с «ожившими» картинами
13.06.2026 16:26:45 | Life.ru

На Украине рассказали о масштабных изменениях в армии
13.06.2026 16:26:41 | Lenta.ru

Директор женского "Спартака" Терехова назвала исторической победу в cуперкубке
13.06.2026 16:26:37 | ТАСС

Половину украинских штурмовиков захотели набрать из наемников-иностранцев
13.06.2026 16:26:00 | Lenta.ru

Цивилева заявила о важности поддержки действующих военнослужащих с инвалидностью
13.06.2026 16:24:01 | ТАСС

Мелони нашла переговорщика по Украине с Россией
13.06.2026 16:24:00 | Lenta.ru

Сергей Лавров встретится в Беларуси с Лукашенко и Рыженковым
13.06.2026 16:24:00 | Российская Газета

Кремль, Гагарин и медведь: Мурал-рекордсмен о России появился на школе в Уругвае
13.06.2026 16:21:04 | Life.ru

Голикова: в Донбассе и Новороссии 1,9 млн человек проходят диспансеризацию
13.06.2026 16:19:17 | ТАСС

Иностранные авиакомпании стали больше заправляться в аэропортах России
13.06.2026 16:18:24 | ТАСС

Голикова: в Донбассе и Новороссии в три раза выросла доступность медпомощи
13.06.2026 16:16:42 | ТАСС

ВСУ вновь атаковали транспортный цех ЗАЭС: сгорели два авто, повреждены колонки
13.06.2026 16:15:52 | Life.ru

«Герани» поразили цеха по производству беспилотников ВСУ в Харьковской области
13.06.2026 16:15:52 | Life.ru

Россиянка Миронова в 16-й раз выиграла чемпионат мира по бильярду
13.06.2026 16:15:11 | ТАСС

Число пострадавших в ДТП с грузовиком и маршруткой в Подмосковье выросло до 14
13.06.2026 16:11:56 | ТАСС

Число пострадавших в ДТП с грузовиком и маршруткой в Подмосковье увеличилось до 14
13.06.2026 16:11:56 | ТАСС

В Башкирии 14-летнего подростка зарезали ради пакета с продуктами
13.06.2026 16:10:59 | Коммерсантъ

Общий щит от рестрикций: Москва и Минск готовят ответ Западу
13.06.2026 16:08:53 | Life.ru

В Херсонской области пять компаний получили статус социального предприятия
13.06.2026 16:08:35 | ТАСС

Турция выделит $10 млрд частных инвестиций на проекты внедрения ИИ
13.06.2026 16:08:33 | ТАСС

В Красноярском крае двухлетний ребёнок утонул в септике на участке
13.06.2026 16:08:25 | Life.ru

США сократят в Европе количество бомбардировщиков и ударных БПЛА
13.06.2026 16:08:00 | Российская Газета

Euronews: Никто в Евросоюзе не готов сказать ничего хорошего про Каллас
13.06.2026 16:07:00 | Российская Газета

В Херсонской области из-за ударов ВСУ пострадали два человека
13.06.2026 16:06:01 | ТАСС

Один человек погиб и 12 пострадали в ДТП с КамАЗом и маршруткой в Подмосковье
13.06.2026 16:05:11 | Life.ru

AMD заменила повреждённый процессор Ryzen 9 7950X3D после вмешательства блогеров - но только после скандала
13.06.2026 16:03:21 | PlayGround.ru

В Дагестане спасли двух человек на сапбордах в Каспийском море
13.06.2026 16:00:24 | ТАСС

Миклухо-Маклай-младший вернул собранные предком останки папуасов на родину
13.06.2026 16:00:00 | Российская Газета

МИД Ирана: подписание меморандума с США 14 июня не состоится
13.06.2026 15:59:29 | ТАСС

МИД Ирана: подписание меморандума об урегулировании конфликта с США не произойдет 14 июня
13.06.2026 15:59:29 | ТАСС

13 человек пострадали в ДТП под Москвой
13.06.2026 15:57:59 | Lenta.ru

Босая девушка вместо президента: Шейнбаум отдала билет на ЧМ юной футболистке и устроила народный праздник
13.06.2026 15:57:58 | Life.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro