Швейцарский ножик для распознавания речи

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Швейцарский ножик для распознавания речи

03.03.2026 16:00:14 | Хабр

Хабы: Python, TypeScript, Habr, Звук

ASR-системы в проде - это тяжёлые, специализированные решения под конкретные сценарии. Но что делать, если нужен универсальный инструмент, который умеет распознать длинное аудио, диаризовать спикеров, обработать пачку файлов и при этом не требует целого GPU кластера?

В этой серии статей я разбираю, как собрать «швейцарский ножик» для распознавания речи на базе Whisper: выбрать модель, победить галлюцинации, стабилизировать обработку длинных аудио и выжать максимум из обычной видеокарты.

Первая часть - про выбор ASR, оптимизацию инференса и практические грабли, с которыми сталкиваешься, когда пытаешься превратить open-source модель в рабочий инструмент.

Читать далее

Подробнее

Читайте также

Тест-кейсы из функциональных требований
03.03.2026 16:00:12 | Хабр

Эксперимент по поиску brain wallets: проверяем топ популярных паролей на живых Bitcoin-кошельках
03.03.2026 15:51:44 | Хабр

Россиянам усложняют снятие наличных в кассах банков
03.03.2026 15:37:22 | it-world

Xiaomi сделала гиперкар для симулятора Gran Turismo 7 на PlayStation
03.03.2026 15:34:06 | ferra.ru

Xiaomi пообещала, что напольная лампа Vertical Study Lamp 2 прослужит до 17 лет
03.03.2026 15:33:14 | ferra.ru

Как завайбкодить аналоговую педаль для гитары
03.03.2026 15:00:38 | Хабр

Разработчик создал приложение Nearby Glasses, которое уведомляет пользователей, когда поблизости появляется человек в «умных» очках
03.03.2026 14:52:11 | vc.ru

Как ускорить тесты проекта в 6 раз: от 10 минут к 101 секунде
03.03.2026 14:51:59 | Хабр

Паттерны проектирования
03.03.2026 14:36:50 | Хабр

«Москвич» раскрыл цены на свои новые кроссоверы — от 2,7 млн рублей
03.03.2026 14:32:08 | vc.ru

Скам для айтишников. Вредоносные репозитории в процессе найма
03.03.2026 14:30:56 | Хабр

Как обычному разработчику попасть в open source и стоит ли это делать
03.03.2026 14:23:55 | Хабр

Маркетплейсы убили мои продажи — а теперь я зарабатываю 1,7 млн, печатая на их товаре
03.03.2026 14:20:43 | Хабр

Бросил tmux и написал свой инструмент
03.03.2026 14:15:55 | Хабр

Запустили за 5 дней: как AI-агенты собрали полноценный SaaS-продукт
03.03.2026 14:02:18 | Хабр

Дата-центры Amazon на Ближнем Востоке атаковали дроны
03.03.2026 13:45:36 | ferra.ru

Пишешь код, а звучит музыка. Как я сделал бесплатную лайвкодинг-платформу для создания музыки с ИИ-агентом
03.03.2026 13:42:11 | Хабр

Vivo Pad 6 Pro показали на MWC 2026 — планшет получит Snapdragon 8 Elite Gen 5
03.03.2026 13:37:30 | ferra.ru

ChatGPT потерял позиции в App Store из-за сотрудничества с Минобороны США
03.03.2026 13:34:09 | ferra.ru

Обзор инструментов отладки встроенного ПО
03.03.2026 13:31:17 | Хабр

Хотел сделать предустановленные теги. Передумал. Вот почему (кейс из моего SaaS-проекта)
03.03.2026 13:24:27 | Хабр

Между молотом и наковальней: как выживает IT-специалист в эпоху «регулируемого» интернета
03.03.2026 13:19:27 | Хабр

[Перевод] Почему раньше мы спали в два этапа и как прогресс изменил наше восприятие времени
03.03.2026 13:08:04 | Хабр

Скромное очарование JFET
03.03.2026 13:01:47 | Хабр

Grep-AST или Как мы заменили векторный поиск всего одной библиотекой
03.03.2026 12:20:32 | Хабр

Я следил, чтобы команда не выгорела. Выгорел сам
03.03.2026 12:15:42 | Хабр

Data Mesh vs централизованная модель: выбираем оптимальный подход к управлению данными
03.03.2026 12:10:15 | Хабр

ГОСТ VPN — что это и как поможет бизнесу
03.03.2026 12:00:40 | Хабр

TelecomDaily: выручка онлайн-кинотеатров в 2025 году достигла 178,2 млрд рублей
03.03.2026 11:58:41 | vc.ru

Все паттерны в автоматизации тестирования
03.03.2026 11:56:49 | Хабр

Сердце интернет-магазина. Что такое CMS-система и как ее выбрать?
03.03.2026 11:55:36 | it-world

[Перевод] Часы Лампорта
03.03.2026 11:54:03 | Хабр

Словарус.рф 2.0 — русская замена иностранных слов
03.03.2026 11:53:27 | Хабр

ПОЧЕМУ В РОССИЙСКИХ КОЛЛЕДЖАХ ГОТОВЯТ IT-СПЕЦИАЛИСТОВ БЕЗ АНГЛИЙСКОГО
03.03.2026 11:48:47 | Хабр

[Перевод] 2 марта 1991 года AMD выпустила процессор Am386 — клон чипа Intel
03.03.2026 11:47:36 | Хабр

Смотреть все

НОВОСТИ

Российские туристы на 11 часов застряли в аэропорту Египта
10.04.2026 13:43:02 | Lenta.ru

Первый визит за 10 лет: Си принял в Пекине лидера тайваньской оппозиции
10.04.2026 13:41:22 | Life.ru

До 10 человек увеличилось число пострадавших при взрыве во Владикавказе
10.04.2026 13:41:04 | Life.ru

Россиянина осудили за организацию сетевого бизнеса
10.04.2026 13:40:59 | Lenta.ru

В Кремле ответили на слова Зеленского о перемирии
10.04.2026 13:40:21 | Lenta.ru

В Кремле отреагировали на вопрос о британских кораблях
10.04.2026 13:40:00 | Lenta.ru

Столица лжи: Москвичи рассказали, о чём врут каждый день
10.04.2026 13:39:01 | Life.ru

Названо возможное место запуска ВСУ ракет «Нептун» по региону России
10.04.2026 13:38:09 | Lenta.ru

Состоящие в долгом браке люди назвали заметные со стороны признаки обреченных отношений
10.04.2026 13:37:43 | Lenta.ru

В России высказались о последствиях срыва пасхального перемирия
10.04.2026 13:37:00 | Lenta.ru

ЦБ разъяснил причины роста экономики на фоне снижения инвестиций
10.04.2026 13:36:14 | ТАСС

У жены Героя России Асылханова нет версий о причинах его исчезновения
10.04.2026 13:36:06 | ТАСС

Ливан решил отстоять свою позицию в Вашингтоне
10.04.2026 13:36:00 | Lenta.ru

Обнаружен простой способ усилить иммунную защиту организма
10.04.2026 13:35:59 | Lenta.ru

Рассмотрение иска ЦБ к Euroclear отложили на 15 мая
10.04.2026 13:35:38 | ТАСС

Эксперт Байдильдинов: Казахстан ощущает ущерб от прошлогодних атак по КТК
10.04.2026 13:35:35 | ТАСС

Число пострадавших при взрыве во Владикавказе увеличилось до 10
10.04.2026 13:35:11 | ТАСС

Создан ИИ для "Теледроида" в космосе
10.04.2026 13:33:12 | ТАСС

"Азимут" запускает прямые авиарейсы между Москвой и Магнитогорском в апреле
10.04.2026 13:33:10 | ТАСС

Россиянки массово изгоняют храпящих мужей в одно место, боясь оглохнуть
10.04.2026 13:33:08 | Life.ru

Глава ГТК Беларуси проинспектировал выезд литовских фур
10.04.2026 13:33:00 | Российская Газета

Никитин заявил, что более 100 тыс. россиян провели хотя бы одну игру в падел
10.04.2026 13:32:57 | ТАСС

СК проводит мероприятия после ЧП во Владикавказе, где пострадали восемь человек
10.04.2026 13:32:51 | ТАСС

Всероссийские проверочные работы в школах в 2027 году начнутся с 19 апреля
10.04.2026 13:32:39 | ТАСС

В России предложили объединить луноход и человекоподобного робота
10.04.2026 13:32:26 | ТАСС

Возможность роста экономики России объяснили
10.04.2026 13:32:08 | Lenta.ru

Одного из главных производителей военных дронов в России захотели обанкротить
10.04.2026 13:31:30 | Lenta.ru

Власти Хайнаня: новая таможенная модель помогла бизнесу сэкономить на пошлинах
10.04.2026 13:31:10 | ТАСС

Частные гранты и госпрограммы для соцбизнеса объединили в цифровой каталог
10.04.2026 13:31:06 | ТАСС

МИД заявил, что пауз по Украине не будет до системных договорённостей
10.04.2026 13:31:00 | Life.ru

Россияне выбрали для коротких поездок один город страны
10.04.2026 13:30:58 | Lenta.ru

Дудоров: Россия первой в мире свяжет человека и робота в космосе
10.04.2026 13:30:00 | ТАСС

Восемь человек пострадали при взрыве на складе пиротехники во Владикавказе
10.04.2026 13:28:19 | Коммерсантъ

Стало известно о наступлении ВС России в Запорожской области
10.04.2026 13:28:04 | Lenta.ru

Операция по спасению участников миссии Artemis II пройдет у берегов Сан-Диего
10.04.2026 13:28:00 | Российская Газета

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro