
Компания Amazon анонсировала Nova Sonic — единую модель, объединяющую распознавание, анализ и синтез речи. Технология, доступная через API на платформе Bedrock, позволяет внедрять в приложения голосовые интерфейсы, способные поддерживать естественные диалоги с учётом пауз, прерываний и контекста. Часть компонентов модели уже используется в обновлённом функционале Alexa+.
«Раньше разработчикам приходилось комбинировать три отдельные системы, что усложняло процесс и снижало качество взаимодействия», — пояснил Рохит Прасад, старший вице-президент Amazon по ИИ. Nova Sonic сохраняет акустические нюансы (тон, ритм), что делает диалоги более естественными. Модель обрабатывает запросы в реальном времени — например, корректирует ответы при прерывании, что критично для служб поддержки.

Nova Sonic генерирует текстовые расшифровки разговоров для интеграции с внешними API, упрощая создание AI-агентов. В тестах модель превзошла Gemini Flash 2.0 (69,7% побед) и GPT-4o (51%) в диалогах на английском. Её задержка — 1,09 секунды против 1,18 у OpenAI и 1,41 у Google. При этом стоимость использования на 80% ниже, чем у GPT-4o. Мультиязычная точность Nova Sonic также выше: уровень ошибок (WER) составил 4,2% против 6,6% у GPT-4o Transcribe.
Среди ранних внедрений — оптимизация контакт-центров (ASAPP), обучение произношению (Education First) и голосовой доступ к спортивной аналитике (Stats Perform).
Amazon акцентирует ответственный подход: в модель встроены защита от «галлюцинаций» и запрет на клонирование голосов. Сейчас Nova Sonic поддерживает американский и британский английский, но новые языки и акценты в разработке. По словам Прасада, это «высокая планка надёжности для эпохи, где голос становится новым интерфейсом».
-
10.04.2025 14:42:00 | iXBT.com
10.04.2025 14:38:00 | iXBT.com
10.04.2025 14:33:00 | iXBT.com
10.04.2025 14:28:00 | iXBT.com
10.04.2025 14:27:00 | iXBT.com
10.04.2025 14:25:00 | iXBT.com
10.04.2025 14:21:00 | iXBT.com
10.04.2025 14:15:02 | TechCult.ru
10.04.2025 14:00:00 | iXBT.com
10.04.2025 13:49:00 | iXBT.com
10.04.2025 13:34:00 | iXBT.com
10.04.2025 13:27:00 | iXBT.com
10.04.2025 13:17:00 | iXBT.com
10.04.2025 12:50:00 | iXBT.com
10.04.2025 12:38:00 | iXBT.com
10.04.2025 12:27:00 | iXBT.com
10.04.2025 12:23:00 | iXBT.com
10.04.2025 12:17:00 | iXBT.com
10.04.2025 12:06:00 | iXBT.com
10.04.2025 11:50:00 | iXBT.com
10.04.2025 11:41:50 | TechCult.ru
10.04.2025 11:38:00 | iXBT.com
10.04.2025 11:27:00 | iXBT.com
10.04.2025 11:26:00 | iXBT.com
10.04.2025 11:11:00 | iXBT.com
10.04.2025 11:06:00 | iXBT.com
10.04.2025 10:58:00 | iXBT.com
10.04.2025 10:41:00 | iXBT.com
10.04.2025 10:21:00 | iXBT.com
10.04.2025 10:20:00 | iXBT.com
10.04.2025 10:19:00 | iXBT.com
10.04.2025 10:16:00 | iXBT.com
-
09.05.2025 12:25:32 | vc.ru
09.05.2025 12:00:57 | ferra.ru
09.05.2025 11:00:19 | ferra.ru
09.05.2025 10:36:49 | vc.ru
09.05.2025 10:02:14 | ferra.ru
09.05.2025 09:40:53 | Хабр
09.05.2025 07:31:44 | ferra.ru
09.05.2025 07:30:59 | ferra.ru
09.05.2025 07:23:43 | ferra.ru
09.05.2025 07:16:44 | ferra.ru
09.05.2025 07:00:47 | Хабр
09.05.2025 07:00:37 | ferra.ru
09.05.2025 06:00:56 | ferra.ru
Техническая поддержка проекта ВсеТут