Операция выполнена!
Закрыть

Компания xAI Илона Маска представила новый Text-to-Speech API — инструмент, который превращает обычный текст в живую, выразительную речь.

Изначально доступны 5 уникальных голосов: Eve, Ara, Rex, Sal и Leo. Самое интересное — управление эмоциями и интонацией прямо в тексте. Можно писать: «Так я зашёл и [пауза] вот оно. [смех] Я просто не поверил своим глазам!». Или использовать теги, вроде, <whisper></whisper> (для шёпота), <slow></slow> (для замедления). Паузы, смех, вздохи, дыхание, изменения громкости, высоты тона и скорости — судя по первым отзывам всё это работает отлично и без дополнительных настроек.

Изображение Grok

API поддерживает WebSocket для потоковой передачи речи в реальном времени и разные аудиоформаты, включая MP3 и mu-law.

Читайте также
ЛЕНТА

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro