Синтез эмоций. Модель вдох-выдох

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Синтез эмоций. Модель вдох-выдох

13.07.2024 18:36:18 | Хабр

Хабы: Python, Алгоритмы, Звук, Машинное обучение

Решил попробовать написать несколько статей о синтезе речи с поддержкой эмоций.

Все началось, когда я решил сделать простой MVP для улучшения разговорного иностранного языка на базе нейронок, онлайн-репетитор. Так как сам испытываю сложности с его изучением.

Но в процессе реализации, я использовал разные модели. Начиная от Fastpitch и Tocatron2 до Bark от Suno. Когда я тестировал свой первый MVP, то при длительном прослушивании синтетического голоса у меня начинала болеть голоса и возникало раздражение. Это особенно сильно возникало, когда озвучка голоса не соответствовала контексту. Возникал аналог эффекта "зловещей долины", но только для звука.

Это заставило меня попытаться найти решения, которое сделает голос более эмоциональным. Здесь я опишу, как я начинал переносить биологическую модель, на синтез сеток.

Первым моим шагом, была разработка модели "вдоха-выдоха". Идея заключалась в том, что 99,999% человек говорит исключительно на выдохе (это касается и животных).

Читать далее

Подробнее

Читайте также

Первый pet-проект, но не бесполезный?
13.07.2024 18:08:00 | Хабр

Системы помощи водителю навредили водителям: ученые
13.07.2024 18:00:36 | ferra.ru

Windows 11 24H2 IoT Enterprise LTSC – что за зверь, и чем он хорош?
13.07.2024 17:53:51 | Хабр

[Перевод] Как настроить воркфлоу: 7 дельных советов от опытного разработчика
13.07.2024 17:50:53 | Хабр

Исследователи пытаются понять, как работают большие языковые модели
13.07.2024 17:49:22 | it-world

Как подготовиться к удалению приложения из AppStore
13.07.2024 17:43:12 | Хабр

Китайцы разработали ОС с открытым исходным кодом: что это за проект?
13.07.2024 17:23:41 | Хабр

Ожирение — это, конечно, плохо. Но ученые рассказали о проблеме недоедания
13.07.2024 17:15:33 | ferra.ru

Мой личный топчик оптики для полнокадровой беззеркальной камеры Sony для непрофессионального использования в 2024 году
13.07.2024 17:13:07 | Хабр

Как выбрать контроллер для DIY (сводная таблица по 30++ моделям с комментариями)
13.07.2024 17:10:08 | Хабр

Как мы переходили с Xamarin на Flutter
13.07.2024 17:06:41 | Хабр

Поиск по префиксу или тайные операторы PostgreSQL
13.07.2024 16:44:22 | Хабр

CISA проникла в федеральное агентство США. Никто не замечал этого 5 месяцев
13.07.2024 16:30:29 | ferra.ru

Встречаем по одежке, а провожаем по уму или что такое Soft Skills?
13.07.2024 16:28:47 | Хабр

Мой обзор на только что анонсированный Android 8K VR шлем «Play For Dream MR» — практически «убийца Apple Vision Pro»
13.07.2024 15:49:35 | Хабр

iMessage раскритиковали за отсутствие «оптимизации хранилища»
13.07.2024 15:45:26 | ferra.ru

«Продаётся саркастичный коллега за 3999 юаней, уроки общения с ним — в подарок»
13.07.2024 15:38:11 | vc.ru

Почему революция искусственного интеллекта не изменила мировую экономику
13.07.2024 15:23:54 | it-world

Microsoft закроет магазин игр Xbox 360 через две недели
13.07.2024 15:00:24 | ferra.ru

В Telegram за это берут деньги: WhatsApp получит транскрипцию аудиосообщений
13.07.2024 14:15:22 | ferra.ru

Гигантскую саламандру нашли в местах, где было слишком холодно: это странно
13.07.2024 13:30:20 | ferra.ru

Что нового в мире обхода блокировок Интернета в середине 2024: XRay, Outline, Tor, Amnezia и все-все-все
13.07.2024 13:26:37 | Хабр

Илон Маск: к 2026 году людей с чипами Neuralink будет больше 1000
13.07.2024 13:10:33 | it-world

Всем радоваться вместе с новостями Минцифры
13.07.2024 13:00:25 | Хабр

Войти в IT. Продуктовая аналитика. Гайд для новичков. Часть 1
13.07.2024 13:00:16 | Хабр

Бот мониторинга результатов ЕГЭ с регионального ресурса. Пет-проект за 24 часа
13.07.2024 12:49:58 | Хабр

Критическая уязвимость подвергла риску 1,5 миллиона почтовых серверов
13.07.2024 12:45:18 | ferra.ru

Процессоры Intel Arrow Lake-S ожидаются в декабре 2024 года
13.07.2024 12:40:42 | it-world

Как уменьшить размер шрифтов в Unity до нуля
13.07.2024 12:23:48 | Хабр

OpenAI разрабатывает новую технологию под кодовым названием «Strawberry»
13.07.2024 12:16:17 | it-world

Область видимости и замыкания в JavaScript
13.07.2024 12:13:06 | Хабр

NVIDIA уверена, что разработка клиентами собственных ускорителей не подорвёт спрос на её продукцию
13.07.2024 12:06:26 | it-world

Глава Apple объяснил, для чего нужен их VR-шлем Vision Pro
13.07.2024 12:00:16 | ferra.ru

Разработка сверхширокополосного радара подповерхностного зондирования (георадар Izh-Terra)
13.07.2024 11:46:18 | Хабр

Samsung рассказала об ИИ-обновлении виртуального помощника Bixby
13.07.2024 11:15:14 | ferra.ru

Смотреть все

СТАТЬ АВТОРОМ

НОВОСТИ

Три человека пострадали в ДТП с автобусом и легковушкой на юго-западе Москвы
06.07.2025 18:47:25 | РЕН ТВ

В Узбекистане произошло землетрясение магнитудой 4
06.07.2025 18:46:16 | ТАСС

На грани фантастики: почему вода на границах морей разного цвета
06.07.2025 18:45:00 | РЕН ТВ

На грани фантастики: почему вода на границах морей разного цвета
06.07.2025 18:45:00 | РЕН ТВ

Арагчи: атаки США и Израиля на ядерные объекты Ирана были вопиющим нарушением ДНЯО
06.07.2025 18:44:34 | ТАСС

Хюлькенберг в 239-й гонке в "Формуле-1" впервые финишировал на подиуме
06.07.2025 18:43:40 | ТАСС

Лула считает, что повышение оборонных расходов НАТО подпитывает гонку вооружений
06.07.2025 18:42:00 | Российская Газета

Роспотребнадзор держит на контроле сообщения о вспышке лишая в Таиланде
06.07.2025 18:42:00 | Российская Газета

Лула считает, что повышение оборонных расходов НАТО подпитывает гонку вооружений
06.07.2025 18:42:00 | Российская Газета

В аэропорту Кирова сняли ограничения
06.07.2025 18:41:46 | ТАСС

В аэропорту Кирова сняли ограничения
06.07.2025 18:41:46 | ТАСС

Путин отметил интерес стран БРИКС и их партнеров к "Интервидению"
06.07.2025 18:39:27 | РЕН ТВ

Путин отметил интерес стран БРИКС и их партнеров к "Интервидению"
06.07.2025 18:39:27 | РЕН ТВ

Путин отметил интерес стран БРИКС и их партнеров к "Интервидению"
06.07.2025 18:39:27 | РЕН ТВ

В Калужской области уничтожили семь БПЛА
06.07.2025 18:38:30 | ТАСС

В Калужской области уничтожили семь БПЛА
06.07.2025 18:38:30 | ТАСС

В Калужской области уничтожили семь БПЛА
06.07.2025 18:38:30 | ТАСС

Путин отметил интерес стран БРИКС и их партнеров к "Интервидению"
06.07.2025 18:37:33 | РЕН ТВ

Путин отметил интерес стран БРИКС и их партнеров к "Интервидению"
06.07.2025 18:37:33 | РЕН ТВ

Россиянам рассказали о способах получить кредит без официального дохода
06.07.2025 18:35:38 | Lenta.ru

Россиянам рассказали о способах получить кредит без официального дохода
06.07.2025 18:35:00 | Lenta.ru

Путин объяснил значение музыкального конкурса «Интервидение»
06.07.2025 18:33:45 | Lenta.ru

Путин объяснил значение музыкального конкурса «Интервидение»
06.07.2025 18:33:45 | Lenta.ru

Путин объяснил значение музыкального конкурса «Интервидение»
06.07.2025 18:33:45 | Lenta.ru

В Венгрии возмутились из-за вручения Зеленским награды ребенку из Дании
06.07.2025 18:33:00 | Российская Газета

В Венгрии возмутились из-за вручения Зеленским награды ребенку из Дании
06.07.2025 18:33:00 | Российская Газета

В Венгрии возмутились из-за вручения Зеленским награды ребенку из Дании
06.07.2025 18:33:00 | Российская Газета

В Венгрии возмутились из-за вручения Зеленским награды ребенку из Дании
06.07.2025 18:33:00 | Российская Газета

На Западе прокомментировали видео с Зеленским и ребенком фразой «всему есть предел»
06.07.2025 18:32:50 | Lenta.ru

На Западе прокомментировали видео с Зеленским и ребенком фразой «всему есть предел»
06.07.2025 18:32:50 | Lenta.ru

В Южной Корее запросили арест экс-президента Юн Сок Ёля
06.07.2025 18:32:32 | РЕН ТВ

В Южной Корее запросили арест экс-президента Юн Сок Ёля
06.07.2025 18:32:32 | РЕН ТВ

На Западе прокомментировали видео с Зеленским и ребенком фразой «всему есть предел»
06.07.2025 18:32:00 | Lenta.ru

Путин заявил о росте числа единомышленников БРИКС
06.07.2025 18:31:29 | Life.ru

Трамп ввел режим ЧС в округе Керр штата Техас из-за наводнения
06.07.2025 18:30:02 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2025 - vsetut.pro