Команда исследователей из Вашингтонского университета разработала прототип наушников, который позволяет пользователям создавать «звуковой пузырь», усиливая звуки внутри определённого радиуса и приглушая внешние шумы. Эта технология, описанная в статье, опубликованной 14 ноября в Nature Electronics, может революционизировать способ общения людей в шумных условиях.
Прототип наушников оснащён шестью микрофонами и нейронной сетью, работающей на встроенном компьютере. Система использует алгоритмы искусственного интеллекта для отслеживания расстояния до каждого источника звука и обработки звука в режиме реального времени, в течение 8 миллисекунд.
«Люди не очень хорошо воспринимают расстояния через звук, особенно когда вокруг них находится несколько источников звука. Наша система искусственного интеллекта фактически может узнать расстояние до каждого источника звука и обработать его в режиме реального времени», — сказал старший автор Шьям Голлакота, профессор Вашингтонского университета в Школе компьютерных наук и инженерии Пола Аллена.
Источник: DALL-E
Чтобы обучить систему, исследователи собрали набор звуковых данных на основе расстояния, используя наушники, надетые на голову манекена, и роботизированную платформу, которая вращала голову, в то время как движущийся динамик воспроизводил шумы с разных расстояний. Команда также собирала данные с помощью пользователей в 22 различных помещениях.
Система работает, сравнивая фазы каждой из частот звука, чтобы определить расстояние до любого источника звука. Это позволяет наушникам усиливать звуки внутри «звукового пузыря» с программируемым радиусом от 3 до 6 футов (1-2 метра ) и приглушать внешние шумы в среднем на 49 децибел. «Мы смогли сделать это, используя только микрофоны на наушниках, и в режиме реального времени, что было довольно удивительно», — сказал Голлакота.
Хотя некоторые коммерчески доступные наушники, такие как AirPods Pro 2 от Apple, могут усиливать голос человека, они работают, отслеживая положение головы и усиливая звук, исходящий с определённого направления, а не измеряя расстояние. Это означает, что они не могут усиливать несколько динамиков одновременно и теряют функциональность, если пользователь отворачивает голову от целевого динамика.
Исследователи работают над тем, чтобы технология работала на слуховых аппаратах и ??шумоподавляющих наушниках, что требует новой стратегии позиционирования микрофонов. Команда также создаёт стартап для коммерциализации этой технологии.
«Наши возможности фокусироваться на людях поблизости могут быть ограничены в таких местах, как шумные рестораны, поэтому создание звуковых пузырей на слуховом устройстве до сих пор было невозможным. Наша система искусственного интеллекта фактически может решить эту проблему», — сказал Голлакота.