Люди, потерявшие способность говорить из-за паралича, теперь могут общаться с окружающими, используя лишь силу мысли. Исследователи из Калифорнийского университета в Беркли и Сан-Франциско разработали систему, которая преобразует мозговые сигналы в речь в режиме реального времени.
Главным прорывом стало устранение задержки, которая раньше мешала созданию плавных разговоров. Теперь синтезированный голос звучит почти сразу после того, как человек мысленно формулирует предложение. Это стало возможным благодаря ИИ, который расшифровывает сигналы двигательной коры — области мозга, управляющей речевыми движениями.
Мы применили потоковую передачу, как в голосовых помощниках Siri и Alexa, но для нейропротеза. Впервые мы добились почти мгновенного преобразования мысли в голос.
Как это работает?
Технология использует активность мозга, связанную с движением речевого аппарата, и переводит её в произносимые слова. Испытуемых просили мысленно проговаривать фразы, в то время как система анализировала их нейронные сигналы.
Поскольку участники не могли произнести слова вслух, исследователи использовали искусственный интеллект для воссоздания их голоса на основе прошлых записей. Это позволило добиться естественного звучания, а не синтетического «роботизированного» произношения.
Ранее технологии нейроинтерфейсов страдали от значительных задержек — на перевод мозговых сигналов в речь уходило до 8 секунд. Новый метод сокращает этот процесс до 1 секунды, обеспечивая непрерывный поток речи.
Чтобы проверить, насколько ИИ действительно «понимает» речь, а не просто воспроизводит заученные фразы, исследователи протестировали его на произношении новых слов. Он успешно справился с заданием, что подтверждает его способность анализировать и комбинировать звуки.
Что дальше?
Следующий этап исследований — сделать синтезированную речь более выразительной. Учёные хотят научить систему передавать эмоции, интонации и акцентирование, чтобы голос звучал максимально естественно.
Эта технология приближает нас к будущему, где парализованные люди смогут свободно разговаривать, просто думая о словах. Теперь вопрос не в том, когда нейроинтерфейсы станут массовым явлением, а в том, как скоро они изменят жизни миллионов.