Люди плохо отличают человеческие голоса от голосов, сгенерированных искусственным интеллектом (ИИ), но их мозг реагирует на них по-разному. Об этом свидетельствует исследование, которое было представлено на форуме Федерации европейских нейробиологических обществ (FENS) 2024 года.
Исследование было проведено докторантом Кристиной Скьегстад и профессором Сашей Фрюхольцем из Университета Осло (UiO), Норвегия. Скьегстад отметила:
Современные ИИ-голоса настолько продвинуты, что их практически невозможно отличить от реальных человеческих голосов. Теперь можно клонировать голос человека всего за несколько секунд записи, что мошенники уже используют для обмана. Хотя специалисты по машинному обучению разрабатывают способы обнаружения голосов ИИ, о реакции человеческого мозга на такие голоса известно мало.
В исследовании участвовали 43 человека, которые слушали человеческие голоса и голоса, сгенерированные ИИ, выражающие пять эмоций: нейтральные, злые, страх, счастье и удовольствие. Их просили определить, является ли голос искусственным или естественным, а их мозг исследовали с помощью функциональной магнитно-резонансной томографии (фМРТ). Участники также оценивали голоса по степени естественности, достоверности и аутентичности.
Участники правильно идентифицировали человеческие голоса только в 56% случаев, а голоса ИИ — в 50,5% случаев, что говорит о трудности распознавания обоих типов голосов.
Люди чаще правильно определяли нейтральные голоса ИИ как искусственные (75% по сравнению с 23% для человеческих нейтральных голосов), предполагая, что нейтральные голоса кажутся более искусственными. Нейтральные женские голоса ИИ определялись правильно чаще, чем мужские. Счастливые человеческие голоса распознавались правильно в 78% случаев по сравнению с 32% для счастливых голосов ИИ, что указывает на ассоциацию счастья с человеческим голосом.
И ИИ-голоса, и нейтральные человеческие голоса воспринимались как менее естественные, заслуживающие доверия и аутентичные, тогда как счастливые человеческие голоса воспринимались как наиболее естественные, заслуживающие доверия и аутентичные.
Исследование мозга показало, что человеческие голоса вызывают более сильные реакции в областях, связанных с памятью (правый гиппокамп) и эмпатией (правая нижняя лобная извилина), а голоса ИИ активируют зоны, отвечающие за обнаружение ошибок (правая передняя часть средней поясной извилины) и регулирование внимания (правая дорсолатеральная префронтальная кора).
Теперь исследователи планируют изучить, влияют ли личные качества, такие как экстраверсия или эмпатия, на чувствительность к различиям между человеческими и ИИ-голосами.