В недавнем исследовании, проведенном германскими научными работниками из Института Макса Планка, расположенного в Берлине, было установлено, что некоторые системы искусственного интеллекта обладают способностью распознавать эмоции человека, анализируя короткие аудиофрагменты, и делают это на уровне, сопоставимом с человеческими способностями, передает Bizmedia.kz.
Об этом говорится в статье, которая была опубликована в издании Frontiers in Psychology.
Главный исследователь проекта, Ханнес Димерлинг, объяснил, что их группа доказала возможность использования методов машинного обучения для определения эмоциональной составляющей в говоре, основываясь на аудиозаписях длительностью всего в полторы секунды.
Особенностью эксперимента являлось использование вымышленных фраз на канадском и немецком языках, что позволило исследователям проверить, способен ли искусственный интеллект точно идентифицировать эмоции, не зависящие от контекста высказывания и культурных особенностей языка.
Для создания моделей искусственного интеллекта ученые использовали три подхода. Методы глубокого обучения предполагают применение сложных алгоритмов для анализа аудио данных, например, изменения тона голоса или его громкости, которые могут указывать на определенные эмоции.
Сверточные нейронные сети анализируют визуальное представление звуковой дорожки, выявляя эмоции благодаря обработке ритмов и звуковых текстур. Гибридная модель объединяет оба этих подхода, используя в анализе как звуковые данные, так и визуальные спектрограммы.
В результате тестирования различных моделей на наборах данных выявлено, что методы глубокого обучения и гибридные модели показывают более высокую точность в сравнении с применением только визуального анализа, используемого в сверточных нейронных сетях.
Исследование демонстрирует перспективы создания технологий, способных в реальном времени интерпретировать эмоциональные сигналы человека и предоставлять мгновенную обратную связь, что может найти применение во многих областях, начиная от психотерапии и заканчивая средствами межличностного общения.