Применение математических методов в искусственной нейронной сети для распознавания в голосе "фальшивых" эмоций

Авторы

  • Иван Владимирович Быков Пермский государственный национальный исследовательский университет
  • Наталья Юрьевна Ротанева Мариупольский государственный университет имени А.И. Куинджи
  • Александр Петрович Шкарапута Пермский государственный национальный исследовательский университет

DOI:

https://doi.org/10.17072/1993-0550-2024-4-104-116

Ключевые слова:

распознавание эмоций, фальшивые эмоции, базовые эмоции, музыкальный интервал, классификаторы эмоционального состояния, просодия

Аннотация

В данной статье предложена методика сравнения эмоциональной составляющей голосов спикеров, реально испытывающих эмоции, и тех, которые пытаются их воспроизвести. Методика предполагает использование в качестве классификаторов отношение частот локальных максимумов спектра звуковой волны. В данной работе исследовались 4 категории базовых эмоций: гнев, грусть, страх, радость. Для получения сравнительных характеристик в каждой категории исследовалось по 30 записей с "фальшивой" и "истинной" эмоцией – всего 240 записей. Был проведен статистический сравнительный анализ классификаторов и обнаружены существенные различия в данных для искренних эмоций и их имитации. Также, была спроектирована модель искусственной нейронной сети, на основе которой создана программа для распознавания эмоционального посыла, содержащегося в записях голоса человека. На обученной искусственной нейронной сети проведен эксперимент по определению эмоционального состояния спикера и истинности или фальшивости его эмоционального посыла. Тестирование звуковых файлов с различными эмоциями показало хорошие результаты как для распознавания самого эмоционального состояния говорящего, так и истинности его эмоционального посыла.

Библиографические ссылки

Российские ученые создали RiskControl, который распознает ложь по голосу. https://www.computerra.ru – журнал "Компьютерра". 2021. [Электронный ресурс]. Ре-жим доступа: https://www.computerra.ru/275450/rossijskie-uchenye-sozdali-riskcontrol-kotoryj-raspoznaet-lozh-po-golosu/ (дата обращения: 19.11.2024).

Пеленицын А.Б., Степанов А.А. Что надо знать о так называемых "детекторах лжи по голосу". [Электронный ресурс] / А.Б. Пеленицын, А.А. Степанов. Электрон. текстовые дан. Режим доступа: http://poligraf.sp.ru/stati/abpelenicyn_aastepanov_de-tektory_lzhi_po_golosu.html, свободный (дата обращения: 19.11.2024).

Изард К.Э. Психология эмоций / пер. с англ. СПб: Изд-во "Питер", 1999. 464 с.

Shkaraputa, A., Kolcherina, A., Mishlanova, M. (2022). Determining of the Emotional State of a Person Using Computer Analysis of Sound Wave Parameters. In: Rocha, A., Isaeva, E. (eds) Science and Global Challenges of the 21st Century - Science and Technology. Perm Forum 2021. Lecture Notes in Networks and Systems, Vol. 342. Springer, Cham. https://doi.org/10.1007/978-3-030-89477-1_6.

Алимурадов А.К., Чураков П.П. Обзор и классификация методов обработки речевых сигналов в системах распознавания речи. Измерения. Мониторинг. Контроль. 2(12) 27-35 (2015).

Xuedong H. Spoken Language Processing: A Guide to Theory, Algorithm and System Development. Huang Xuedong. New Jersey. Prentice Hall PTR (2001).

Mehmet Cenk Sezgin, Bilge Gunsel & Gunes Karabulut Kurt. Perceptual audio features for emotion detection. EURASIP Journal on Audio, Speech, and Music Processing volume 2012, Article number: 16 (2012) https://doi.org/10.1186/1687-4722-2012-16.

Рахманенко И.А., Мещеряков Р.В. Анализ идентификационных признаков в речевых данных с помощью GMM-UBM верификации диктора. С-Пб.: Тр. СПИИРАН, 2017, С. 32–50.

Близнюк О.А., Шкарапута А.П. Исследование применения метода определения базовых эмоций на основе отношения частот спектра звуковой волны // Вестник Пермского университета. Математика. Механика. Информатика. 2017. Вып. 4(39). С. 86–91.

Загрузки

Опубликован

24.12.2024

Как цитировать

Быков, И. В., Ротанева, Н. Ю., & Шкарапута, А. П. (2024). Применение математических методов в искусственной нейронной сети для распознавания в голосе "фальшивых" эмоций. ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА. МАТЕМАТИКА. МЕХАНИКА. ИНФОРМАТИКА, (4 (67), 104–116. https://doi.org/10.17072/1993-0550-2024-4-104-116