Passer à la navigation principale Passer à la recherche Passer au contenu principal

Speech emotion recognition using GhostVLAD and sentiment metric learning

  • Institut Polytechnique de Paris
  • University 'Politehnica' of Bucharest

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

In this paper, we introduce a novel deep learning-based speech emotion recognition method. The proposed approach exploits a convolutional neural network (CNN), enriched with a GhostVLAD feature aggregation layer. The resulting representation adjusts the contribution of each spectrogram segments to the final class prototype representation and is used for trainable and discriminative clustering purposes. In addition, we introduce a modified triplet loss function which integrates the relations between the various emotional patterns. The experimental evaluation, carried out on RAVDESS and CREMA-D datasets validates the proposed methodology, which yields emotion recognition rates superior to 83% and 64%, respectively. The comparative evaluation shows that the proposed approach outperforms state of the art techniques, with gains in accuracy of more than 3%.

langue originaleAnglais
titreISPA 2021 - 12th International Symposium on Image and Signal Processing and Analysis
rédacteurs en chefTomislav Petkovic, Davor Petrinovic, Sven Loncaric
EditeurIEEE Computer Society
Pages126-130
Nombre de pages5
ISBN (Electronique)9781665426398
Les DOIs
étatPublié - 13 sept. 2021
Evénement12th International Symposium on Image and Signal Processing and Analysis, ISPA 2021 - Virtual, Zagreb, Croatie
Durée: 13 sept. 202115 sept. 2021

Série de publications

NomInternational Symposium on Image and Signal Processing and Analysis, ISPA
Volume2021-September
ISSN (imprimé)1845-5921
ISSN (Electronique)1849-2266

Une conférence

Une conférence12th International Symposium on Image and Signal Processing and Analysis, ISPA 2021
Pays/TerritoireCroatie
La villeVirtual, Zagreb
période13/09/2115/09/21

Empreinte digitale

Examiner les sujets de recherche de « Speech emotion recognition using GhostVLAD and sentiment metric learning ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation