Passer à la navigation principale Passer à la recherche Passer au contenu principal

Neutral to Lombard Speech Conversion with Deep Learning

  • Enguerrand Gentet
  • , Bertrand David
  • , Sebastien Denjean
  • , Gael Richard
  • , Vincent Roussarie

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

In this paper, we propose several approaches for neutral to Lombard speech conversion. We study in particular the influence of different recurrent neural network architectures where their main hyper-parameters are carefully selected using a bandit-based approach. We also apply the Continuous Wavelet Transform (CWT) as a multi-resolution analysis framework to better model temporal dependencies of the different features selected. The speech conversion results obtained are validated by means of objective evaluations which highlight in particular the interest of the wavelet transform for the learning process.

langue originaleAnglais
titre2020 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2020 - Proceedings
EditeurInstitute of Electrical and Electronics Engineers Inc.
Pages7739-7743
Nombre de pages5
ISBN (Electronique)9781509066315
Les DOIs
étatPublié - 1 mai 2020
Evénement2020 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2020 - Barcelona, Espagne
Durée: 4 mai 20208 mai 2020

Série de publications

NomICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings
Volume2020-May
ISSN (imprimé)1520-6149

Une conférence

Une conférence2020 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2020
Pays/TerritoireEspagne
La villeBarcelona
période4/05/208/05/20

Empreinte digitale

Examiner les sujets de recherche de « Neutral to Lombard Speech Conversion with Deep Learning ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation