Passer à la navigation principale Passer à la recherche Passer au contenu principal

Multichannel audio modeling with elliptically stable tensor decomposition

  • Mathieu Fontaine
  • , Fabian Robert Stöter
  • , Antoine Liutkus
  • , Umut Şimşekli
  • , Romain Serizel
  • , Roland Badeau
  • Nancy Université
  • DALI/LIRMM
  • Université Paris-Saclay

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

This paper introduces a new method for multichannel speech enhancement based on a versatile modeling of the residual noise spectrogram. Such a model has already been presented before in the single channel case where the noise component is assumed to follow an alpha-stable distribution for each time-frequency bin, whereas the speech spectrogram, supposed to be more regular, is modeled as Gaussian. In this paper, we describe a multichannel extension of this model, as well as a Monte Carlo Expectation - Maximisation algorithm for parameter estimation. In particular, a multichannel extension of the Itakura-Saito nonnegative matrix factorization is exploited to estimate the spectral parameters for speech, and a Metropolis-Hastings algorithm is proposed to estimate the noise contribution. We evaluate the proposed method in a challenging multichannel denoising application and compare it to other state-of-the-art algorithms.

langue originaleAnglais
titreLatent Variable Analysis and Signal Separation - 14th International Conference, LVA/ICA 2018, Proceedings
rédacteurs en chefSharon Gannot, Yannick Deville, Russell Mason, Mark D. Plumbley, Dominic Ward
EditeurSpringer Verlag
Pages13-23
Nombre de pages11
ISBN (imprimé)9783319937632
Les DOIs
étatPublié - 1 janv. 2018
Modification externeOui
Evénement14th International Conference on Latent Variable Analysis and Signal Separation, LVA/ICA 2018 - Guildford, Royaume-Uni
Durée: 2 juil. 20185 juil. 2018

Série de publications

NomLecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
Volume10891 LNCS
ISSN (imprimé)0302-9743
ISSN (Electronique)1611-3349

Une conférence

Une conférence14th International Conference on Latent Variable Analysis and Signal Separation, LVA/ICA 2018
Pays/TerritoireRoyaume-Uni
La villeGuildford
période2/07/185/07/18

Empreinte digitale

Examiner les sujets de recherche de « Multichannel audio modeling with elliptically stable tensor decomposition ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation