Passer à la navigation principale Passer à la recherche Passer au contenu principal

Guiding audio source separation by video object information

  • Sanjeel Parekh
  • , Slim Essid
  • , Alexey Ozerov
  • , Ngoc Q.K. Duong
  • , Patrick Perez
  • , Gael Richard
  • Université Paris-Saclay
  • Technicolor

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

In this work we propose novel joint and sequential multimodal approaches for the task of single channel audio source separation in videos. This is done within the popular non-negative matrix factorization framework using information about the sounding object's motion. Specifically, we present methods that utilize non-negative least squares formulation to couple motion and audio information. The proposed techniques generalize recent work carried out on NMF-based motion-informed source separation and easily extend to video data. Experiments with two distinct multimodal datasets of string instrument performance recordings illustrate their advantages over the existing methods.

langue originaleAnglais
titre2017 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, WASPAA 2017
EditeurInstitute of Electrical and Electronics Engineers Inc.
Pages61-65
Nombre de pages5
ISBN (Electronique)9781538616321
Les DOIs
étatPublié - 7 déc. 2017
Modification externeOui
Evénement2017 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, WASPAA 2017 - New Paltz, États-Unis
Durée: 15 oct. 201718 oct. 2017

Série de publications

NomIEEE Workshop on Applications of Signal Processing to Audio and Acoustics
Volume2017-October

Une conférence

Une conférence2017 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, WASPAA 2017
Pays/TerritoireÉtats-Unis
La villeNew Paltz
période15/10/1718/10/17

Empreinte digitale

Examiner les sujets de recherche de « Guiding audio source separation by video object information ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation