Passer à la navigation principale Passer à la recherche Passer au contenu principal

A MODEL YOU CAN HEAR: AUDIO IDENTIFICATION WITH PLAYABLE PROTOTYPES

  • Romain Loiseau
  • , Baptiste Bouvier
  • , Yann Teytaut
  • , Elliot Vincent
  • , Mathieu Aubry
  • , Loic Landrieu

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

Machine learning techniques have proved useful for classifying and analyzing audio content. However, recent methods typically rely on abstract and high-dimensional representations that are difficult to interpret. Inspired by transformation-invariant approaches developed for image and 3D data, we propose an audio identification model based on learnable spectral prototypes. Equipped with dedicated transformation networks, these prototypes can be used to cluster and classify input audio samples from large collections of sounds. Our model can be trained with or without supervision and reaches state-of-the-art results for speaker and instrument identification, while remaining easily interpretable. The code is available at: https://github.com/romainloiseau/a-model-you-can-hear.

langue originaleAnglais
titreProceedings of the 23rd International Society for Music Information Retrieval Conference, ISMIR 2022
rédacteurs en chefPreeti Rao, Hema Murthy, Ajay Srinivasamurthy, Rachel Bittner, Rafael Caro Repetto, Masataka Goto, Xavier Serra, Marius Miron
EditeurInternational Society for Music Information Retrieval
Pages694-700
Nombre de pages7
ISBN (Electronique)9781732729926
étatPublié - 1 janv. 2022
Modification externeOui
Evénement23rd International Society for Music Information Retrieval Conference, ISMIR 2022 - Hybrid, Bengaluru, Inde
Durée: 4 déc. 20228 déc. 2022

Série de publications

NomProceedings of the 23rd International Society for Music Information Retrieval Conference, ISMIR 2022

Une conférence

Une conférence23rd International Society for Music Information Retrieval Conference, ISMIR 2022
Pays/TerritoireInde
La villeHybrid, Bengaluru
période4/12/228/12/22

Empreinte digitale

Examiner les sujets de recherche de « A MODEL YOU CAN HEAR: AUDIO IDENTIFICATION WITH PLAYABLE PROTOTYPES ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation