Passer à la navigation principale Passer à la recherche Passer au contenu principal

Speaker diarization using data-driven audio sequencing

  • Houssemeddine Khemiri
  • , Dijana Petrovska-Delacretaz
  • , Gerard Chollet
  • CNRS LTCI
  • Institut Mines-Télécom
  • Boise State University

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

In this paper, a speaker diarization system based on data-driven segmentation is proposed. In addition to the usual segmentation and clustering steps, a new module which detects repeated segments between the same shows broadcasted on different dates is added. This process is achieved by using the ALISP-based audio identification system which segments audio data into pseudo-phonetic units. The ALISP segmentation is then used to identify the similar audio segments in TV and radio shows. The system was evaluated during the ETAPE 2011 evaluation campaign and obtained a Diarization Error Rate - DER of 16.23% which was the best result among seven participants.

langue originaleAnglais
titre2013 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2013 - Proceedings
Pages7736-7740
Nombre de pages5
Les DOIs
étatPublié - 18 oct. 2013
Modification externeOui
Evénement2013 38th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2013 - Vancouver, BC, Canada
Durée: 26 mai 201331 mai 2013

Série de publications

NomICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings
ISSN (imprimé)1520-6149

Une conférence

Une conférence2013 38th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2013
Pays/TerritoireCanada
La villeVancouver, BC
période26/05/1331/05/13

Empreinte digitale

Examiner les sujets de recherche de « Speaker diarization using data-driven audio sequencing ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation