Passer à la navigation principale Passer à la recherche Passer au contenu principal

Soft Disentanglement in Frequency Bands for Neural Audio Codecs

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

In neural-based audio feature extraction, ensuring that representations capture disentangled information is crucial for model interpretability. However, existing disentanglement methods often rely on assumptions that are highly dependent on data characteristics or specific tasks. In this work, we introduce a generalizable approach for learning disentangled features within a neural architecture. Our method applies spectral decomposition to time-domain signals, followed by a multi-branch audio codec that operates on the decomposed components. Empirical evaluations demonstrate that our approach achieves better reconstruction and perceptual performance compared to a state-of-the-art baseline while also offering potential advantages for inpainting tasks.

langue originaleAnglais
titre2025 33rd European Signal Processing Conference, EUSIPCO 2025 - Proceedings
EditeurEuropean Signal Processing Conference, EUSIPCO
Pages11-15
Nombre de pages5
ISBN (Electronique)9789464593624
Les DOIs
étatPublié - 1 janv. 2025
Evénement33rd European Signal Processing Conference, EUSIPCO 2025 - Palermo, Italie
Durée: 8 sept. 202512 sept. 2025

Série de publications

NomEuropean Signal Processing Conference
ISSN (imprimé)2219-5491

Une conférence

Une conférence33rd European Signal Processing Conference, EUSIPCO 2025
Pays/TerritoireItalie
La villePalermo
période8/09/2512/09/25

Empreinte digitale

Examiner les sujets de recherche de « Soft Disentanglement in Frequency Bands for Neural Audio Codecs ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation