Passer à la navigation principale Passer à la recherche Passer au contenu principal

Learning with noise-contrastive estimation: Easing training by learning to scale

  • CNRS

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

Noise-Contrastive Estimation (NCE) is a learning criterion that is regularly used to train neural language models in place of Maximum Likelihood Estimation, since it avoids the computational bottleneck caused by the output softmax. In this paper, we analyse and explain some of the weaknesses of this objective function, linked to the mechanism of self-normalization, by closely monitoring comparative experiments. We then explore several remedies and modifications to propose tractable and efficient NCE training strategies. In particular, we propose to make the scaling factor a trainable parameter of the model, and to use the noise distribution to initialize the output bias. These solutions, yet simple, yield stable and competitive performances in either small and large scale language modelling tasks.

langue originaleAnglais
titreCOLING 2018 - 27th International Conference on Computational Linguistics, Proceedings
rédacteurs en chefEmily M. Bender, Leon Derczynski, Pierre Isabelle
EditeurAssociation for Computational Linguistics (ACL)
Pages3090-3101
Nombre de pages12
ISBN (Electronique)9781948087506
étatPublié - 1 janv. 2018
Evénement27th International Conference on Computational Linguistics, COLING 2018 - Santa Fe, États-Unis
Durée: 20 août 201826 août 2018

Série de publications

NomCOLING 2018 - 27th International Conference on Computational Linguistics, Proceedings

Une conférence

Une conférence27th International Conference on Computational Linguistics, COLING 2018
Pays/TerritoireÉtats-Unis
La villeSanta Fe
période20/08/1826/08/18

Empreinte digitale

Examiner les sujets de recherche de « Learning with noise-contrastive estimation: Easing training by learning to scale ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation