Passer à la navigation principale Passer à la recherche Passer au contenu principal

JuriBERT: A Masked-Language Model Adaptation for French Legal Text

  • École Polytechnique
  • École Polytechnique
  • Hec Paris Paris

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

Language models have proven to be very useful when adapted to specific domains. Nonetheless, little research has been done on the adaptation of domain-specific BERT models in the French language. In this paper, we focus on creating a language model adapted to French legal text with the goal of helping law professionals. We conclude that some specific tasks do not benefit from generic language models pre-trained on large amounts of data. We explore the use of smaller architectures in domain-specific sub-languages and their benefits for French legal text. We prove that domain-specific pre-trained models can perform better than their equivalent generalised ones in the legal domain. Finally, we release JuriBERT, a new set of BERT models adapted to the French legal domain.

langue originaleAnglais
titreNatural Legal Language Processing, NLLP 2021 - Proceedings of the 2021 Workshop
rédacteurs en chefNikolaos Aletras, Ion Androutsopoulos, Leslie Barrett, Catalina Goanta, Daniel Preotiuc-Pietro
EditeurAssociation for Computational Linguistics (ACL)
Pages95-101
Nombre de pages7
ISBN (Electronique)9781954085985
étatPublié - 1 janv. 2021
Modification externeOui
Evénement3rd Natural Legal Language Processing, NLLP 2021 - Punta Cana, République Dominicaine
Durée: 10 nov. 2021 → …

Série de publications

NomNatural Legal Language Processing, NLLP 2021 - Proceedings of the 2021 Workshop

Une conférence

Une conférence3rd Natural Legal Language Processing, NLLP 2021
Pays/TerritoireRépublique Dominicaine
La villePunta Cana
période10/11/21 → …

Empreinte digitale

Examiner les sujets de recherche de « JuriBERT: A Masked-Language Model Adaptation for French Legal Text ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation