Passer à la navigation principale Passer à la recherche Passer au contenu principal

Combining linguistic and statistical analysis to extract relations from web documents

  • Max-Planck-Institut fur Informatik

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

The World Wide Web provides a nearly endless source of knowledge, which is mostly given in natural language. A first step towards exploiting this data automatically could be to extract pairs of a given semantic relation from text documents - for example all pairs of a person and her birth-date. One strategy for this task is to find text patterns that express the semantic relation, to generalize these patterns, and to apply them to a corpus to find new pairs. In this paper, we show that this approach profits significantly when deep linguistic structures are used instead of surface text patterns. We demonstrate how linguistic structures can be represented for machine learning, and we provide a theoretical analysis of the pattern matching approach. We show the benefits of our approach by extensive experiments with our prototype system LEILA.

langue originaleAnglais
titreKDD 2006
Sous-titreProceedings of the Twelfth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining
EditeurAssociation for Computing Machinery (ACM)
Pages712-717
Nombre de pages6
ISBN (imprimé)1595933395, 9781595933393
Les DOIs
étatPublié - 1 janv. 2006
Modification externeOui
EvénementKDD 2006: 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining - Philadelphia, PA, États-Unis
Durée: 20 août 200623 août 2006

Série de publications

NomProceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining
Volume2006

Une conférence

Une conférenceKDD 2006: 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining
Pays/TerritoireÉtats-Unis
La villePhiladelphia, PA
période20/08/0623/08/06

Empreinte digitale

Examiner les sujets de recherche de « Combining linguistic and statistical analysis to extract relations from web documents ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation