Passer à la navigation principale Passer à la recherche Passer au contenu principal

YAWN: A Semantically Annotated Wikipedia XML Corpus

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

The paper presents YAWN, a system to convert the well-known and widely used Wikipedia collection into an XML corpus with semantically rich, self-explaining tags. We introduce algorithms to annotate pages and links with concepts from the WordNet thesaurus. This annotation process exploits categorical information in Wikipedia, which is a high-quality, manually assigned source of information, extracts additional information from lists, and utilizes the invocations of templates with named parameters. We give examples how such annotations can be exploited for high-precision queries.

langue originaleAnglais
titreDatenbanksysteme in Business, Technologie und Web, BTW 2007, 12. Fachtagung des GI-Fachbereichs "Datenbanken und Informationssysteme", DBIS 2007, Proceedings
rédacteurs en chefAlfons Kemper, Harald Schoning, Thomas Rose, Matthias Jarke, Thomas Seidl, Christoph Brochhaus
EditeurGesellschaft fur Informatik (GI)
Pages277-291
Nombre de pages15
ISBN (Electronique)9783885791973
étatPublié - 1 janv. 2007
Modification externeOui
EvénementDatenbanksysteme in Business, Technologie und Web, BTW 2007, 12. Fachtagung des GI-Fachbereichs "Datenbanken und Informationssysteme", DBIS 2007 - Database Systems for Business, Technology and Web, BTW 2007, 12th Conference of the GI Division "Databases and Information Systems", DBIS 2007 - Aachen, Allemagne
Durée: 7 mars 20079 mars 2007

Série de publications

NomLecture Notes in Informatics (LNI), Proceedings - Series of the Gesellschaft fur Informatik (GI)
VolumeP-103
ISSN (imprimé)1617-5468
ISSN (Electronique)2944-7682

Une conférence

Une conférenceDatenbanksysteme in Business, Technologie und Web, BTW 2007, 12. Fachtagung des GI-Fachbereichs "Datenbanken und Informationssysteme", DBIS 2007 - Database Systems for Business, Technology and Web, BTW 2007, 12th Conference of the GI Division "Databases and Information Systems", DBIS 2007
Pays/TerritoireAllemagne
La villeAachen
période7/03/079/03/07

Empreinte digitale

Examiner les sujets de recherche de « YAWN: A Semantically Annotated Wikipedia XML Corpus ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation