Annotation
Revision as of 12:47, 12 July 2007 by Sabine Patzschke (talk | contribs)
Definition
Der Begriff Annotation bezieht sich auf die linguistische Information, welche einem Korpus hinzugefügt wird. Ein annotiertes Korpus kann Angaben zu den folgenden Kategorien enthalten: Tokens, Wortklassen-Tags, Lemmas, Chunks, und syntaktische Struktur. Daneben sind aber auch andere, weniger oft vorkommende Arten von Annotation denkbar, beispielsweise sematisches, pragmatisches, diskursorientiertes oder problemorientiertes Tagging. Ein syntaktisch annotiertes Korpus heisst Baumbank (Treebank).