Difference between revisions of "Tagger (de)"
m (→Kommentare) |
|||
Line 8: | Line 8: | ||
Konzeptuell kann Tagging als ein dreistufiger Prozess betrachtet werden: (i). Identifikation der Einheiten (ii). Zuordnung der möglichen Lesarten und (iii). Disambiguierung. | Konzeptuell kann Tagging als ein dreistufiger Prozess betrachtet werden: (i). Identifikation der Einheiten (ii). Zuordnung der möglichen Lesarten und (iii). Disambiguierung. | ||
− | Man unterscheidet zwischen regelbasierten und stochastischen Taggern. Allerdings gibt es Tagger, die Regel | + | Man unterscheidet zwischen regelbasierten und stochastischen Taggern. Allerdings gibt es Tagger, die Regel und stochastische Informationen verwenden. |
Die von morpho-syntaktischen Tagger erzielte Genauigkeit (Korrektheit) liegt in der Regel bei mindestens 95%. | Die von morpho-syntaktischen Tagger erzielte Genauigkeit (Korrektheit) liegt in der Regel bei mindestens 95%. | ||
− | |||
==Subtypen== | ==Subtypen== |
Revision as of 18:23, 6 July 2007
Definition
Ein Tagger weist sprachlichen Einheiten ein Etikett (Tag) zu, das aus einer gegebenen (endlichen) Menge von Etiketten (Tagset) stammt.
Kommentare
Die Mehrzahl der verfügbaren Tagger weisen einzelnen Wortformen bzw. Token Tags zu, die morpho-syntaktische Informationen (Wortart, Genus, Numerus, etc.) repräsentieren. Aber es gibt auch Tagger, die die semantischen Rollen von Nominal- und Präpositionalphrasen (sense tagging) oder die Diskursstruktur von Texten (discourse structure tagging) identifizieren sollen.
Konzeptuell kann Tagging als ein dreistufiger Prozess betrachtet werden: (i). Identifikation der Einheiten (ii). Zuordnung der möglichen Lesarten und (iii). Disambiguierung.
Man unterscheidet zwischen regelbasierten und stochastischen Taggern. Allerdings gibt es Tagger, die Regel und stochastische Informationen verwenden.
Die von morpho-syntaktischen Tagger erzielte Genauigkeit (Korrektheit) liegt in der Regel bei mindestens 95%.
Subtypen
Herkunft
engl. to tag - markieren, mit einem Etikett versehen
Andere Sprachen
- Englisch tagger