Difference between revisions of "Tagger (de)"
(New page: ==Definition== Ein Tagger versieht jedes Wort in einem Korpus mit einem Tag (Etikett), welches eine part of speech oder eine andere lexikalische Kategorie Kategorie bezeichnet. Die...) |
(Marked as {{ref}}) |
||
(8 intermediate revisions by 3 users not shown) | |||
Line 1: | Line 1: | ||
− | + | Ein '''Tagger''' weist sprachlichen Einheiten ein Etikett (''Tag'') zu, das aus einer gegebenen (endlichen) Menge von Etiketten (''Tagset'') stammt. | |
− | Ein Tagger | ||
− | + | ===Kommentare=== | |
− | + | Die Mehrzahl der verfügbaren Tagger weisen einzelnen Wortformen bzw. Token Tags zu, die morpho-syntaktische Informationen (Wortart, Genus, Numerus, etc.) repräsentieren. Aber es gibt auch Tagger, die die [[semantischen Rollen]] von Nominal- und Präpositionalphrasen | |
+ | ([[sense tagging]]) oder die Diskursstruktur von Texten ([[discourse structure tagging]]) identifizieren sollen. | ||
− | + | Konzeptuell kann Tagging als ein dreistufiger Prozess betrachtet werden: (i). Identifikation der Einheiten (ii). Zuordnung der möglichen Lesarten und (iii). Disambiguierung. | |
− | |||
− | ==Andere Sprachen== | + | Man unterscheidet zwischen regelbasierten und stochastischen Taggern. Allerdings gibt es Tagger, die Regel und stochastische Informationen verwenden. |
+ | |||
+ | Die von morpho-syntaktischen Tagger erzielte Genauigkeit (Korrektheit) liegt in der Regel bei mindestens 95%. | ||
+ | |||
+ | ===Subtypen=== | ||
+ | * [[Brill Tagger]] | ||
+ | * [[HMM Tagger]] | ||
+ | * [[Memory-based Tagger]] | ||
+ | * [http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/DecisionTreeTagger.html TreeTagger] | ||
+ | |||
+ | ===Herkunft=== | ||
+ | englisch ''to tag'' - markieren, mit einem Etikett versehen | ||
+ | |||
+ | ===Andere Sprachen=== | ||
* Englisch [[tagger]] | * Englisch [[tagger]] | ||
+ | |||
+ | {{wb}}{{ref}} | ||
+ | [[Category:Computational Linguistics]] |
Latest revision as of 16:30, 27 July 2014
Ein Tagger weist sprachlichen Einheiten ein Etikett (Tag) zu, das aus einer gegebenen (endlichen) Menge von Etiketten (Tagset) stammt.
Kommentare
Die Mehrzahl der verfügbaren Tagger weisen einzelnen Wortformen bzw. Token Tags zu, die morpho-syntaktische Informationen (Wortart, Genus, Numerus, etc.) repräsentieren. Aber es gibt auch Tagger, die die semantischen Rollen von Nominal- und Präpositionalphrasen (sense tagging) oder die Diskursstruktur von Texten (discourse structure tagging) identifizieren sollen.
Konzeptuell kann Tagging als ein dreistufiger Prozess betrachtet werden: (i). Identifikation der Einheiten (ii). Zuordnung der möglichen Lesarten und (iii). Disambiguierung.
Man unterscheidet zwischen regelbasierten und stochastischen Taggern. Allerdings gibt es Tagger, die Regel und stochastische Informationen verwenden.
Die von morpho-syntaktischen Tagger erzielte Genauigkeit (Korrektheit) liegt in der Regel bei mindestens 95%.
Subtypen
Herkunft
englisch to tag - markieren, mit einem Etikett versehen
Andere Sprachen
- Englisch tagger
REF | This article has no reference(s) or source(s). Please remove this block only when the problem is solved. |