Generalisierte Phrasenstrukturgrammatik
Definition
Die generalisierte Phrasenstrukturgrammatik (GPSG) ging aus Arbeiten von Gerald Gazdar et al. (1985) hervor und basiert auf dem Konzept der kontextfreien Prhasenstrukturgrammatik. Gazdar versuchte den Transformationsgrammatiken, welche äußerst komplexe Systeme bilden und nur schwer zu beschreiben sind, ein formal eingeschränkteres Grammatikmodell entgegenzusetzen, das ohne Transformationen und mit einer einzigen Repräsentationsebene auskommt (daher oft als monostratales Grammatikmodell bezeichnet).. Die syntaktische Repräsentation ist ein Phrasenstrukturbaum, dessen nicht-terminale Knoten syntaktische Kategorien in der Form partiell spezifizierter Merkmalsstrukturen sind. Der Grammatikformalismus der GPSG stellt ein komplexes System von Regeln und Bedingungen bereit, welche die Wohlgeformtheit der lokalen Bäume in der Repräsentation eines Satzes und damit die Grammatikalität des Satzes bestimmen. Viele der syntaktischen Gesetzmässigkeiten, die in Transformationsgrammatiken durch Transformationen beschrieben sind, werden in der GPSG durch Metaregeln repräsentiert, die aus Phrasenstrukturregeln andere Phrasenstrukturregeln erzeugen. Im vergleich zu kopfgesteuerten Phrasenstrukturgrammatik (HPSG) ist die Grammatik nur schwach lexikalisiert.
GPSG als formales System
Eine GPSG ist ein formales Modell zur Beschreibung von Sprache. Als linguistisches Modell muss es linguistisch signifikante Relationen, wie Dominanz oder Abhängigkeit darstellen bzw. kodieren können und Informationen über deren Zusammenhang bereit stellen.
Der Formalismus der GPSG im Detail
Betrachtet man die GPSG aus der Perspektive einer Theorie über formale Sprachen, so kann man sie sich als Grammatik zur Erzeugung einer kontextfreien Grammatik vorstellen. Der Erzeugungsprozess beginnt mit:
1. die ID-Regeln und die LP-Regeln
- Die ID-Regeln kann man sich als kontextfreie Produktionsregeln (was sie aber nicht sind!) mit unsortierten rechten Regelseiten vorstellen. Sie haben die Aufgabe die Menge der in einer Grammatik zulässigen Bäume einzugrenzen. Jede ID-Regel lässt nur eine bestimmte Menge von lokalen Bäumen (Baum der Tiefe 1) zu. Eine ID-Regel x-> y1, y2, y3 lässt z.B. sechs lokale Bäume zu, welche sich nur durch die Reihenfolge ihrer Endknoten unterscheiden.
- LP-Regeln grenzen diese Menge der zulässigen Knoten, durch Ausschliessen der gegen die spezifizierten Ordnungsvorschriften verstossenden Knoten, weiter ein.
- Wichtig bei ID-Regeln ist, daß Nichtterminalsymbole in den Regeln nicht atomar vorkommen, sondern immer als [Merkmal Merkmal-Wert] - Paare auftreten. Zum Beispiel ist [N +] ein [Merkmal Merkmal-Wert] - Paar und eine Liste aus solchen Regeln {[N +], [V -], [BAR 2]} ist die GPSG-Repräsentation einer Nominalphrase.
Als nächstes werden
2. Metaregeln (engl.: meta rules)
- auf die ID-Regeln angewendet, was zur Generalisierung des Regelwerkes führt. Es geht bei diesen Regeln um die Relationen zwischen ID-Regeln. Metaregeln bestehen aus einem festgelegten Eingabe-Schema und einem festgelegten Ausgabe-Schema welches eine erkannte Multisetvariable W enthält. Wenn eine ID-Regel auf die linke Seite einer Metaregel und deren Multisetvariable auf der rechten Regelseite passt erzeugt die Metaregel eine ID-Regel, welche der rechten Regelseite der Metaregel entspricht.
- Zum Beispiel drückt die Metaregel für das Passiv im Englischen
- VP -> W, NP
- VP[pas] -> W,(PP[by])
- aus, daß für jede ID-Regel welche einer Verbalphrase erlaubt eine Nominalphrase zu dominierendes ebenfalls eine Regel in der Grammatik gibt, welche erlaubt, daß die Verbalphrase genau den Inhalt, welchen sie durch die bereits gegebene ID - Regel dominieren darf, auch in Verbindung mit einem "by" dominieren darf.
- Metaregeln erweitern das Regelwerk um jene Fälle, die in allgemeiner Form durch Metaregeln spezifiziert sind und werden nur auf die ID-Regeln angewandt, die lexikalische Head-Kategorien enthalten.
- Des Weiteren werden die Prinzipien der
3. Universellen Instantiierungsprinzipien (UFI)
- auf das erweiterte Regelwerk angewendet, was zu einem noch mehr erweiterten Regelwerk führt. Eines dieser Prinzipien ist die head feature convention welche sicherstellt, daß die Phrasen vom lexikalischen Kopf aus in Strukturbäume projiziert werden. Informell ausgedrückt ist die head feature convention die X'-Theorie der GPSG. Hier findet die Instantiierung von Strukturbäumen als Ausdrucksmittel des Regelwerkes statt.
- Das Foot-Feature Prinzip schränkt die Instantiierung der Foot-Merkmale in lokalen Bäumen ein. Es legt fest, daß die Menge der in einer Mutterkategorie eines lokalen Baums instantiierten Foot-Merkmale identisch ist mit der Unifikation der in allen Tochterkatergorien des Baums instantiierten Foot-Merkmale.
- Das Control-Agreement Prinzip (CAP) ermöglicht eine adäquate Behandlung von Kongruenzbeziehungen innerhalb der GPSG, eine einfache und umfassende Umschreibung der Kongruenzbeziehungen, die sich im Prinzip auch direkt durch KF-Regeln erreichen läßt. Das CAP unterscheidet sich in einem Punkt grundsätzlich von den anderen Instantiierungsprinzipien und auch sonst von allen Regeln der GPSG: es setzt voraus, daß semantische Informationen über die Kategorien des lokalen Baumes vefügbar sind.
- Innerhalb einer ID-Regel ist es möglich, daß die Mutter und eine oder mehrere Töchter dieselben Spezifikationen für n und v haben. Diejenige unter diesen Töchtern mit dem kleinsten bar-Wert, der kleiner oder gleich dem bar-Wert der Mutter ist, wird üblicherweise Head genannt.
- Diese Auszeichnung vor anderen Töchtern ist nützlich, da Mutter und Head (unabhängig von ihrer jeweiligen Spezifikation für n und v) viele weitere Eigenschaften teilen. In GPSG drückt sich dies in der gleichen Spezifikation weiterer Merkmale an Mutter und Head aus. Diese Kospezifikation wird auf der metagrammatischen Ebene durch das Merkmalinstantiierungsprinzip Head Feature Convention (HFC) erreicht. Eine ID-Regel genügt der HFC, wenn ihre Mutter und ihr Head bezüglich einer Menge von Head-Merkmalen übereinstimmen. Durch HFC als universelles Prinzip wird eine weitere Generalisierung erreicht, die mit PS-Regeln nicht darstellbar ist.
Abschließend werden
4. Aussagen über die linearen Abhängigkeiten (engl. linear precendence (LP) statements)
- auf die Strukturbäume angewandt, was dazu führt, dass die ungeordneten Strukturbäume geordnet werden. Das ultimative Resultat ist eine Liste aus geordneten Strukturbäumen welche Äquivalent zu den Produktionsregeln kontextfreien Grammatik sind. Die resultierende kontextfreie Grammatik kann die Sprache der GPSG ableiten.
Literatur
- Gazdar, G., Klein, E., Pullum, G. and Sag, I. 1985.
- Generalized Phrase Structure Grammar. Cambridge, MA: Harvard University Press.
- Naumann, S. (1988) Generalisierte Phrasenstrukturgrammatik: Parsingstrategien, Regelorganisation und Unifikation Max Niemeyer Verlag
Ursprung
- griech. phrasis - Ausdruck, Wendung
- griech. grammatike (techne) zu grammtikos - die Buchstaben betreffend
RTFM
Empfehlenswerte, bestenfalls vorher zu lesende Literatur:
- X-Bar - Theorie
- Unifikationsgrammatiken
- Merkmalstrukturen