Extraktion von Prädikat-Argumentstrukturen aus NPs

Student: N/A

Supervisor: Manfred Klenner, Anne Göhring

Einleitung

Prädikat-Argumentstrukturen  repräsentieren die hinter einem Satz oder einer NP stehende Ereignisstruktur. In "die Würdung des Ministers durch den Senat" erkennen wir das Prädikat "würdigen" und zwei seiner Mitspieler "Senat" (Akteur) und "Minister" (Patiens). Der Genitiv kann beides bezeichen und ist daher ambig. Im Projekt  sollen Daten annotiert und mittels Machine Learning und ggfs. einer regelbasierten Komponente sollen die Strukturen extrahiert.

Ziel

Annotation von Daten: komplexe NPs hinsichtlich der Argumentstruktur. 

Trainieren und Evaluieren eines Extraktors (ML- oder regelbasiert)

Voraussetzungen

  • solide Pythonkenntnisse
  • Machine Learning (inkl. Deeplearning) 
  •  

Vorgehen

  • Extraktion von komplexen NPs aus Korpus
  • Analyse der verschiedene Fälle
  • Annotation ausgewählter Beispiele
  • Aussetzen einer ML-Architektur
  • Trainieren und Evaluieren

 

Ressourcen

Textkorpus für Deutsch (evtl. Tüba)

Literature