Downloads und Ressourcen
An unserm Institut haben wir einige NLP-Ressourcen geschaffen, welche Sie direkt herunterladen oder bei den verantwortlichen Personen anfragen können:
- 4561 deutsche Testfälle (ZIP, 122 KB) für PP-Anbindung aus der Computerzeitung verwendet in der Habilitationsschrift: Martin Volk: The automatic resolution of prepositional phrase attachment ambiguities in German. University of Zurich. 2001.
- Ein manuell korrigiertes wortartengetaggtes Korpus (ZIP, 166 KB)von ca. 62.000 Token (Language: German; Domain: Reports about the University of Zurich; PoS-Tagset: STTS)
- 3000 Sätze, welche vollständig im NEGRA-Format annotiert sind (Computerzeitung) Bitte Martin Volk kontaktieren.
- Der deutschsprachige Thesaurus UniNet mit ca. 20'000 Nomen im WordNet-Format zum Anwendungsbereich (schweizerisches) Universitätsvokabular (im Web anschauen). Für andere Formate bitte Simon Clematide kontaktieren.
- Ein Python script (ZIP, 10 KB) zur Berechnung von vollständigen Lemmas für elliptische deutsche Komposita entwickelt von Noëmi Aepli 2013
- Deutsch-Rätoromanisches Parallelkorpus (ZIP, 14546 KB) erstellt von Manuela Weibel in ihrer Masterarbeit
- NOAH's Corpus of Swiss German Dialects manuell annotiert mit POS Tags