Abgeschlossene Forschungsprojekte

Biomedizinisches Text Mining

  • Kollaboration mit Vetsuisse Veterinary Pathology Text Mining (2014–2016) Weiter
  • Cogito-Projekt PsyMine (2015–2017) Weiter
  • NIH-Projekt Assisted Curation (2015-2018) Weiter

Digital Humanities

  • AGORA-Projekt Citizen Linguistics (2016–2018) Weiter
  • Visual Linguistics (2015–2018) Weiter
  • Extraktion von Zeitausdrücken in historischen Texten (2014–2019) Weiter
  • SNIS-Projekt Diffusion of Law (2015–2017) Weiter
  • Digitalisierung und Auszeichnung der Zürcher Regierungsratsbeschlüsse (2011) Weiter

Maschinelle Übersetzung

  • SNIS-Projekt Diffusion of Law (2015–2017) Weiter
  • MODERN: Diskurs in der Statistischen Maschinellen Übersetzung (2013–2017) Weiter
  • Trainslate: Maschinelle Übersetzung in Gebärdensprache (2011–2016) Weiter
  • Hybride Maschinelle Übersetzung (2011–2015) Weiter
  • Maschinelle Übersetzung im praktischen Einsatz (2012–2013) Weiter
  • Domänenspezifische Maschinelle Übersetzung (2010–2013) Weiter

Medieninhaltsanalyse

  • Sub-Projekt im ERC-finanzierten Projekt POLCON: Automatische Extraktion von Protestereignissen (2014–2018) Weiter
  • NCCR democracy: Automatische Medieninhaltsanalyse für Deutsch, Französisch und Englisch (2013–2017) Weiter

Sentimentanalyse und Opinion Mining

  • SNF: Bi-directional Sentiment Composition (2009–2012)
  • KTI: Erwartungsbasierte Sentimentanalyse (Jan 2015 – Dez 2015): Projektseite (Forschung)
  • KTI: Behavioural Simulator for Professional Training based on Natural Language Interaction (Juni 2016 – Sept 2018): Projektseite (Forschung), LifeLike (Kooperation mit Wirtschaft)
  • Argus (2013) (Kooperation mit Wirtschaft)
  • Netbreeze/Microsoft (2014) (Kooperation mit Wirtschaft)
  • Eurospider (2015) (Kooperation mit Wirtschaft)

Korpuslinguistik

  • SPARCLING: grosses paralleles Korpus zur Untersuchung linguistischer Variation (2013–2017) Weiter
  • SMULTRON: parallele treebanks Deutsch-Englisch-Schwedisch Weiter

Weitere Forschungsgebiete

  • Antwortextraktion. Wir versuchen, auf intelligente Art auf den Inhalt von Texten zuzugreifen, indem wir in Texten (exakte) Antworten auf sprachlich formulierte Fragen zu finden versuchen. Weiter
  • Kontrollierte Sprache. Wir erforschen, wie die Ambiguität natürlicher Sprache durch Einschränkung von Lexikon, Syntax und Semantik kontrolliert werden kann. Weiter
  • Koreferenzauflösung. Koreferenz bezeichnet das Phänomen, dass eine Entität durch unterschiedlichen Formen an der Textoberfläche referiert werden kann ("Obama" - "Der Präsident" - "er"). Wir erforschen automatische Verfahren, um diese Referenzen zu erkennen. Weiter
  • Linguistisch unterstütztes Redigieren – LingURed. Wir untersuchen, wie typische Fehler beim Schreiben und Redigieren von Texten (z.B. falsche Wortstellung, Sätze ohne Verb) vermieden werden können. Wir entwickeln Funktionen für Textverarbeitungsprogramme, die auf sprachlichen Einheiten und sprachlichem Wissen beruhen. Weiter
  • Maschinelle Stilprüfung. Wir betreiben Forschung im Bereich der maschinellen Stilprüfung. Unser Fokus liegt dabei speziell auf der domänenspezifischen Stilanalyse schweizerischer Gesetzestexte. Weiter
  • NLP für Quechua. Wir erstellen sprachtechnologische Ressourcen für Cuzco-Quechua, eine indigene Sprache mit ca. 1.5 Millionen Sprechern v.a. in Peru. Die Ressourcen reichen von Morphologie-Analyse-Werkzeugen über Rechtschreibeprüfer und maschinelle Übersetzung bis hin zu parallelen annotierten Korpora (Baumbanken). Weiter
  • Satzergänzungstests. Satzergänzungstests (SET) ähneln Multiple Choice Tests, sie erlauben dem Benutzer jedoch, sprachlich sehr komplexe Antworten zu formulieren, auf welche passende Kommentare generiert werden können.
  • Syntaxanalyse und Grammatikkonstruktion. Wir versuchen, auch grosse Textmengen automatisch syntaktisch zu analysieren und erstellen zu diesem Zweck hybride (teils regelbasierte, teils statistikbasierte) Syntaxanalyseprogramme (Parser), und wir entwickeln dazu geeignete Grammatiken verschiedener westeuropäischer Sprachen. Weiter