Maschinelle Übersetzung für romanische Idiome
Übersetzungssysteme für Rätoromanisch ↔ Deutsch fokussieren aktuell auf die Standardschriftsprache Rumantsch Grischun. In diesem Projekt ergänzen wir die Auswahl der verfügbaren Systeme um die fünf Idiome des Rätoromanischen (Sursilvan, Sutsilvan, Surmiran, Puter, Vallader).
Damit maschinelle Übersetzung für rätoromanische Idiome möglich wird, braucht es insbesondere geeignete Daten. Ein wichtiges Element des Projekts ist daher die Sammlung von parallelen Trainingsdaten sowie die Erarbeitung von Referenzübersetzungen und Evaluierungsdaten für alle fünf Idiome.
Um dieses Ziel zu erreichen, arbeiten wir eng mit der Lia Rumantscha und mit RTR zusammen, und wir kooperieren mit Institutionen wie der PHGR, um idiomspezifische Textdaten der Forschungsöffentlichkeit zur Verfügung zu stellen.