Maschinelle Übersetzung für romanische Idiome
Übersetzungssysteme für Rätoromanisch ↔ Deutsch fokussieren aktuell auf die Standardschriftsprache Rumantsch Grischun. In diesem Projekt ergänzen wir die Auswahl der verfügbaren Systeme um die fünf Idiome des Rätoromanischen (Sursilvan, Sutsilvan, Surmiran, Puter, Vallader).
Damit maschinelle Übersetzung für rätoromanische Idiome möglich wird, braucht es insbesondere geeignete Daten. Ein wichtiges Element des Projekts ist daher die Sammlung von parallelen Trainingsdaten sowie die Erarbeitung von Referenzübersetzungen und Evaluierungsdaten für alle fünf Idiome.
Um dieses Ziel zu erreichen, arbeiten wir eng mit der Lia Rumantscha und mit RTR zusammen, und wir kooperieren mit Institutionen wie der PHGR, um idiomspezifische Textdaten der Forschungsöffentlichkeit zur Verfügung zu stellen.
Update 28. April 2026: Das Übersetzungssystem ist ab heute unter https://alas.liarumantscha.ch/ verfügbar.
Leiter der Forschungsgruppe
Projektmanagement
Forschungsassistenz
Angela Heldstab, Dominic Fischer
Frühere Mitarbeitende
Sina Ahmadi, Zachary Hopton, Anna Rutkiewicz, Zdeněk Šnajdr
Publikationen
Jannis Vamvas, Ignacio Pérez Prat, Angela Heldstab, Dominic P. Fischer, Sina Ahmadi and Rico Sennrich. 2026. Translation Asymmetry in LLMs as a Data Augmentation Factor: A Case Study for 6 Romansh Language Varieties. Pre-print. [cite] [data] [model] [code]
Dominic P. Fischer, Zachary Hopton and Jannis Vamvas. 2026. RUMLEM: A Dictionary-Based Lemmatizer for Romansh. In Proceedings of the 11th edition of the Swiss Text Analytics Conference, Zurich, Switzerland. Association for Computational Linguistics. [cite] [code] [demo]
Charlotte Model, Sina Ahmadi and Jannis Vamvas. 2026. Robust Language Identification for Romansh Varieties. In Proceedings of the 11th edition of the Swiss Text Analytics Conference, Zurich, Switzerland. Association for Computational Linguistics. [cite] [code]
Jannis Vamvas, Ignacio Pérez Prat, Not Battesta Soliva, and 14 others. 2025. Expanding the WMT24++ Benchmark with Rumantsch Grischun, Sursilvan, Sutsilvan, Surmiran, Puter, and Vallader. In Proceedings of the Tenth Conference on Machine Translation (WMT 2025), pages 1028–1047, Suzhou, China. Association for Computational Linguistics. [cite] [data] [code]
Zachary Hopton, Jannis Vamvas, Andrin Büchler, Anna Rutkiewicz, Rico Cathomas, and Rico Sennrich. 2026. The Mediomatix Corpus: Parallel Data for Romansh Language Varieties via Comparable Schoolbooks. In Findings of the Association for Computational Linguistics: EACL 2026, pages 290–306, Rabat, Morocco. Association for Computational Linguistics. [cite] [data] [code]
Apertus Team. 2026. Apertus: Democratizing Open and Compliant LLMs for Global Language Environments. In Proceedings of the 64th Annual Meeting of the Association for Computational Linguistics, San Diego, California, United States. Association for Computational Linguistics. [cite] [model]
Medienspiegel
Radiotelevisiun Svizra Rumantscha (RTR): «ALAS»: Neues Übersetzungssystem für alle Idiome. April 28, 2026. https://www.rtr.ch/novitads/svizra/lia-rumantscha-preschenta-sin-alas-dad-in-idiom-a-l-auter
- Marietta Cathomas, Linguistin RTR: «Ich muss zugeben, dass ich bis anhin ungern mit solchen Tools und Apps übersetzt habe, weil die Qualität nicht stimmte. ‹Alas› jedoch generiert vielversprechende Übersetzungen. ‹Alas› übersetzt sehr nah am Deutschen, weshalb die generierten Texte nicht 1:1 übernommen werden können. Man muss sie auf jeden Fall noch durchlesen und überarbeiten. Aber die Grundlage ist sehr gut ... Am meisten überrascht hat mich die Qualität der Rechtschreibung: ‹Alas› macht praktisch keine Rechtschreibfehler.»
- Flavio Bundi, Chefredaktor RTR: «Wir profitieren in unserer täglichen Arbeit. Das Übersetzen in alle Idiome geht viel besser, was u.a. die Zusammenarbeit mit externen Partnern, z.B. mit der Fundaziun Medias Rumantschas, erleichtert. Andererseits können wir die Texte auf rtr.ch zukünftig in allen Idiomen und nicht nur auf Rumantsch Grischun anbieten.»
TV Südostschweiz: Rondo News, by Demian Spescha & Noa Bühler. April 28, 2026. https://www.tvsuedostschweiz.ch/sendungen/rondo-news/1187392210?t=299
- Markus Solinger, Generalsekretär Lia Rumantscha: «Dieses Programm hat eine grosse Bedeutung [für die Rumantschia]. Mit der Übersetzung Rumantsch Grischun–Deutsch und Deutsch–Rumantsch Grischun hatte man bereits ein Tool, das von Ämtern und Institutionen genutzt wurde. Aber dort, wo die Menschen wirklich leben – in den Idiomen, in den Regionen –, gab es bisher nichts, um zu übersetzen. Darum sind wir sehr froh, dass wir das jetzt anbieten können.»
SRF Regionaljournal Graubünden: “«Meilenstein für alle romanischen Idiome»,” by Matthias Jörg. April 28, 2026. https://www.srf.ch/audio/regionaljournal-graubuenden/meilenstein-fuer-alle-romanischen-idiome?id=AUDI20260428_NR_0015
Keystone-SDA: “KI-Programm übersetzt erstmals alle rätoromanischen Sprachvarianten.” April 28, 2026. https://www.swissinfo.ch/ger/ki-programm-%C3%BCbersetzt-erstmals-alle-r%C3%A4toromanischen-sprachvarianten/91326443
La Quotidiana: “Sin «Alas» dad in idiom a l’auter,” by Andreas Cadonau. April 28, 2026. 30. annada, numer 80, page 3. https://www.gasetta.ch/2026/04/27/sin-alas-dad-in-idiom-a-lauter/
The New Yorker: “Valley of Babel,” by Simon Akam. December 8, 2025 issue. https://www.newyorker.com/magazine/2025/12/08/a-very-big-fight-over-a-very-small-language
Blick Online: “Schweizer KI Apertus im Test: Wer ist Bundesrat Vinterti Monic?”, by Thomas Benkö and Tobias Bolzern. September 2, 2025. https://www.blick.ch/digital/schweizer-ki-apertus-im-test-wer-ist-bundesrat-vinterti-monic-id21193504.html
- «Noch detaillierter wurde die Sprachkompetenz [von Apertus] von der Uni Zürich geprüft: Dort übersetzten Forscherinnen und Forscher mit Apertus über 1000 Texte in Rumantsch Grischun und die fünf Idiome Sursilvan, Sutsilvan, Surmiran, Puter und Vallader. Dabei war alles von Zeitungsartikeln über Science-Fiction bis zu YouTube-Tutorials. Ergebnis: Apertus schlägt sich besser als andere offene Modelle wie Llama oder GPT-OSS, erreicht aber längst nicht das Niveau menschlicher Übersetzer.»