Header

Search

Machine Translation for Romansh Idioms

Machine translation systems for Romansh ↔ German currently focus on the standardized written variety Rumantsch Grischun. In this project, we expand the range of available systems to include the five idioms of Romansh (Sursilvan, Sutsilvan, Surmiran, Puter, Vallader).

Suitable data is particularly essential for enabling this technology. Thus, an important element of the project involves collecting parallel training data, as well as creating reference translations and ratings of translation quality for all five idioms.

To achieve these goals, we are collaborating closely with Lia Rumantscha and RTR, and are working together with institutions such as PHGR to make idiom-specific text data available to the research community. 

Update April 28, 2026: The translation system is now available at https://alas.liarumantscha.ch/.

Group leader

Rico Sennrich

Project manager

Jannis Vamvas

Research Assistants

Angela Heldstab, Dominic Fischer

 

Earlier team members

Sina Ahmadi, Zachary Hopton, Anna Rutkiewicz, Zdeněk Šnajdr

 

Publications

Jannis Vamvas, Ignacio Pérez Prat, Angela Heldstab, Dominic P. Fischer, Sina Ahmadi and Rico Sennrich. 2026. Translation Asymmetry in LLMs as a Data Augmentation Factor: A Case Study for 6 Romansh Language Varieties. Pre-print. [cite] [data] [model] [code]

Dominic P. Fischer, Zachary Hopton and Jannis Vamvas. 2026. RUMLEM: A Dictionary-Based Lemmatizer for Romansh. In Proceedings of the 11th edition of the Swiss Text Analytics Conference, Zurich, Switzerland. Association for Computational Linguistics. [cite] [code] [demo]

Charlotte Model, Sina Ahmadi and Jannis Vamvas. 2026. Robust Language Identification for Romansh Varieties. In Proceedings of the 11th edition of the Swiss Text Analytics Conference, Zurich, Switzerland. Association for Computational Linguistics. [cite] [code]

Jannis Vamvas, Ignacio Pérez Prat, Not Battesta Soliva, and 14 others. 2025. Expanding the WMT24++ Benchmark with Rumantsch Grischun, Sursilvan, Sutsilvan, Surmiran, Puter, and Vallader. In Proceedings of the Tenth Conference on Machine Translation (WMT 2025), pages 1028–1047, Suzhou, China. Association for Computational Linguistics. [cite] [data] [code]

Zachary Hopton, Jannis Vamvas, Andrin Büchler, Anna Rutkiewicz, Rico Cathomas, and Rico Sennrich. 2026. The Mediomatix Corpus: Parallel Data for Romansh Language Varieties via Comparable Schoolbooks. In Findings of the Association for Computational Linguistics: EACL 2026, pages 290–306, Rabat, Morocco. Association for Computational Linguistics. [cite] [data] [code]

Apertus Team. 2026. Apertus: Democratizing Open and Compliant LLMs for Global Language Environments. In Proceedings of the 64th Annual Meeting of the Association for Computational Linguistics, San Diego, California, United States. Association for Computational Linguistics. [cite] [model]

The Project in the News

Radiotelevisiun Svizra Rumantscha (RTR): «ALAS»: Neues Übersetzungssystem für alle Idiome. April 28, 2026. https://www.rtr.ch/novitads/svizra/lia-rumantscha-preschenta-sin-alas-dad-in-idiom-a-l-auter

  • Marietta Cathomas, Linguistin RTR: «Ich muss zugeben, dass ich bis anhin ungern mit solchen Tools und Apps übersetzt habe, weil die Qualität nicht stimmte. Alas jedoch generiert vielversprechende Übersetzungen. Alas übersetzt sehr nah am Deutschen, weshalb die generierten Texte nicht 1:1 übernommen werden können. Man muss sie auf jeden Fall noch durchlesen und überarbeiten. Aber die Grundlage ist sehr gut ... Am meisten überrascht hat mich die Qualität der Rechtschreibung: Alas macht praktisch keine Rechtschreibfehler.»
  • Flavio Bundi, Chefredaktor RTR: «Wir profitieren in unserer täglichen Arbeit. Das Übersetzen in alle Idiome geht viel besser, was u.a. die Zusammenarbeit mit externen Partnern, z.B. mit der Fundaziun Medias Rumantschas, erleichtert. Andererseits können wir die Texte auf rtr.ch zukünftig in allen Idiomen und nicht nur auf Rumantsch Grischun anbieten.»

TV Südostschweiz: Rondo News, by Demian Spescha & Noa Bühler. April 28, 2026. https://www.tvsuedostschweiz.ch/sendungen/rondo-news/1187392210?t=299

  • Markus Solinger, Generalsekretär Lia Rumantscha: «Dieses Programm hat eine grosse Bedeutung [für die Rumantschia]. Mit der Übersetzung Rumantsch Grischun–Deutsch und Deutsch–Rumantsch Grischun hatte man bereits ein Tool, das von Ämtern und Institutionen genutzt wurde. Aber dort, wo die Menschen wirklich leben – in den Idiomen, in den Regionen –, gab es bisher nichts, um zu übersetzen. Darum sind wir sehr froh, dass wir das jetzt anbieten können.»

SRF Regionaljournal Graubünden: “«Meilenstein für alle romanischen Idiome»,” by Matthias Jörg. April 28, 2026. https://www.srf.ch/audio/regionaljournal-graubuenden/meilenstein-fuer-alle-romanischen-idiome?id=AUDI20260428_NR_0015

Keystone-SDA: “KI-Programm übersetzt erstmals alle rätoromanischen Sprachvarianten.” April 28, 2026. https://www.swissinfo.ch/ger/ki-programm-%C3%BCbersetzt-erstmals-alle-r%C3%A4toromanischen-sprachvarianten/91326443

La Quotidiana: “Sin «Alas» dad in idiom a l’auter,” by Andreas Cadonau. April 28, 2026. 30. annada, numer 80, page 3. https://www.gasetta.ch/2026/04/27/sin-alas-dad-in-idiom-a-lauter/

The New Yorker: “Valley of Babel,” by Simon Akam. December 8, 2025 issue. https://www.newyorker.com/magazine/2025/12/08/a-very-big-fight-over-a-very-small-language

Blick Online: “Schweizer KI Apertus im Test: Wer ist Bundesrat Vinterti Monic?”, by Thomas Benkö and Tobias Bolzern. September 2, 2025. https://www.blick.ch/digital/schweizer-ki-apertus-im-test-wer-ist-bundesrat-vinterti-monic-id21193504.html

  • «Noch detaillierter wurde die Sprachkompetenz [von Apertus] von der Uni Zürich geprüft: Dort übersetzten Forscherinnen und Forscher mit Apertus über 1000 Texte in Rumantsch Grischun und die fünf Idiome Sursilvan, Sutsilvan, Surmiran, Puter und Vallader. Dabei war alles von Zeitungsartikeln über Science-Fiction bis zu YouTube-Tutorials. Ergebnis: Apertus schlägt sich besser als andere offene Modelle wie Llama oder GPT-OSS, erreicht aber längst nicht das Niveau menschlicher Übersetzer.»