Maschinelle Übersetzung im praktischen Einsatz

Das Institut für Computerlinguistik entwickelt und forscht an Übersetzungssystemen für den praktischen Einsatz in der Software-Industrie. Die Arbeit knüpft an unsere Forschung im Bereich domänenspezifische maschinelle Übersetzung an. Auch hier geht es darum, Übersetzungssysteme für bestimmte Domänen zu entwickeln und anzupassen, um optimale Ergebnisse zu erzielen.

Maschinelle Übersetzung von Helpdesk-Tickets

In Kooperation mit Finnova, einem führenden Schweizer Anbieter von Banking-Software, entwickeln wir ein Übersetzungssystem für Helpdesk-Tickets. Dabei handelt es sich um technische Dokumente im Bereich Kundensupport, welche allen Kunden zur Verfügung stehen, und deshalb in verschiedenen Sprachen angeboten werden sollen. In einer ersten Phase befassen wir uns mit der maschinellen Übersetzung von Deutsch nach Englisch.

Projektleiter:

Forschende:

Das Projekt wird von Finnova finanziert und läuft seit März 2012.

Domänenspezifische Statistische Maschinelle Übersetzung für die Automobilindustrie

In diesem KTI-Projekt in Kollaboration mit SemioticTransfer haben wir uns mit der automatischen Übersetzung von deutschen Marketingtexten und technischen Dokumenten aus der Automobilindustrie nach Französisch und Italienisch beschäftigt. Die zentralen Forschungsfragen waren:

  • Domänenadaption: Können wir die Übersetzungsqualität verbessen, indem wir öffentlich verfügbare parallele Korpora zusätzlich zu Trainingsdaten aus der Zieldomäne verwenden?
  • Pivot-Übersetzung: Wie effektiv ist es, die Übersetzung nach Italienisch indirekt über Französisch zu machen?

Die aus dem Projekt resultierenden Maschinellen Übersetzungssysteme werden seither bei SemioticTransfer zur Steigerung der Übersetzungseffizienz eingesetzt und sichern somit Marktvorteile.

Wichtigste Ergebnisse

  • Maschinelle Übersetzungssysteme für DE–FR und DE–IT:
    • Datengrundlage: Domänenspezifische parallele Texte der Automobilindustrie
    • Domänenadaption mit Europarl v7- und OpenSubtitles 2011 (see Läubli et al. 2003a)
    • Automatische Segmentierung von deutschen Komposita zur Übersetzung der einzelnen Wortteile (see Läubli et al. 2003b)
  • Einbindung der Übersetzungssysteme in den Übersetzungsworkflow von SemioticTransfer
  • Studie zur Effizienz der Übersetzungssysteme mittels Post-Editing: Zeiteinsparung von 17.4% bei gleichbleibender Qualität (see Läubli et al. 2003c)

Publikationen

  1. Läubli, Samuel, Mark Fishel, Gary Massey, Maureen Ehrensberger-Dow, and Martin Volk. 2013a. Assessing Post-Editing Efficiency in a Realistic Translation Environment. In Proceedings of the Second Workshop on Post-editing Technology and Practice (WPTP2), pages 83–91, Nice, France.
  2. Läubli, Samuel, Mark Fishel, Manuela Weibel, and Martin Volk. 2013b. Statistical Machine Translation for Automobile Marketing Texts. In Proceedings of the Fourteenth Machine Translation Summit (MT Summit XIV), pages 265–272, Nice, France.
  3. Läubli, Samuel, Mark Fishel, Martin Volk, and Manuela Weibel. 2013c. Combining Statistical Machine Translation and Translation Memories with Domain Adaptation. In Proceedings of the 19th Nordic Conference of Computational Linguistics (NODALIDA 2013), pages 331–341, Oslo, Norway.

Involvierte Personen

Das Projekt wurde vom KTI und SemioticTransfer finanziert und lief von Juli 2012 bis Juli 2013.