Erweiterter Kontext in Neuronaler Maschineller Übersetzung

Das führende Modell in der maschinellen Übersetzung war in den letzten Jahren der sogenannte statistische Ansatz: Das Übersetzungssystem lernt aus übersetzten Texten Wortfolgen, die einander entsprechen. Diese parallelen Phrasen werden neu kombiniert um Übersetzungen für neue Texte zu erzeugen.
Bei diesem Vorgehen lassen sich jedoch die Abhängigkeiten, die über den näheren Kontext eines Wortes, oder gar über Satzgrenzen hinausgehen, nur schlecht berücksichtigen.
Ein neuer Ansatz, mit dem wir in diesem Projekt arbeiten, nutzt neuronale Netzwerke, die teilweise Gehirnstrukturen nachempfunden sind, um direkt von einer zur anderen Sprache zu übersetzen.

 

Bild kann nicht angezeigt werden

In diesem Projekt untersuchen wir, welche Möglichkeiten sich für die Übersetzung ergeben, wenn das Netzwerk zusätzliche Informationen aus dem Kontext erhält, wie z.B. Koreferenz- und Syntaxannotationen oder mehrere Ausgangssprachen.

Mit diesem neuen Ansatz werden wir Übersetzungsysteme für die drei der offiziellen Sprachen der Schweiz erstellen (Französisch, Deutsch, Italienisch).

Projektleiter

Martin Volk

Forschende

Rico Sennrich

Annette Rios

Mathias Müller

Dieses Projekt ist finanziert durch den Schweizerischen Nationalfonds für drei Jahre ab Januar 2017.