Kursinhalt

Modul 1: Computer-Aided Translation and Basic Programming

Kurstag 1: Latest Developments in CAT Tools

An diesem Kurstag werden die wichtigsten neuen Funktionalitäten in gängigen CAT-Tools vorgestellt. Dabei wird besonderes Augenmerk auf Funktionalitäten gelegt, die direkten Bezug zur Verwendung von MÜ bei der Arbeit im CAT-Tool haben: Welche MÜ-Systeme lassen sich in CAT-Tools einbinden? Wie lassen sich MÜ-Vorschläge und CAT-Tools-Treffer produktiv kombinieren und verwenden? Welche Werkzeuge bieten CAT-Tools im Hinblick auf Qualität von MÜ und Post-Editing-Aufwand? Die TeilnehmerInnen erhalten Gelegenheit, das Gelernte in praktischen Übungen anzuwenden. 

Kurstag 2: File Formats and Encoding; Query Languages and Regular Expressions

An diesem Kurstag werden die wichtigsten Dateiformate für die Verarbeitung und den Austausch von linguistischen Daten vorgestellt. Weiterhin werden relevante Abfragesprachen (Query Languages) zur Abfrage und Aufbereitung von Informationen aus Datenquellen präsentiert. Ein weiterer Schwerpunkt ist die Verwendung sogenannter regulärer Ausdrücke zum Filtern und Bearbeiten relevanter Daten in grossen Datenmengen anhand bestimmter Muster und Kriterien. 

Kurstag 3: Style and Quality Checking; Project Management and Workflows

Dieser Kurstag beschäftigt sich mit automatisierten Workflows zu den Themen Style und Quality Checking. Style und Quality Checking beeinflussen nicht nur den Zieltext, der gerade erstellt wird, sondern besonders auch das Translation Memory (TM), in dem er gespeichert wird. Die Teilnehmenden werden grundlegende Methoden und Kriterien des Style and Quality Checkings kennenlernen.  Weitere Themen dieses Kurstages sind der Umgang mit gängigen freien und CAT-Tool-gebundenen Tools sowie die automatisierte TM-Pflege (u.a. mit Hilfe der im vorhergehenden Kurstag gelernten regulären Ausdrücke). 

Kurstag 4: Sentence and Word Alignment; Multilingual Search Tools

Dieser Kurstag beschäftigt sich mit der Gewinnung von Informationen aus
vorhandenen Übersetzungen mittels Alignierung.

Aus bereits übersetzten Texten können Informationen über
Wortentsprechungen gewonnen werden, die es u. a. erlauben, in neuen
Übersetzungskontexten Vorschläge zu machen (Translation Memories),
statistische Modelle für die automatische Übersetzung zu konstruieren
(Machine Translation) oder für Sprachlerner typische Beispiele
verschiedener Übersetzungsvarianten zu identifizieren (Data-driven
Learning). An diesem Kurstag werden die Teilnehmer die Grundlagen der
automatischen Ermittlung von Satz- und Wortentsprechungen (Alignierung)
kennenlernen, verschiedene Alignierungswerkzeuge selbst benutzen und die
Grenzen dieser statistischen Sprachmodellierung in parallelen
Suchsystemen austesten.

Kurstag 5: Terminology Databases and Term-Extraction

Dieser Kurstag vermittelt grundlegende Kenntnisse im Hinblick auf Terminologiearbeit.

Dabei werden zunächst die Grundbegriffe der Terminologielehre beleuchtet. Auf dieser Basis aufbauend lernen die Teilnehmenden im Anschluss unterschiedliche Methoden und Tools kennen, mit denen Terminologie aus Texten und Textsammlungen extrahiert werden kann. Weitere Themen sind grundlegende Eigenschaften von Terminologiedatenbanken und deren Bestandteile, sowie etablierte Methoden im Hinblick auf den Aufbau von Terminologiedatenbanken. Die Teilnehmenden festigen ihre Kenntnisse jeweils im Anschluss an die theoretischen Inputs anhand von kurzen praktischen Übungen

 

Modul 2: Machine Translation and AI 

Kurstag 1: Introduction to Artificial Intelligence: Machine Learning and Neural Networks

Der Kurstag vermittelt Grundlagen im maschinellen Lernen, insbesondere mit künstlichen neuronalen Netzwerken.

An einfachen Beispielen wird gezeigt, wie künstliche neuronale Netzwerke aufgebaut sind, und wie diese benutzt werden können, um verschiedenste Anwendungen zu lernen, wenn geeignetes Trainingsmaterial existiert. Im Fokus steht die Verarbeitung natürlicher Sprachen, und der Kurstag thematisiert, wie Wörter und Sätze in neuronalen Netzwerken repräsentiert werden können, und welche Auswirkungen die Art der Repräsentation auf das maschinelle Lernen hat. Dafür werden fundamentale Konzepte wie Embeddings und rekurrierende Netzwerke eingeführt.

Kustag 2: Neural Machine Translation: Technology, Applications and Limits

Maschinelle Übersetzung hat in den letzten Jahren aufgrund von Verbesserungen bei der neuronalen Modellierung bemerkenswerte Fortschritte erzielt. Wir erklären den technischen Hintergrund, ohne auf mathematische Details einzugehen: Wie verwenden wir neuronale Netze, um Texte automatisch von einer Sprache in eine andere zu übersetzen? Wir beschreiben verschiedene Anwendungsfälle, die von der vollautomatischen Übersetzung für die Assimilation bis zur Eingliederung in Arbeitsabläufe für die professionelle Übersetzung reichen. Wir diskutieren die Integration von firmenspezifischer Terminologie und die Anpassbarkeit der maschinellen Übersetzung an länderspezifische Varianten. Vor dem Hintergrund der Behauptungen über die Mensch-Maschine-Parität diskutieren wir auch die Grenzen der Technologie und zukünftige Richtungen in der Forschung zur maschinellen Übersetzung.

Kurstag 3: Post-Editing Techniques: Scenarios and Experiences

In diesem Kursblock liegt der Fokus auf der Nachbearbeitung automatisch übersetzter Texte, dem sogenannten Post-Editing. Wir besprechen, welche Rolle Post-Editing für das Arbeitsfeld von Übersetzerinnen und Übersetzern spielt, wie es dieses beeinflusst und behandeln verschiedene Szenarien, in denen Post-Editing zum Einsatz kommen kann. Ausserdem thematisieren wir, wie sich Post-Editing von der Bearbeitung von Humanübersetzungen unterscheidet und für welche Textsorten es sich besonders eignet. Wir schauen uns auch die Vorgehenweise beim Post-Editing an, wie sie effizient gestaltet werden kann und wie sich Post-Editing in die Arbeit mit anderen Tools integrieren lässt. Das theoretische Wissen wird in praktischen Übungen angewendet, die angepasst werden auf verschiedene Sprachversionen. 

Dieser Kursblock möchte zur Stärkung der professionellen ÜbersetzerInnen in ihrer Rolle als Reflective Practitioners im Umgang mit Sprachtechnologie beitragen. Wir beschäftigen uns mit den persönlichen und organisatorischen Chancen und Risiken, die ein Einsatz von komplexen Übersetzungssystemen mit sich bringen kann. Dazu gehören Überlegungen zu ethischen und rechtlichen Aspekten wie z.B. des Berufsethos und des Datenschutzes. Dazu gehören auch Überlegungen zu den Voraussetzungen, wie solche unterstützenden Tools für alle Betroffenen erfolgreich eingeführt und benutzt werden können. Wir betrachten auch, was es braucht, damit professionelle ÜbersetzerInnen, die Post-Editing anbieten, mit der hohen kognitiven Belastung dieser Tätigkeit ergonomisch sinnvoll umgehen können. Zu allen Themen lernen die KursteilnehmerInnen einerseits Erkenntnisse aus der angewandten (Übersetzungs-)Forschung kennen und bringen andererseits ihre persönlichen Erfahrungen und Ideen ein.

Kurstag 5: Spoken Language Processing: Speech Recognition, Speaker Recognition, and Automatic Interpreting

Gesprochene Sprache spielt in der automatischen Übersetzung zunehmend eine wichtige Rolle.  Wir werden zunächst thematisieren, welche Informationen in einem Sprachsignal grundsätzlich automatisch verarbeitet werden können. Grundlegende Schritte, die zur automatischen Verarbeitung von gesprochener Sprache nötig sind und die damit verbundenen Probleme werden dann anhand von einfachen Beispielen dargestellt und mit unterschiedlichen Programmen visualisiert. Die so erarbeiteten theoretischen Grundlagen dienen dazu, die Plausibilität und den erwartbaren Erfolg unterschiedlicher praktischer Anwendungen besser einschätzen zu können. 
In der zweiten Hälfte des Kurstags werden wichtige Anwendungsbereiche der automatischen Verarbeitung gesprochener Sprache behandelt. Dazu gehören vor allem die Spracherkennung (automatische Verschriftlichung des Sprachsignals), die Sprachsynthese (automatische Generierung gesprochener Sprache), und die Stimmenerkennung (automatische Erkennung des/der SprecherIn) bzw. spezifischere Verfahren für die automatische Übersetzung wie das 'Respeaking' oder automatisches Dolmetschen.

Kurstag 6: Translation Technology and AI for Accessibility: Simplified Language, Sign Language

Dieser Kurstag hat zum Ziel, die Teilnehmer*innen in den Einsatz von maschineller Übersetzung als assistierende Technologie in zwei Bereichen einzuführen: automatische Textvereinfachung und automatische Übersetzung von/in Gebärdensprache. Der Tag beginnt mit einer theoretischen Einführung in die Konzepte von leichter Sprache und Gebärdensprache, gefolgt von einem Überblick über Studien der experimentellen Linguistik zwecks besserem Verständnis der Bedürfnisse der Zielgruppen (z.B. Rezeptionsstudien, um die Anwendbarkeit verschiedener Empfehlungen zur Herstellung von leichter Sprache zu überprüfen). 

Die zweite Hälfte des Tages widmet sich dem Stand der Technik der computerunterstützten Übersetzung und vollautomatischen Übersetzung im Kontext von leichter Sprache und Gebärdensprache. Besonderes Augenmerk liegt darauf, den KI-Gehalt dieser Technologien zu identifizieren, ihre Grenzen aufzuzeigen und gemeinsam sinnvolle Einsatzgebiete zu erarbeiten.