02.11.2010
[25.11.2010] Talk: Das Text+Berg-Korpus – Aufbau und Anwendungen
Vortragende: Martin Volk (Universität Zürich), Noah Bubenhofer (IDS Mannheim)
Datum: Donnerstag, 25. November, 17:15h
Ort: Deutsches Seminar Raum, SOD-1-105
Abstract
Im Projekt "Text+Berg" (www.textberg.ch) erschliessen wir seit
2008 alpinistische Texte. In der ersten Phase wurden Publikationen des
Schweizer Alpen-Clubs (SAC) digital erfasst und korpuslinguistisch
aufbereitet. Das "Jahrbuch des S.A.C." (1864–1923), das "Echo des Alpes"
(1872-1923), und "Die Alpen" (1925–heute) sind eine wertvolle und
umfangreiche Sammlung von Berichten, Aufsätzen und Reflexionen über den
Alpinismus sowie über Kultur und Natur des Alpenraumes. Durch die
zeitliche Kontinuität, in der die Reihen erschienen sind, stellen sie
eine einzigartige, mehrsprachige Textbasis dar, um historische,
kulturwissenschaftliche aber gerade auch sprachwissenschaftliche
Fragestellungen zu beantworten.
In diesem Vortrag beleuchten wir einerseits die Schritte zur Erstellung und Annotation des Korpus. Dies umfasst Texterkennung (OCR), automatische Korrektur von OCR-Fehlern, Sprachidentifikation pro Satz, Auszeichnung mit Meta-Informationen, sowie die Erkennung von geographischen Bezeichnungen (Toponymen). Wir berichten andererseits über Analyseergebnisse zu auffälligen Sprachmustern in verschiedenen Epochen und zeigen, wie das Korpus für verschiedene Fragestellungen ausgewertet werden kann.
Weitere News
- [25.11.2010] Talk: Das Text+Berg-Korpus – Aufbau und Anwendungen
- [28.10.2010] Inductive Dependency Parsing of Natural Language Text
- [19-20.10.2010] Student Excursion to Mannheim-Heidelberg-Walldorf
- [20.09.2010] Talk: Controlled Natural Languages for Knowledge Representation
- [03.09.2010] New SNF project approved
- [24-27.06.2010] TaCoS 2010
- [29.4.2010] Vortrag: Arbeiten des Centrum für Informations- und Sprachverarbeitung im IMPACT-Projekt
- [18.5.2010] Mehrebenenkorpora in ANNIS: Datenrepräsentation, Abfrage und Visualisierung
- [13.4.2010] An experimental toolbox for automatic tree-to-tree alignment
- [18.03.10] Ifi Colloquium: Linguistic extensions for Search Engines
- Beste Lizenziatsarbeit
- Vorträge im Rahmen des CL Seminars im HS 09
- Exkursion ans Joint Research Center der EU in Ispra
- Multilinguale Textanalyse
- Gesamtübersicht Lehrveranstaltungen
- BA- und MA-Abschlüsse: Deadlines für Anmeldung
- Strukturiertes PhD-Programm Linguistik
- template item
