Digitalisierung der Publikationsreihen des Schweizer Alpen-Clubs (SAC)

Im Projekt "Text+Berg digital" werden in einem ersten Schritt zwei Publikationsreihen des Schweizer Alpen-Clubs (SAC), die kontinuierlich seit 1864 erschienen sind, digital erfasst und korpuslinguistisch aufbereitet. Die beiden Reihen, das "Jahrbuch des S.A.C." (1864–1923) und die "Alpen" (1925–heute), sind eine wertvolle Sammlung von Berichten, Aufsätzen und Reflexionen über den Alpinismus. Durch die zeitliche Kontinuität, in der die Reihen erschienen sind, stellen sie eine einzigartige Textbasis dar, um historische, kulturwissenschaftliche aber gerade auch sprachwissenschaftliche Fragestellungen zu beantworten.

Das computerlinguistische Interesse am Korpus liegt einerseits in der Aufbereitung des Korpus selber (automatische Wortartenerkennung, Eigennamen/Ortsnamenerkennung etc.), aber auch in der Analyse der Sprachdaten, etwa um Sprachmodelle zu verfeinern. Da die Publikationen darüber hinaus nicht nur deutsche, sondern auch französische und italienische Texte enthalten, bietet es sich an, ein «comparable corpus» für multilinguale Fragestellungen zu erstellen.