Pilotprojekt Text-Mining mit der ETH-Bibliothek gestartet

Das Institut für Computerlinguistik hat eine Zusammenarbeit mit der ETH-Bibliothek gestartet, mit dem Ziel, die umfangreichen digitalen Textsammlungen der Bibliothek mit Zusatzinformationen anzureichern. In einem Pilotprojekt, das am 1. Juli begonnen hat, werden die digitalisierten Architektur-Zeitschriften "tec21" und "Werk, Bauen, und Wohnen" mit total rund 380'000 Seiten bearbeitet. Der Fokus des Pilotprojekts liegt auf der automatischen Erkennung und Verlinkung von Personen- und Ortsnamen.