Um Scanfehler in den digitalisierten Jahrbüchern des Schweizer Alpen-Clubs zu korrigieren, haben Zürcher Computerlinguisten ein Korrektursystem entwickelt, das übers Internet freiwillige Mitarbeitende einspannt. Ein Crowdsourcing-Projekt der besonderen Art.
Seit 1864 gibt der Schweizer Alpen-Club (SAC) Jahrbücher heraus. Diese wurden seit 2008 durch die Universität Zürich digitalisiert und der Volltext-Inhalt durch automatische Texterkennung erschlossen.
Allerdings produzierte die „Optical Character Recognition“ (OCR) durchschnittlich 7 Fehler pro Seite. Nur knapp zwanzig Prozent dieser Fehler ließen sich mit Hilfe der Autokorrektur des handelsüblichen Programms verbessern. Vier Millionen Wörter standen damit zur manuellen Überprüfung an.
Daraufhin haben die Computerlinguisten der Universität Zürich ein Korrektursystem entwickelt, das übers Internet freiwillige Mitarbeitende einspannt: SAC-Kokos, das kollaborative Korrektur-System für Texte des Schweizer Alpen-Clubs
Für die Mitarbeit wurden die Freiwilligen in der Crowd vor allem durch zwei Faktoren gewonnen: Sie sind thematisch, ideell oder biographisch mit dem jeweiligen Thema verbunden, und die Universität Zürich pflegt und motiviert die Community.
Letzeres u.a. indem das Projekt Elemente aus Computerspielen und Social Media entlehnt. Gamifikation nennt man ersteres und setzt dabei beispielsweise auf Ranglisten, auf denen die Crowdsourcer miteinander konkurrenzieren. Und mit der Einbindung von Share-Buttons gibt man den ehrenamtlichen Mitarbeitern die Möglichkeit, ihre Beiträge in den sozialen Netzwerken bekannt zu machen.
Quelle: <http://www.uzh.ch/news/articles/2014/bergeweise-tippfehler.html>