Nationalbibliothek sammelt "österreichisches Web"

13. März 2009, 14:16
1 Posting

"Wir können nicht wissen, was unsere Nachfolger einmal interessieren wird"

Wien - Wer in ein paar Jahrzehnten die Urlaubs-Schnappschüsse seiner Großeltern sucht, könnte diese an einem unerwarteten Ort finden: In der Österreichischen Nationalbibliothek. Denn dort wird ab heuer das "österreichische" World Wide Web archiviert. Dazu gehören alle Websites mit einer ".at"-Endung - also neben offiziellen Websites und Firmen-Homepages u.a. auch private Blogs und Online-Fotoalben. "Wir können nicht wissen, was unsere Nachfolger einmal interessieren wird", sagte die Leiterin der Hauptabteilung "Digitale Bibliothek" in der Nationalbibliothek, Bettina Kann.

Die Nationalbibliothek wird nach einer diesbezüglichen Novelle im Mediengesetz, die am 1. März in Kraft getreten ist, künftig ein- bis zweimal im Jahr alle österreichischen Webseiten automatisch aufrufen, die dort veröffentlichten Daten auslesen und auf eigenen Speichermedien archivieren. Rund 800.000 Webseiten mit der Endung ".at" werden erfasst, dazu kommen noch Adressen mit anderen Endungen wie ".eu", ".org" oder ".net", die einen eindeutigen Österreich-Bezug haben.

"Crawl"

Nachrichtenseiten und andere Websites von größerem Interesse sollen täglich ausgelesen werden. Im Herbst soll der erste vollständige "Crawl" stattfinden, also das erste automatisierte Sammeln der Daten des österreichischen Webs. Wie groß diese Datenmenge sein wird, kann trotz zweimaliger Probeläufe (2008 bei der Fußball-Europameisterschaft und bei der Nationalratswahl) nicht genau gesagt werden, so Kann. Man schätzt, dass das Archiv nach fünf Jahren rund 80 Terabyte an Daten umfassen werde, so Kann. Die Daten werden nicht in der Nationalbibliothek, sondern im Bundesrechenzentrum gespeichert und gepflegt.

Dass man bei automatischer Erfassung unweigerlich auch viel Datenmüll mitsammelt, wird in Kauf genommen. Eine lückenlose Dokumentation sei jedoch nicht zu schaffen. (APA)

Share if you care.