Kurzlebigkeit
"Wir denken in Jahrhunderten", erklärt Bettina Kann, Leiterin des Bereichs Digitale Bibliothek der Österreichischen Nationalbibliothek, die Sammelphilosophie der ÖNB. Und dabei gibt es digital, abgesehen von den enormen Datenmengen, zwei Probleme: Einerseits die Kurzlebigkeit der physischen Medien, auf denen Daten abgelegt sind. Und andererseits die Dateiformate, in denen Bilder, Schriften, Video oder Multimedia gespeichert werden.
Laufend kopieren
Die Lösung für Ersteres scheint inzwischen klar: Da die Kopie eines digitalen Werks völlig ident mit dem "Original" ist, werden Daten erhalten, indem sie laufend kopiert werden - damit ist die Frage der Haltbarkeit des Originals zweitrangig. "Wenn wir eine CD bekommen, dann ziehen wir eine Kopie für den Server", sagt Kann.
Wirrwarr an Datenformaten
Hingegen bereitet ihr und anderen Archivaren der Republik, die dieser Tage bei einer Fachtagung mit den IT-Firmen Microsoft und Novell über eine Lösung des Problems diskutierten, der Wirrwarr an Dateiformaten das größere Kopfzerbrechen. "Meist leben diese Formate so lange, wie die Firma, die sie erfunden hat", sagt Kann. Und auch wenn das nach Unternehmensmaßstäben lange sein mag, so ist es kurz aus der Sicht großer Bibliotheken.
Fünf Milliarden Dokumente
EU-weit werden jährlich fünf Milliarden Dokumente produziert, versucht eine Studie des "Planet Consortium" (ein EU-Zusammenschluss von Forschungsinstituten wie ARC Seibersdorf) dem drohenden "digitalen schwarzen Loch" auf den Grund zu gehen. Zwei Prozent, rund 100 Mio. Dokumente, gelten als "aufhebenswert". Und wiederum zwei Prozent davon gelten in Hinblick auf ihre Langzeitarchivierung als gefährdet. Gemessen an Produktionskosten und dem Wert dieser Dokumente sind dies drei Milliarden Euro jährlich.
"Emulation" und "Konversion"
Kurzfristig haben Bibliotheken zwei Möglichkeiten, sagt Kann: "Emulation" und "Konversion". Bei Emulation, wie vom britischen Nationalarchiv betrieben, wird das Originalformat in einer dem seinerzeitigen Originalprogramm "nachgebauten" (emulierten) Umgebung verwendet. Bei Konversion wird das Dokument in ein aktuelles Format verwandelt, "aber dabei können Informationen verloren gehen oder die Darstellung ändert sich", beschreibt Kann unerwünschte Nebeneffekte.
Offene, ISO-standardisierte Dokumentenformate