"Das kleinste Kochbuch der Welt" zeigt die Spuren des Gebrauchs, kann aber noch viele Jahrzehnte nach seinem Erscheinen gelesen werden - anders als manche digitale Daten.

Montage: Beigelböck
Von neuen Medien sind am Anfang ihrer Entstehung meist nur wenige Exemplare erhalten. Die Flugschriften des 17. Jahrhunderts sind großteils verloren, nur ein Bruchteil der Filme, die in den ersten Jahrzehnten des 20. Jahrhunderts gedreht wurden, wurden auch archiviert. Vom heimischen Internetvorläufer Bildschirmtext ist gar nichts archiviert, und die Geburtsjahre digitaler Medien von CD-Rom bis Internet sind nur lückenhaft erfasst.

Kurzlebigkeit

"Wir denken in Jahrhunderten", erklärt Bettina Kann, Leiterin des Bereichs Digitale Bibliothek der Österreichischen Nationalbibliothek, die Sammelphilosophie der ÖNB. Und dabei gibt es digital, abgesehen von den enormen Datenmengen, zwei Probleme: Einerseits die Kurzlebigkeit der physischen Medien, auf denen Daten abgelegt sind. Und andererseits die Dateiformate, in denen Bilder, Schriften, Video oder Multimedia gespeichert werden.

Laufend kopieren

Die Lösung für Ersteres scheint inzwischen klar: Da die Kopie eines digitalen Werks völlig ident mit dem "Original" ist, werden Daten erhalten, indem sie laufend kopiert werden - damit ist die Frage der Haltbarkeit des Originals zweitrangig. "Wenn wir eine CD bekommen, dann ziehen wir eine Kopie für den Server", sagt Kann.

Wirrwarr an Datenformaten

Hingegen bereitet ihr und anderen Archivaren der Republik, die dieser Tage bei einer Fachtagung mit den IT-Firmen Microsoft und Novell über eine Lösung des Problems diskutierten, der Wirrwarr an Dateiformaten das größere Kopfzerbrechen. "Meist leben diese Formate so lange, wie die Firma, die sie erfunden hat", sagt Kann. Und auch wenn das nach Unternehmensmaßstäben lange sein mag, so ist es kurz aus der Sicht großer Bibliotheken.

Fünf Milliarden Dokumente

EU-weit werden jährlich fünf Milliarden Dokumente produziert, versucht eine Studie des "Planet Consortium" (ein EU-Zusammenschluss von Forschungsinstituten wie ARC Seibersdorf) dem drohenden "digitalen schwarzen Loch" auf den Grund zu gehen. Zwei Prozent, rund 100 Mio. Dokumente, gelten als "aufhebenswert". Und wiederum zwei Prozent davon gelten in Hinblick auf ihre Langzeitarchivierung als gefährdet. Gemessen an Produktionskosten und dem Wert dieser Dokumente sind dies drei Milliarden Euro jährlich.

"Emulation" und "Konversion"

Kurzfristig haben Bibliotheken zwei Möglichkeiten, sagt Kann: "Emulation" und "Konversion". Bei Emulation, wie vom britischen Nationalarchiv betrieben, wird das Originalformat in einer dem seinerzeitigen Originalprogramm "nachgebauten" (emulierten) Umgebung verwendet. Bei Konversion wird das Dokument in ein aktuelles Format verwandelt, "aber dabei können Informationen verloren gehen oder die Darstellung ändert sich", beschreibt Kann unerwünschte Nebeneffekte.

Offene, ISO-standardisierte Dokumentenformate

Langfristig gebe es darum nur einen Weg, sind sich Kann und Microsoft-Österreich-Sprecher Thomas Lutz einig: Offene, ISO-standardisierte Dokumentenformate. Dabei liegt das Format offen und kann "auch noch in 50 Jahren von einem Entwickler nachgebaut werden", sagt Kann. "Offen" bedeutet nicht lizenzfrei: Auch offene Format müssen lizenziert werden und der Urheber kann dafür Geld verlangen, wie bei dem von Fraunhofer entwickelten MP3. Microsoft setzt dabei auf "Open XML", das Format seines jüngsten Office-Pakets, das derzeit einem ISO-Verfahren unterzogen wird.(Helmut Spudich/DER STANDARD, Printausgabe vom 15.3.2008)