Internetarchive
Projekte wie Archive.org spiegeln das gesamte Netz
77.559 Filme, 41.314 Live-Konzerte, 159.912 Audio-Aufnahmen und 228.990 Publikationen - die Speicherdaten von Archive.org sind wahrlich beeindruckend. Hinzu kommen noch 85 Milliarden einzelne Webseiten, die mittels der so genannten Wayback-Maschine aufgerufen werden können. Wer in die Kindertage des Internets zurückgelangen will oder einfach nur ältere Ausgaben seiner Lieblingszeitung sucht, ist mit Archive.org gut bedient.
Seit 1996 betreibt das Internetarchiv ein einzigartiges Projekt digitaler Denkmal-pflege. Alle verfügbaren und frei zugänglichen Informationen im Netz werden gesammelt und so der Nachwelt erhalten.
Seit den Tagen der antiken Bibliothek in Alexandria ist der Wunsch, möglichst umfassend und zentral alles verfügbare Wissen zu horten und zu katalogisieren, ein Menschheitstraum. Niemals ist man ihm so nahe gekommen wie beim in San Francisco ansässigen Internetarchiv. Brewster Kahle, der Gründer, will "universalen Zugang zu allem menschlichen Wissen schaffen", und scheut nicht den Vergleich mit der Bibliothek von Alexandria, wo archive.org heute sogar Server stationiert hat.
Automatische Suchroboter, so genannte Harvester (Erntehelfer), kriechen fortwährend durch das gesamte Web und tragen eifrig Daten zusammen. Das gesamte Internet-Archiv beansprucht inzwischen weit mehr als zwei Petabyte Platz auf den Servern - eine Zahl mit fünfzehn Nullen, die einer Datenmenge von 20.000 Computern mit je 100 Gigabyte fassender Festplatte entspricht. Das ist zwar imposant, aber doch nur ein Bruchteil des digital Vorhandenen. Laut einer Studie der Schule für Informationsmanagement an der Universität von Berkeley wächst das Volumen gespeicherter Informationen pro Jahr um 30 Prozent. Bevor die Archivroboter zurückkehren und die Spiegelung einer Webseite angelegt haben (was zwischen sechs und neun Monate dauert), mag es die Seite oft gar nicht mehr geben.
Auch hierzulande wird der Traum vom Universalarchiv geträumt. Im vergangenen Jahr beschloss der Bundestag, "Medienwerke in unkörperlicher Form" in die Deutsche Nationalbibliothek aufzunehmen. Geplant ist, alle Online-Publikationen von "öffentlichem Interesse" mit einer .de-Endung zu speichern. Private Homepages und Blogs bleiben ausdrücklich davon ausgenommen. Weitere Restriktionen gibt es nicht.
"Wir sind das Gedächtnis der Nation", erklärt Kathrin Ansorge, Sprecherin der Nationalbibliothek in Frankfurt. "Die Kultur einer Nation spiegelt sich in ihren Schriftwerken." Für den Medientheoretiker Peter Weibel ist die Sache noch einfacher: "Wenn wir nicht wissen, was archiviert wurde, wissen wir auch nicht, was neu ist."