Skip to main content

Wayback Machine

Wayback Machine

 

Wayback Machine: Kurzerklärung

 

Die Wayback Machine macht Online-Recherchen im Internet Archive möglich. Dieses Archiv ist die größte Online-Bibliothek der Welt mit historischen Momentaufnahmen von über 300 Milliarden Websites.

 

Ausführliche Erklärung

 

Das Internet Archive wurde 1996 von Brewster Kahle als gemeinnütziges Projekt gegründet, dessen Ziel die weitgehend barrierefreie Langzeitarchivierung digitaler Daten ist. Die Wayback Machine ist das Tool, das den Zugang zu diesem Archiv ermöglicht. Dadurch ist die Wayback Machine ein Spiegel der Geschichte der Online-Welt. Das digitale Gedächtnis ist seit 2007 eine offiziell anerkannte Bibliothek im US-Staat Kalifornien.

Die Wayback Machine ist nur ein Teil des umfassenden Internet Archive aus San Francisco. Neben Webseiten werden auch andere Medienformate gespeichert. Das sind zum Beispiel Bücher, Videos, Software, Musik und Audio-Dateien. Gemeinsam ist den gespeicherten Daten, dass sie allesamt gemeinfrei sind.

 

So funktioniert die Wayback Machine

 

Internet Archive
 

Die offizielle Seite der Wayback Machine findet sich unter der URL http://web.archive.org. Das Archiv wird ständig erneuert, jeden Monat kommen etwa 20 Terabyte Daten hinzu, sodass der gegenwärtige Bestand im Petabyte-Bereich liegt. Die Recherche ist sehr einfach gestaltet:

  1. Der User gibt in das Textfeld die gewünschte Domain ein.
  2. Auf einer Grafik und in einer Tabelle erscheinen die Daten der einzelnen Indexierungen seit 1996 beziehungsweise der erstmaligen Veröffentlichung.
  3. Nach dem Klick auf ein gekennzeichnetes Datum wird die Website gezeigt, wie sie zu diesem Zeitpunkt aussah.

Auch die von Google gewohnte Eingabe eines Suchbegriffs ist möglich. Es erscheint eine Liste mit passenden Websites zum Keyword. Der User klickt auf die gewünschte Site und geht dann wie in Punkt 2 angegeben vor.

Ein großer Vorteil der Wayback Machine liegt darin, dass die historischen Sites nicht lediglich in Form eines Bildes vorliegen. Der Snapshot zeigt die HTML-Version der Website zum betreffenden Zeitpunkt. Die einzelnen Links sind also anklickbar. Anders als beim Cache von Google springt man im Internet Archive nicht auf die aktuelle Online-Version der betreffenden URL, sondern auf die jeweilige historische Seite.

 

Weitere Möglichkeiten der Wayback Machine:

 

  • Der Punkt „Summary” zeigt interessante Statistiken über die gecrawlten Datei-Typen auf (Text/HTML, Bilder, Videos usw.).
  • Auch eine Übersicht aller URLs in einer Sitemap ist verfügbar.

Aufgrund des Umfangs muss der User beim Besuch des Archivs in der Regel mit längeren Wartezeiten rechnen. Zum Teil fehlen einzelne Webseiten und nicht alle archivierten Seiten sind vollständig. Oft fehlen größere Bilder. Besonders dann, wenn auf einer Website JavaScript zum Einsatz kommt, ist die Anzeige nicht optimal.

Die Wayback Machine gibt es auch als Extension für den Browser Chrome von Google. Diese Erweiterung ist sehr hilfreich, wenn man auf eine Error-404-Seite stößt. Die Fehlermeldung 404 zeigt an, dass eine bestimmte URL nicht mehr existiert. Mit der Extension lässt sich dann ein Bild der ursprünglichen Seite abrufen.

 

Wer nutzt das Internet Archive?

 

Internetpräsenz
 

Die Wayback Machine ist für die Betreiber von Webseiten ein sehr nützliches Tool. Es bietet die bequeme Möglichkeit, auf frühere Inhalte der eigenen Internetpräsenz zuzugreifen. Oft werden dadurch verloren geglaubte Schätze gefunden – zum Beispiel, um diese für einen Relaunch der Site zu recyceln.

Für SEO-Zwecke (SEO = Search Engine Optimization) lässt sich die Wayback Machine ebenfalls hervorragend nutzen. Wenn beispielsweise ein Wiki oder Blog plötzlich in den Google-Rankings abstürzt, liegt das oft an ganz bestimmten Neuerungen. Mithilfe der Wayback Machine lassen sich der alte und der neue Code ganz einfach vergleichen. Für eine Analyse des Istzustands ist das Internet Archive ein hervorragendes Tool – übrigens auch für die Suche nach einem verloren gegangenen Link.

Ein häufiger Grund für Abstufungen in den SERPs bei Google ist Duplicate Content. Die Wayback Machine kann dann als Nachweis dafür dienen, dass eigener Content zu einem früheren Zeitpunkt online gestellt wurde. Das macht sich auch in Urheber- oder Markenrechtsstreitigkeiten bezahlt.

Das Online-Archiv ist zudem für Webdesigner eine interessante Fundgrube. Der Vergleich älterer mit neueren Websites macht den Wandel vom Desktop-Design zu Beginn des 21. Jahrhunderts zum mobilen Responsive Webdesign ganz besonders deutlich. Voraussetzung für eine solche Recherche ist allerdings, dass die Wayback Machine alle für das Design relevanten Dateien gespeichert hat. Wenn nur eine einzige CSS- oder JavaScript-Datei im Archiv fehlt, wirkt sich dies negativ auf das gesamte Design aus.

Das Internet Archive ist vor allem für Nachweiszwecke hilfreich. Unter rechtlichen Aspekten ist das Konzept der Wayback Machine allerdings nicht unumstritten. Zum einen erfolgt die automatische Indexierung ohne Nachfrage beim Urheber. Zum anderen stellt die Wayback Machine frühere Versionen eines Werks – ebenfalls ohne Nachfrage – der Öffentlichkeit zur Verfügung. Jedoch akzeptieren die Gerichte Snapshots der Wayback Machine in der Regel als Beweismaterial.

 

Webseiten aus der Wayback Machine bannen

 

Online-Archiv
 

Wer seine Website von der Archivierung durch die Wayback Machine ausschließen möchte, kann dies mit zwei Zeilen Code in der Datei robots.txt tun:

User-agent: ia_archiver
Disallow: /

Die Speicherung der Datei im Wurzelverzeichnis der Domain verhindert die zukünftige Indexierung. Auch alle Online-Inhalte aus der Vergangenheit kann man als verantwortlicher Betreiber einer Site aus dem Internet Archive entfernen lassen. Problematisch wird dieses Vorgehen natürlich, wenn der Inhaber einer Domain wechselt. Denn durch den Erwerb einer Internetadresse wird nicht ohne Weiteres das Urheberrecht an vorhandenen Inhalten übertragen.

Was aus der Wayback Machine gelöscht wurde, ist aber nicht zwangsläufig aus dem Internet verschwunden. Es ist eher wahrscheinlich, dass Kopien von Inhalten irgendwo im World Wide Web schlummern. Schließlich vergisst das Netz nichts. Selbst eine umfassende Google-Suche garantiert keine vollständige Übersicht über den im Netz gespeicherten Content aus der Vergangenheit.

 

Fazit

 
Das Internet Archive ist eine digitale Bibliothek historischer Webseiten. Die Wayback Machine ist ein praktisches Tool, das den Zugriff auf dieses Archiv ermöglicht. Nicht nur für Nostalgiker ist die Wayback Machine interessant. Vor allem Webseitenbetreiber profitieren von diesem Tool.


Treten Sie über 53.000 Kunden weltweit bei und nutzen Sie Textbroker für Ihr Content-Marketing.

Jetzt kostenlos anmelden


Managed-Service

Sie wollen komplette Textprojekte auslagern und hochwertige Qualitätstexte erhalten? Sie interessieren sich für weitere Content-Services wie etwa Suchmaschinenoptimierung nach WDF*IDF oder die Verwaltung Ihres Blogs? Dann lernen Sie unseren Managed-Service kennen und profitieren Sie von unserem Rundum-Sorglos-Paket.

Unverbindliches Angebot anfordern!

Self-Service

Sie benötigen aktuellen Text-Content? Im Self-Service können Sie Ihren Wunschtext schnell und einfach selbst beauftragen – und das zu Top-Konditionen.

Jetzt kostenlos registrieren!

Autoren

Tausende Autoren weltweit verdienen beim Pionier unter den Textbörsen Geld mit ihren Texten. Sie entscheiden selbst, wann und wie viel sie schreiben und können sich ein flexibles Einkommen sichern. Erfahren Sie hier, wie Sie Ihre Texte zu Geld machen.

Jetzt kostenlos registrieren!