Bild nicht mehr verfügbar.

Um seine Datenbank Spanner weltweit konsistent zu halten, gibt Google selbst die Zeit an.

Foto: Reuters

Wer jetzt zu Weihnachten nach Keksrezepten googelt oder mit Freunden über Videochat plaudert, vergisst schnell welche enormen Datenmengen hinter diesen Services stehen. Erst wenn ein Dienst nicht funktioniert, macht sich der durchschnittliche User Gedanken über die Strukturen hinter dem Dienst. Google ist einer der größten Anbieter von Web-Diensten. Mit Spanner betreibt das Unternehmen die weltgrößte, einzelne Datenbank. Wired konnte einen Blick hinter die Kulissen werfen.

Zeitmessung für Synchronisierung

Eine knifflige Aufgabe bei Datenbanken ist es, sämtliche Prozesse und Server miteinander zu synchronisieren, damit überall die gleichen Daten in festgelegter Reihenfolge abgerufen werden können. Damit alle Systeme zeitgleich funktionieren, gibt das Network Time Protocol (NTP) die Zeit vor, die es von den offiziellen Atomuhren bezieht.

Schaltsekunden-Bug

Doch die Methode ist fehleranfällig. Im Juli kam es bei zahlreichen Web-Diensten zu Ausfällen aufgrund einer winzigen Abweichung der Zeit (der WebStandard berichtete). Die durch das NTP eingefügte Schaltsekunde machte den Servern von Diensten wie FourSquare, LinkedIn oder Reddit Probleme. Für Spanner hat Google daher seine eigene Methode zur Zeitmessung entwickelt - TrueTime.

TrueTime

Dazu hat das Unternehmen in den Rechenzentren, über die die Datenbank läuft, eigene Atomuhren und GPS-Empfänger installiert, auf deren Zeitangaben die Masterserver zugreifen. Auf jedem einzelnen Server läuft ein Software-Prozess, der konstant die Zeit von diesen Masterservern abruft. Dadurch kann Spanner weltweit konsistent gehalten werden. Dienste laufen zudem bei Ausfällen stabiler, da die Datenbank bei Software- oder Hardwareausfällen schneller auf andere Server umschalten kann.

Einsatz für Anzeigen

Die Entwicklung von Spanner hat viereinhalb Jahre gedauert. Für Andrew Fikes, der an der Entwicklung der Datebank beteiligt war, sei es das komplizierteste Projekt, an dem er je gearbeitet habe. Derzeit betreibt Google etwa sein Anzeigen-System über Spanner, um die Anzeigen weltweit auf die Suchanfragen abstimmen und ausliefern zu können. Update: Googles Papier zu Spanner und der Funktionsweise von TrueTime ist online abrufbar.

Facebook Prism

Für weniger umfangreiche Web-Services macht eine solche Datenbank keinen Sinn. Dienste wie Facebook müssen aber ebenfalls Lösungen finden, wie sie mit dem enormen und wachsenden Datenumfang umgehen. Das soziale Netzwerk arbeitet dafür an einer Plattform namens Prism. Spanner dürfte zudem nicht das einzige Anwendungsgebiet für Googles neue Zeitmessung bleiben. (red, derstandard.at, 27.11.2012)