LRZ

Im bayrischen Garching in der Nähe von München steht eines der stärksten Rechensysteme der Welt: Das Leibniz-Rechenzentrum (LRZ) stellt das Computerzentrum für eine ganze Reihe von Münchner Universitäten und Forschungseinrichtungen dar. Im Herzen der Anlage steht ein riesiger Betonblock, hinter strikten Sicherheitsvorkehrungen verbirgt sich darin ein sogenannter Supercomputer.

Kraftvoll

Und zwar nicht irgendeiner: Mit einer Spitzenrechenleistung von 26,2 TeraFlop rangiert man in der aktuellen Top-500-Liste der weltweit schnellsten Computersystem derzeit auf Rang 18. Entsprechend beeindrucken lesen sich auch die restlichen Eck-Daten des Systems: Satte 4096 Itanium-2-Prozessoren rechnen hier parallel vor sich hin - eine Ausstattung von der Normalsterbliche also nicht einmal zu träumen wagen. Dafür, dass den laufenden Prozessen auch genügend Entfaltungsraum geboten wird, sorgen insgesamt 17 TeraByte Shared Memory, zum Abspeichern der Daten stehen 340 TeraByte an virtuellem Raum zur Verfügung, dank dem Cluster-Filesystem CXFS auf einem einzigen Dateisystem.

Foto: Christoph Rehbach

Hardware

Die Hardware kommt dabei von SGI, einem alten Bekannten im Bereich High Performance Computing. Während man früher aber vor allem auf eigene Hardwareentwicklungen gesetzt hat, hat sich auch in diesem Bereich mittlerweile Commodity-Hardware durchgesetzt. Statt MIPS-Prozessoren setzt der Altix 4700 - der im LRZ zum Einsatz kommt - vor allem auf Standardkomponenten, im Konkreten auf Itanium 2-CPUs von Intel. Das Geld macht man entsprechend heutzutage kaum mehr über die Hardware sondern über die Anwendungen.

Foto: gsiCom

Software

Was sich ebenfalls über die Jahre verändert hat: Während man früher die SGI-eigene proprietäre Unix-Variante IRIX zum Einsatz brachte, hat sich nun Linux als bestimmende Macht im Supercomputerbereich durchgesetzt. Ein Trend, dem man sich irgendwann auch bei SGI nicht mehr verschließen konnte, wie Christian Tanasescu, Senior Director of Applications & Performance Engineering bei dem Computerhersteller, im Gespräch mit dem WebStandard freimütig bekennt. Um das Jahr 2000 habe sich gezeigt, dass die diversen ISVs zunehmend IRIX den Rücken gekehrt und sich Open Source Betriebssystem zugewandt haben. Auch wenn man von den Vorteilen der eigenen Lösung überzeugt gewesen wäre, sei man hier vor Tatsachen gestellt worden, die man nicht so einfach ignorieren konnte. Also hat man sich dazu entschlossen, die eigenen kritischen Features auf Linux zu portieren, und das freie OS auf diese Weise mitzugestalten.

Vorteile

Eine Einschätzung, die auch Dr. Matthias Brehm vom LRZ teilt: In der Vergangenheit habe man zahlreiche verschiedene proprietäre System eingesetzt, mittlerweile laufe aber praktisch alles unter Linux. Dies sei keineswegs eine ideologische Entscheidung gewesen, wie Brehm herausstreicht. Viel mehr sei das freie Betriebssystem in diesem Bereich schlicht die beste Lösung. Außerdem ergebe sich auch ein nicht zu unterschätzender Zusatznutzen: Viele der StudentInnen und ForscherInnen würden selbst Linux auf ihren Rechnern zum Einsatz bringen, die Umgebung sei also bereits eine vertraute, selbst zentrale Bestandteile des Systems wie der Kernel unterscheiden sich nur in Details.

Foto: Andreas Proschofsky / derStandard.at

SUSE

Davon profitieren umgekehrt auch wieder "normale" Linux-BenutzerInnen, schließlich muss so ein System extrem stabil laufen, einfache Bugs würden hier fatale Auswirkungen haben, wie Volker Smid, EMEA-Chef von Novell betont. Dessen Unternehmen liefert die Software für den Altix 4700, die Ausführung im LRZ läuft unter einem SUSE Linux Enterprise Server 10.

Auswahl

Für SUSE als Partner hat man sich laut Tanasescu früh entschieden, schon vor der Übernahme durch Novell, sei es das einzige Unternehmen im Linux-Umfeld gewesen, das High-Performance-Computing ernsthaft betrieben hat. Mittlerweile habe Red Hat zwar etwas aufgeholt, mit der Unterstützung von maximal 64 CPUs ist man aber immer noch recht weit von den 1.024 CPUs bei SUSE entfernt. Zum Vergleich: Windows unterstützt mit seiner Cluster Edition derzeit gerade mal 16 CPUs, so richtig interessant werde es aber erst ab 64 CPUs aufwärts, wie Tanasescu festhält. Insofern sei das Betriebssystem von Microsoft in diesem Bereich - trotz der verstärkten Anstrengungen des Herstellers - derzeit keine ernsthafte Alternative.

Foto: Wenzel Schürmann, Tech. Univ. Munich

Infrastruktur

So ein mächtiges Rechnersystem braucht natürlich auch die entsprechende Infrastruktur. So besteht das Gebäude rund um den Supercomputer zum großen Teil aus Räumen, die sich um die richtige Versorgung des Altrix 4700 kümmern. Denn allein das Lüftungssystem nimmt bereits gehörigen Platz ein, soll es doch pro Stunde rund 400.000 m³ Luft transportieren um so die Abwärme der Rechner im griff zu behalten. Für die BesucherInnen ist dies vor allem daran bemerkbar, dass rund um die Rechner stetig ein gehöriger Luftzug zu spüren ist.

Stromversorgung

Auch die Stromanforderungen sind nicht gerade alltäglich, die Rechner fressen rund 1 Megawatt, noch einmal so viel gehen für die Lüftung drauf. Für die Zukunft hat man aber sicherheitshalber schon mal vorgebaut, insgesamt 5 Megawatt Verbrauch soll das Rechenzentrum bewältigen können.

Foto: Helmut Payer, produced by gsiCom

Versorgung

Für den Fall eines Stromausfalls setzt man auf zwei große UPS-Systeme: Da wäre einerseits ein ganzer Raum voll Batterien, der allerdings nur die "normalen" Rechner und nicht den Superrechner abfangen kann. Zusätzlich gibt es noch eine Reihe von Dieselmotoren, das allerdings nur kurze Ausfälle abdecken kann. Nach 20 Sekunden ist tatsächlich das Licht aus, mehr Strom bekommt man von den Motoren nicht zugeteilt, da es wichtigere Systeme in der Umgebung - etwa den Versuchsreaktor - abzusichern gilt.

Feuer

Ein weiterer Raum im Supercomputer-Block ist für den Brandschutz reserviert: Hier stehen eine Unmenge von mit Argon gefüllte Gasflaschen herum: Das Edelgas soll ein eventuelles Feuer im Keim ersticken. Wer sich zu dem Zeitpunkt in den Räumlichkeiten befindet, sollte sich schleunigst nach draußen begeben: Nach 30 Sekunden wird das Gas verströmt. Wie Prof. Dr. Heinz-Gerd Hegering, Leiter des LRZ, betont, bleibe allerdings ein Rest an Sauerstoff übrig, so dass die Mischung nicht tödlich sei. Auch versuche man an sich das Gebäude als "Dark Center" zu führen, normalerweise sollten sich also ohnehin keine Personen im Inneren befinden.

Foto: gsiCom

Rand

Am Rand des Gebäudes befindet sich ein zusätzlicher Raum, dessen vornehmliche Funktion es ist, den bei einem Brand verdrängten Sauerstoff aufzufangen. Zusätzlich befindet sich an dessen Wand ein Stahlkonstrukt, dass das Zentrum vor äußeren Strahlungseinflüssen schützen soll. Der ansonsten recht leere Raum hat aber noch einen weiteren Hintergedanken: Wird einmal ein Ausbau nötig, könnte man hier ansetzen, ohne den laufenden Betrieb zu stören.

Zentral

Im Zentrum des Baus steht aber natürlich der Raum, in dem der Altrix 4700 selbst steht: Auf einer Fläche von 24x12 Metern verteilt sich die konzentrierte Rechenpower. Unter den Rechnern befindet sich ein Geflecht aus Stromanschlüssen, darüber die leicht futuristische anmutenden Lüftungskanäle. Eine weitere Zahl mag die Ausmaße des ganzen Systems weiter verdeutlichen: Insgesamt 1.000 km Kabel wurden hier verlegt.

Spitzenleistung

So nebenbei eine kleine Anmerkung zum Begriff der "Spitzenleistung": Die 26,2 Teraflop des Supercomputers sind ein theoretischer Wert, im realen Einsatz erreicht der Altix 4700 "nur" ca.2,5 TeraFlop. Das liegt vor allem daran, dass solche Werte über die Leistungsfähigkeit der CPU berechnet werden, die reale Power aber von allen verbauten Komponenten abhängig ist. Als "Bremse" wirkt hier vor allem die Datenspeicherung, auch der nötige Netzwerkverkehr führt zu Verzögerungen.

Foto: Helmut Payer, produced by gsiCom

Anwendungen

Fragt sich nur: Wer benötigt eigentlich so viel Rechenpower, doch auch hier haben die BetreiberInnen des LRZ einige überzeugende Antworten: Auf dem Altrix 4700 laufen eine ganzen Palette von Anwendungen. Dazu gehören Berechnungen im Bereich der Astrophysik ebenso wie die Klimaforschung oder die Untersuchung von Fusions-Energie.

Berechnungen

Doch auch ganz konkrete Projekte werden hier berechnet: So wurde etwa das Dach des Olympiastadions in München mithilfe der Rechnerkraft des LRZ berechnet, auch für die Simulation des Airflows rund um Hochgeschwindigkeitszüge wurde das System in der Vergangenheit bereits eingesetzt.

Grafik: LRZ

Fluid Dynamics

Als weiteres Beispiel präsentierte Dr. Matthias Brehm vom LRZ einige Ergebnisse aus der Forschung im Bereich der "Fluid Dynamics", die zur exakten Berechnung des Verhalten von Flüssigkeiten dienen. Was anhand des Beispiels von Einschenken von Wasser in ein Glas durch die Naturtreue verblüfft, hat aber auch ganz reale Anwendungen: So spielen die "Fluid Dynamics" in der Tsunami-Forschung eine wichtige Rolle. Auch bei der Entwicklung von Herzklappen können sie äußerst hilfreich sein, lässt sich so doch die optimale Form finden, die die unerwünschten Verwirbelungen minimiert.

Komitee

Wer hier wieviel Rechenzeit zugesprochen bekommt, bestimmt übrigens ein eigenes Komitee, die Hoffnungen auf so einem System schnell mal ein Spielchen auszuprobieren sind also wohl eher begrenzt.

Grafik: LRZ

Ausbau

Mit der aktuellen Ausstattung ist der SGI Altrix 4700 des LZR aber bei weitem noch nicht an seinem Ende angekommen: Bereits im März 2007 steht die nächste Ausbaustufe an: Dann sollen die CPUs der Rechner durch die neuen Dual-Core-Itanium-2-Prozessoren auf Basis der "Montecito"-Architektur ersetzt werden. Teilweise sollen zusätzlich auch noch Dual-Prozessor-Boards zum Einsatz kommen, die Spitzenleistung des Systems soll so mehr als verdoppelt werden.

Zusätzlich

Insgesamt soll der Altrix 4700 nach dem Upgrade 9.728 Prozessoren beinhalten, auch der Hauptspeicher wird von 17 auf 39 TeraByte erweitert, der Diskspace von 340 auf 660 TeraByte. Angefangen hat man übrigens vor 17 Jahren mit einer Performance von rund 2 GFlop, seitdem hat sich die Performance alle 3-4 Jahre verzehnfacht, ein Tempo, das man auch in Zukunft beibehalten will. (Andreas Proschofsky)

Foto: gsiCom