Die DNA ist ein Speicherfresser

26. März 2013, 17:44
9 Postings

Um effizient Schlüsse aus dem sequenzierten Genom zu ziehen, benötigt man hohe Rechenleistungen

Je mehr die Molekularbiologie den Geheimnissen, die in den DNA-Strukturen von Lebewesen verborgen liegen, auf die Spur kommt, desto größer werden auch die Anforderungen an die Computersysteme, die die gewonnenen Daten aufbewahren und verarbeiten. Das sequenzierte Genom eines einzigen Menschen, jene drei Milliarden Buchstaben, die die Nucleotidbasen repräsentieren, benötigt etwa drei Gigabyte Speicherplatz und würde also noch auf einen USB-Stick passen.

"Wirklich größere Datenmengen aber entstehen, wenn man die Daten miteinander vergleicht", erklärt Michael Krieger, Leiter des Bereichs Advanced Computing Technologies bei der Firma Risc Software. Vergleicht man zwei Genome, liegt die benötigte Datenmenge theoretisch im Bereich mehrerer Exabyte. Sie erhöht sich also um das Milliardenfache.

Die Tochtergesellschaft der Johannes-Kepler-Universität (JKU) Linz ist wie das Institut für Bioinformatik der Uni Linz in dem europäischen Forschungsprojekt "Mr.SymBioMath" (High Performance, Cloud and Symbolic Computing in Big-Data Problems applied to Mathematical Modeling of Comparative Genomics) involviert. Gemeinsam mit deutschen und spanischen Kollegen arbeiten die Forscher an der Optimierung und Leistungssteigerung von Berechnungen in der Genetik.

Rechenleistung und Speicher

Zum einen sei gefordert, die Analyse der sequenzierten Genome möglichst effizient zu gestalten, damit wenig Speicher verbraucht wird, zum anderen müsse die vernetzte Infrastruktur einer europäischen Forschungslandschaft - Rechenzentren und Hochleistungsdatenverbindungen - für die Bewältigung der Genomdaten verwendet werden, erklärt Krieger. " Gibt es eine Möglichkeit, die Rechenleistung möglichst nahe an die Daten zu bekommen", ist eine der Fragen. Eine andere ist, "wie man künftig den Cloud-Computing-Ansatz für die Bioinformatik und letzten Endes für eine personalisierte Medizin, die auf der individuellen genetischen Situation eines Menschen beruht, verwenden kann".

Zwei konkrete Pilot-Anwendungen sollen mithilfe der optimierten Rechenmodell gelöst werden: In der einen soll durch einen automatisierten Vergleich der DNA vieler Spezies auf neue Art ein Modell eines evolutionären Stammbaums des Lebens entstehen und auf letzte gemeinsame Vorfahren verschiedener Arten geschlossen werden.

Bei der zweiten Anwendung, bei der das Linzer Institut für Bioinformatik beteiligt ist, will man den Auslösern bestimmter Arzneimittelallergien auf die Spur kommen. Dabei wird die genetische Information aus vielen Proben der Allergieanfälligkeit der DNA-Eigner gegenübergestellt, erklärt Ulrich Bodenhofer vom Institut für Bioinformatik der JKU.

Das Ergebnis des Abgleichs könnte sein, dass ein bestimmter Buchstabe des sequenzierten Genoms an einer bestimmten Stelle für ein signifikant höheres Allergierisiko steht. Will man nun tausende solcher Marker, die über das gesamte Genom verstreut sind, auf die Spur kommen, benötigt man eine entsprechende Rechenleistung, "um das vernünftig verarbeiten zu können", erklärt Bodenhofer.

Personalisierte Medizin

Am Ende dieser Entwicklung soll irgendwann eine personalisierte Medizin stehen, bei der man die Medikamente maßgeschneidert auf Patienten abstimmt. In aktuellen medizinischen Studien wird per statistischem Ansatz eine typische Wirkung eines Medikaments eruiert. Bei der personalisierten Medizin muss man dagegen das Genom des einzelnen Menschen hinreichend gut verstehen, um beurteilen zu können, wie eine Therapie wirken wird: "Ein radikaler Paradigmenwechsel." (pum, DER STANDARD, 27.03.2013)

  • Die DNA eines Menschen: Jede Farbe steht für eine Base. Forscher arbeiten an der Verarbeitung der reichhaltigen Informationen.
    foto: reuters

    Die DNA eines Menschen: Jede Farbe steht für eine Base. Forscher arbeiten an der Verarbeitung der reichhaltigen Informationen.

Share if you care.