Teamwork zwischen Gehirn und Prozessor

29. Juni 2014, 12:00
1 Posting

Niederösterreichische Forscher entwickeln eine Plattform, in der automatische und menschliche Analyse von Datenmaterial Hand in Hand gehen

St. Pölten - Vergleichen, zählen, ordnen: Darin sind Computer kaum zu schlagen. Darin sind sie viel besser als Menschen. Sie arbeiten sich durch immer größere Big-Data-Berge, die durch manuelle Arbeit niemals zu bewältigen wären. Sie können Millionen Messwerte zu Klimakarten verbinden, medizinische Diagnosedaten zu komplexen Visualisierungen fügen oder Stadtpläne mit detaillierten und aussagekräftigen Verkehrsdaten anreichern.

Was die Rechenmaschinen aber nicht können, ist eine fundierte Expertise in einem Themenbereich aufzubauen, vielfältige Erfahrung als Arzt, als Stadtplaner, als Klimaforscher zu sammeln. Sie können kein Hintergrundwissen anhäufen, immer wieder auf ganz konkrete, individuelle Problemstellungen eingehen und maßgeschneiderte Lösungen finden. Diese Fähigkeiten sind - zumindest auf absehbare Zeit - menschlichen Gehirnen vorbehalten.

Im Bereich von Visual Analytics versuchen Forscher, die Stärken von Mensch und Maschine zu verbinden. "Wir wollen die Leistungsfähigkeit von Computersystemen mit der Leistungsfähigkeit des Menschen zusammenbringen", erklärt Wolfgang Aigner vom Institut für Creative Media Technologies der Fachhochschule St. Pölten. Im Forschungsprojekt "Kava-Time" (Knowledge-Assisted Visual Analytics Methods for Time-Oriented Data), das vom österreichischen Wissenschaftsfonds FWF unterstützt wird, arbeiten Aigner und seine Kollegen an einem Softwaresystem, das Daten nicht nur optisch aufbereitet, sondern die Visualisierungen gemeinsam mit dem Anwender verfeinert.

Experten sollen mithilfe der Visualisierungen erkennen können, was der Computer aus den Daten nicht ableiten kann: ein komplexes Krankheitsbild, Erklärungen für widersprüchliche Klimadaten oder einfach nur offensichtliche Fehler in Daten, die ein schadhafter Sensor weiterleitet. Und sie sollen durch die Arbeit mit dem interaktiven Programm die Aufbereitung der Daten stetig verbessern, indem sie ihr Hintergrundwissen einfließen lassen.

Schadsoftware entdecken

Die St. Pöltner Forscher entwickeln ihre Software zuerst für konkrete Anwendungsszenarios, die im weiteren Projektverlauf verallgemeinert und auf weitere Fachgebiete ausgeweitet werden sollen. Der erste Anwendungsfall, dem sich Aigner und sein Team widmen, liegt im Bereich der IT-Sicherheit. Sie wollen Experten helfen, gut versteckte Schadsoftware schneller zu erkennen. "Die Methoden konventioneller Virensoftware, die etwa ein E-Mail auf die Signatur eines Schadprogrammes überprüft, ohne dass dieses ausgeführt wird, funktioniert immer weniger oft", erklärt Aigner. Die Programme verändern ihr Aussehen, tarnen sich, um nicht entdeckt zu werden.

Also muss die schädliche Software anhand ihrer Aktionen erkannt werden, die sie setzt, wenn sie ausgeführt wird. Inmitten zigtausender Systemaufrufe verschiedenster Programme greifen auch sie auf Systemdateien zu, ändern sie, starten selbst Programme oder bauen eine Verbindung zum Internet auf. Die einzelnen Aktionen erscheinen isoliert betrachtet vielleicht gefahrlos. Erst im Zusammenspiel vieler Aktionen entfaltet sich das zerstörerische Potenzial der Malware.

Aigner will mit seinem Team den Visual-Analytics-Ansatz verwenden, um der Schadsoftware schneller auf die Schliche zu kommen. "Eine manuelle Zuordnung wäre ein langwieriger und mühsamer Prozess." Mit einem entsprechenden Visualisierungssystem, das die Ablaufprotokolle in Grafiken zusammenfasst, sollen potenziell schädliche Konstellationen, die aus einer Vielzahl von Einzelprozessen bestehen, leichter erkannt werden können.

Das System merkt sich die Aktionen, die die IT-Experten bei auffälligen Mustern setzen, und kann sie bei allen weiteren Fällen anwenden. "Wenn ich beispielsweise eine bestimmte Kombination von Aufrufen als verdächtig markiert habe, wird mir das auch bei allen weiteren, ähnlichen Konstellationen vorgeschlagen", erklärt Aigner. Die menschliche Fähigkeit zu kontextualisieren, visuelle Muster zu erkennen, die Computern verborgen bleiben, fließt somit in die Aufbereitung der Daten ein.

Auf diese Weise bleibt das Analysemodell nicht darauf beschränkt, "nur dumm Zahlen zu interpretieren. Im Fall von meteorologischen Daten weiß das System dann auch, dass ein bestimmter Sensor die Temperatur misst. Und es weiß, dass eine Lufttemperatur von 80 Grad Celsius nicht plausibel ist", erklärt Aigner.

Die Analyse von Daten, die fehlende oder falsche Werte beinhalten, wird damit erleichtert. Experten geben im Zuge ihrer Arbeit mit dem Analysesystem ganz automatisch mehr und mehr Spezifizierungen ein. Aigner: "Das Ziel ist, dass die Visualisierung verbessert wird und die Computer den Menschen ein Stück weit entgegenkommen."

Der Faktor Zeit

Die Datenaufbereitung konzentriert sich auf Anwendungsfälle, bei denen Zeit eine Rolle spielt. "Bei der Analyse der Schadsoftware ist es nicht egal, in welcher Reihenfolge verdächtige Systemaufrufe erfolgen. Bei medizinischen Daten ist der Zeitpunkt der Messung, etwa des Blutzuckerspiegels, genau so relevant wie bei Verkehrsdaten der Zeitpunkt einer Staubildung an einer bestimmten Kreuzung", erklärt der Forscher.

Die intuitiven und interaktiven Spezifizierungsmethoden, die Experten erlauben, die Daten zu modellieren, sollen in den verschiedensten Wissensbereichen anwendbar sein. Die leicht erfassbaren Visualisierungen, die im Zusammenspiel von automatischer und menschlicher Analyse entstehen, sollen Einsichten erlauben, die bisher nicht möglich waren. (Alois Pumhösel, DER STANDARD, 25.6.2014)

  • Mensch und Maschine machen jeweils das, was sie am besten können: Patientendaten wie Blutzuckerwerte werden vom Computer automatisiert aufbereitet und von Experten mit Hintergrundwissen und Kontextinformationen angereichert.
    grafik: paolo federico

    Mensch und Maschine machen jeweils das, was sie am besten können: Patientendaten wie Blutzuckerwerte werden vom Computer automatisiert aufbereitet und von Experten mit Hintergrundwissen und Kontextinformationen angereichert.

Share if you care.