Die Datenmengen werden größer, die Algorithmen bekommen mehr zu tun.

Foto: iStockphoto

Claudia Plant forscht zu Data-Mining und Big Data.

Foto: Universität Wien

Besteht die Gesellschaft bereits aus gläsernen Menschen? Mit dieser Frage hat Data-Mining-Expertin Claudia Plant von der Universität Wien ihren Beitrag über Big Data im Rahmen der Semesterfrage eingeleitet. Sie hat darin Risiken aufgezeigt, die durch Zusammenführung von Daten durch komplexe Algorithmen entstehen können – was mitunter dazu führen kann, dass man in der Berufswelt Nachteile erfährt. Die Community ergriff die Chance und diskutierte mit der Expertin über die Bedeutung für den Einzelnen, die Legislative und Unternehmen, die Daten sammeln.

Claudia Plant: Wir brauchen tatsächlich mehr Wissen und Bewusstsein dafür, was mit Daten machbar ist. Daher ist eine Informatikausbildung zumindest in den Grundzügen schon in der Schule wichtig.

Plant: Sie sprechen ein wichtiges Problem an. Wir brauchen meiner Meinung nach eine bessere Verzahnung und mehr Zusammenarbeit zwischen Juristen und Data Scientists aus den Universitäten und aus der Wirtschaft. Diese Experten können nur gemeinsam ethische und rechtliche Rahmenbedingungen weiterentwickeln.

Plant: Wenn wir schwierige Probleme in vertretbarer Zeit lösen möchten, müssen wir Heuristiken anwenden. Sehr viele Algorithmen enthalten Heuristiken, das ist richtig. Beispielsweise verwenden wir häufig eine lokal optimierende Vorgehensweise kombiniert mit dem Zufall, um große Lösungsräume zu durchsuchen. Aber auch solche Heuristiken sind ganz normale Algorithmen. Der Erfinder und Data-Mining-Spezialisten wissen Bescheid, inwieweit sich die Heuristik auf die Qualität auswirkt. Die Auswahl eines geeigneten Algorithmus kann der Data-Mining-Spezialist aber nur gemeinsam mit einem Anwendungsexperten treffen.

Beispielsweise arbeite ich bei der Entwicklung von Algorithmen für neurowissenschaftliche Bilddaten eng mit Medizinern und Neurowissenschaftern zusammen. Sie informieren mich genau über ihre Anforderungen – und ich sie über die Möglichkeiten und Grenzen von Algorithmen. Nur gemeinsam können wir gute Entscheidungen treffen und neue Erkenntnisse über die Daten gewinnen. Wir haben nicht vor, die Diagnose des Arztes zu ersetzen. Unser Ziel ist, komplexe Krankheitsbilder besser zu verstehen. Wir gewinnen also in medizinischen Projekten immer Erkenntnisse auf aggregierter Ebene. Eine sorgfältige Abwägung von Nutzen und Risiken des Einsatzes von Data Mining und ähnlichen Methoden ist wichtig und immer nur gemeinsam mit Anwendungsexperten möglich.

Plant: Das ist tatsächlich schwierig zu sagen, denn wir wissen oft gar nicht, was wo über uns gespeichert ist. Daher mit sensiblen Informationen bitte verantwortungsbewusst umgehen.

Plant: Algorithmen sind tatsächlich kein neues Thema. Der Name geht auf einen Gelehrten zurück, der um 800 im Zweistromland lebte. Der erste Algorithmus für den Computer wurde 1843 von Ada Lovelace aufgeschrieben. Seitdem hat sich viel getan. Manch gute Algorithmen sind tatsächlich einfach. Andere dagegen hochkomplex. Die rasante Entwicklung der Hardware, zum Beispiel bei Cloud Computing, Grafikkarten und Multi-Kern-Prozessoren erlauben uns heutzutage die Entwicklung von Algorithmen für immer komplexere Probleme.

Über das Web haben wir freien Zugang zu sehr großen Datenmengen, mit denen wir arbeiten können. Mit Techniken des Deep Learnings werden aktuell sehr große Fortschritte bei der Übersetzung von Texten gemacht. Die Qualität kommt den Übersetzungen durch den Menschen immer näher. Die Idee von Deep Learning ist es, auf eine ähnliche Art und Weise zu lernen wie das menschliche Gehirn. Diese Algorithmen sind sehr komplex. Die Ergebnisse sind beeindruckend, aber wir verstehen noch zu wenig darüber, warum sie so gut sind. Wenn man also Deep Learning durch einfachere und dadurch verständlichere Algorithmen realisieren könnte, wäre das sehr interessant. Wir könnten dann besser die Fehler verstehen, die Deep-Learning-Techniken machen, was beispielsweise beim autonomen Fahren sehr wichtig ist.

Plant: Rechtliche Rahmenbedingungen werden sicherstellen, dass solche Entscheidungen immer nur von Ärzten getroffen werden. Wenn das Ärzteteam Ihre Überlebenschance als sehr niedrig bewertet, würde man auch heute mit Ihnen gemeinsam zu der Entscheidung kommen, lieber nicht zu operieren, und daran wird sich nichts ändern. Data-Mining-Techniken werden dazu beitragen, dass Mediziner in Zukunft mehr Informationen für eine fundierte Abschätzung des Risikos haben. (13.1.2017)