Der Medizininformatiker Markus Kreuzthaler bringt den Computern Fachsprache bei

Graz – Bei einem Arztbesuch oder Krankenhausaufenthalt können diverse Informationen über den Patienten erfasst und gespeichert werden. Neben Alter und Gewicht etwa auch, ob die Person raucht oder bereits gewisse Krankheiten gehabt und bestimmte Medikamente bekommen hat. Das ist oft, genauso wie die jeweilige Diagnose, in einem Fließtext verfasst und nur selten nach bestimmten Kriterien strukturiert. "Für die zwischenmenschliche Kommunikation funktioniert das prima, aber wenn der Computer daraus relevante Informationen extrahieren möchte, ist es ungleich schwieriger", sagt Markus Kreuzthaler. Er ist dabei, der Maschine diese Operation beizubringen.

Kreuzthaler studierte an der TU Graz Telematik, spezialisierte sich in seinem Masterstudium auf Medizininformatik und schloss sein Doktorat am Institut für Medizinische Informatik, Statistik und Dokumentation der Med-Uni Graz ab. Sein aktuelles Projekt "Innovative Nutzung von Informationen für die klinische Versorgung und Biomarkerforschung" führt er am Grazer Biomarkerkompetenzzentrum CBmed in Kooperation mit der Med-Uni Graz, der Softwarefirma SAP und der Steiermärkischen Krankenanstaltengesellschaft durch.

Der Medizininformatiker arbeitet an einer Software, die Daten aus medizinischen Texten verarbeiten, klassifizieren und in Datenbanken einspeisen kann. "Es gibt zwei Stoßrichtungen, um den Computer zu lehren, wie er natürliche Sprache prozessieren soll", erklärt Kreuzthaler. Man kann der Software klare Regeln einspeisen, etwa die Aufschlüsselungen von Abkürzungen. Die zweite Möglichkeit ist maschinelles Lernen: "Man annotiert selbst einen gewissen Textkorpus, zum Beispiel 3000 Texte, und jagt diese durch das System." Die Software lernt dann anhand der Beispiele. "Im Bereich der Prozessierung natürlicher Sprache wird meist ein Mix aus beiden Methoden angewandt", sagt Kreuzthaler.

Erschwert wird die Erfassung der Texte, die im klinischen Alltag entstehen, dadurch, dass diese in einer kompakten Fachsprache geschrieben sind. Es können sich Sätze darin finden wie: "St. p. TE eines exulc. sek.knot.SSM li US dors. 5/11 Level IV 2,4 mm Tumordurchm. Sentinnel LK ing. li. tumorfr." Bei den Aufzeichnungen der Ärzte gibt es zudem keine klaren Regeln, die Software muss also auch den Kontext unterscheiden können. "Die gleiche Abkürzung kann in der Dermatologie etwas ganz anderes heißen als in der Pathologie", erklärt Kreuzthaler.

Ziel ist die Erstellung eines "strukturierten Patientenprofils", das nach bestimmten Kriterien durchsucht und mit anderen Profilen verglichen werden kann. So könnten etwa Kandidaten für klinische Studien und medizinische Forschung effizient und schnell ermittelt werden. Das Projekt arbeitet mit anonymisierten Daten, in Zukunft könnten solche leicht vergleichbaren Profile aber auch die Krankheitsvorhersage und personalisierte Medizin erleichtern.

"Meine Arbeit ist eine Mischung aus Programmieren, Projektmanagement, Kommunikation und Präsentation", sagt Kreuzthaler. Darüber hinaus seien medizinische Kenntnisse vonnöten. "Das war meine Motivation, in einem wissenschaftlichen Umfeld zu bleiben: Es ist abwechslungsreich." (Julia Grillmayr, 30.9.2017)