Unter der Führung des "Semantic Technology Institute" (STI) der Universität Innsbruck entsteht derzeit ein europaweites Software-Experiment, das laut den Entwicklern "gigantische Mengen an Wissen zusammenführen und als neuartige Entwicklungsplattform für semantische Technologien" dienen soll. Der Name des von der EU mit sieben Millionen Euro unterstützten Projekts lautet "Large Knowledge Collider" (LarKC) in bewusster Anlehnung an den Teilchenbeschleuniger "Large Hadron Collider" (LHC) am europäischen Kernforschungszentrum CERN.

Schwierig und zeitaufwendig

"Trotz Suchmaschinen kann es oft schwierig und zeitaufwendig sein, bestimmte Informationen im Internet zu finden", erklärte Dieter Fensel, Direktor des STI. Daher habe man in den vergangenen Jahren begonnen, Inhalte mit Schlagworten zu versehen, um sie für den Computer leichter identifizierbar zu machen. Dieses sogenannte Semantische Web wächst nun rasant. Obwohl die Entwicklung erst am Anfang steht, stößt man mit herkömmlichen Rechnerstrukturen rasch an Grenzen.

"Wir haben deshalb eine Initiative lanciert, die den Rahmen der bestehenden semantischen Technologien sprengt und eine völlig neue Denkweise an die Verarbeitung von extrem großen Datenmengen anlegt", so Fensel. Der LarKC wird als Plattform eingerichtet, um Forschern Experimente mit riesigen Datenmengen aus dem Internet zu ermöglichen. Dabei sollen sich Wissenschafter aus aller Welt mit ihren Experimenten in das System einklinken, ohne dass sie sich Gedanken über den experimentellen Aufbau machen müssen.

Anwendung für Stadtbesucher

Eines der ersten Experimente wird eine Anwendung für Stadtbesucher sein, die über die Plattform dynamisch und in Echtzeit Sehenswürdigkeiten und Veranstaltungen in ihrer direkten Umgebung abfragen und auf Basis dieser Daten den optimalen Weg durch die Stadt berechnen lassen können. Grundlage für die Anwendung sind Daten aus dem Internet, wie digitale Stadtpläne, Veranstaltungskalender oder Web 2.0 Anwendungen.

Die Plattform könne aber nicht nur zur Verarbeitung von semantischen Daten aus dem Internet verwendet werden, so die Forscher. Eines der geplanten Experimente wird semantische Daten aus medizinischen Datenbanken zur Grundlage haben. Aus einer großen Anzahl von Patientendaten sollen so Risikofaktoren für bestimmte Krebserkrankungen ermittelt werden. Auf diese Weise könnten Ärzte in Zukunft jene Patienten besser und früher identifizieren, die besonders gefährdet sind. (APA)