Die Suchmaschinenflüsterer

26. Oktober 2003, 19:14
3 Postings

Was wäre, wenn Suchmaschinen nicht nur Stichworte, sondern ganze Sätze verstehen könnten?

... dieser Frage gingen Helmut Berger und Michael Dittenbach vom Electronic Commerce Kompetenzzentrum ec3 nach. Elke Ziegler sprach mit den beiden Programmierern.

STANDARD: Wie seid ihr beide auf die Idee gekommen, die Suchmaschine "Tiscover Powersearch" zu entwickeln, die ein Surfer nicht nur durch Schlagworte, sondern durch ganze Sätze aktivieren kann?

Dittenbach: Wir waren der Meinung, dass es eine alternative Form des Suchens im Internet abseits von Stichwörtern und Auswahlfeldern geben muss. Die Abfrage über die natürliche Sprache in Form von ganzen Sätzen oder Satzteilen erschien uns ein interessanter Weg zu sein, Menschen mit wenig Internet-Erfahrung den Zugang zu Datenbanken zu erleichtern.

Berger: Durch die Forschungspartnerschaft von ec3 und Tiscover war es für uns nahe liegend, Tourismusdaten zum Befüttern und Testen unserer Suchmaschine zu verwenden.

STANDARD: Was gefällt euch nicht an den heute üblichen Suchmaschinen?

Berger: Dass man in der Suche relativ stark eingeschränkt wird. Ein Surfer muss seine Vorstellungen an die Logik der Suchmaschine anpassen. Mit unserem Ansatz kann ich den Satz "Ich suche ein Doppelzimmer für zwei Nächte in Linz" genau so in das Suchfeld eingeben und bekomme als Ergebnis eine Liste mit Unterkünften. Wenn man vorausdenkt, wird das Potenzial sichtbar: Vielleicht wird es einmal möglich sein, Abfragen via Handy zu starten. Auch da wird man ganze Sätze oder Satzteile als Anfrage formulieren und nicht Schlagwörter.

STANDARD: Wie funktioniert eure Suchmaschine technisch? Ist es nicht so, dass der Computer den Satz wieder auf Schlagworte durchsucht und danach die Datenbank auswertet?

Dittenbach: Teilweise ja, aber es geht über die Schlagwortsuche hinaus. Hinter dem System steht eine Wissensbasis, in der im Tourismus wichtige Begriffe wie Hotel, Swimmingpool, Sauna etc. definiert sind. Die Maschine analysiert den Satz zunächst auf diese Ausdrücke und dann auf Wörter wie "und", "oder" bzw. "nicht", die logische Zusammenhänge kennzeichnen.

STANDARD: Welche wichtigen Qualifikationen benötigt man eigentlich neben den Programmierkenntnissen, um eine solche Maschine erstellen zu können?

Dittenbach: Die linguistischen Basiskenntnisse mussten wir uns schon aneignen. Zusätzlich hatten wir noch das Glück, dass hier im ec3 ein Sprachwissenschafter arbeitet, der uns unterstützen konnte.

STANDARD: Wie wurde die Suche in ganzen Sätzen denn von den Usern beim ersten Testlauf im März 2002 angenommen?

Berger: Eigentlich haben wir erwartet, dass die Menschen genau wissen, wie sie eine ganz normale Frage stellen. Aber manche haben das vertraute Umfeld mit Schlagworten und Auswahlfeldern vermisst und waren verunsichert, wie sie denn nun einen "richtigen" Satz formulieren sollten. Einige haben deshalb in das Kommentarfeld geschrieben, dass sie sich genauere Anleitungen wünschen.

Dittenbach: 60 Prozent der knapp 1500 Benutzer haben grammatikalisch korrekte vollständige Sätze formuliert, 20 Prozent etwa haben Halbsätze wie "Suche Unterkunft in Tirol zum Skifahren" formuliert, die restlichen 20 suchten großteils über Stichworte.

STANDARD: Wie geht es nach dem Testlauf weiter mit "Powersearch" ?

Berger: Wir versuchen, Erkenntnisse aus Benutzerkommentaren zu berücksichtigen. Es wurde zum Beispiel bemängelt, dass man nicht nach vagen Begriffen wie "Wellness" suchen kann. Als Lösungsansatz habe ich ein assoziatives Netzwerk entwickelt: Begriffe wie "Sauna", "Solarium" oder "Dampfbad" werden als Knoten dargestellt und zueinander in Beziehung gesetzt.

Wenn jemand nun nach einem Hotel mit einer Sauna sucht, stimuliert der Saunaknoten die mit ihm verbundenen Knoten. Das Suchergebnis spiegelt die Querverbindungen wider, indem Unterkünfte, deren Merkmale enger vernetzt sind, höher gereiht werden. So kann man sich unklaren Begriffen wie eben "Wellness" über die mehr oder weniger starke Vernetzung von bestimmten Ausstattungsmerkmalen annähern.

STANDARD: Für wie wichtig haltet ihr Suchmaschinen im Internet?

Berger: Wichtig sind sie ohne Frage, das Problem ist nur, dass sie in einem gewissen Sinn über die Online-Information "wachen". Sobald ein Großteil der User eine Suchmaschine verwendet wie z. B. Google, was zumindest in meinem Umfeld schon der Fall ist, bekommen die von der Maschine präsentierten Ergebnisse eine neue Relevanz. Die Suchmaschine suggeriert mir, dass sie mir alle Onlinequellen zu einem Thema anzeigt und sie noch dazu nach der Wichtigkeit ordnet. Keiner weiß, mit welchen Kriterien die angezeigten Infos ausgewählt und ob bewusst bestimmte Ergebnisse zurückgehalten werden. Bedenklich finde ich, dass diese Entwicklung so unterschwellig passiert.

Dittenbach: Man muss natürlich anerkennen, dass die Popularität von Google aus der Qualität ihrer Suchfunktion resultiert. Es steckt aber ein großes Potenzial für Informationskontrolle in dieser fast monopolartigen Stellung einer Suchmaschine. Methoden, mit denen einzelne Websites in den Ergebnislisten nach oben gedrückt werden, zwingen die Entwickler immer wieder dazu, Websites händisch aus ihrem Suchindex zu löschen. Wer aber garantiert mir, dass da nicht für mich wichtige Seiten hineinrutschen und ebenfalls gestrichen werden? (DER STANDARD, Print-Ausgabe, 20. 10. 2003)

Share if you care.