Algorithmen

Die "Zaubertricks" hinter Googles Suchergebnissen

23. Februar 2010, 17:32

Wie Google immer intelligenter wird

Seit Jahren dominiert Google das Web als größte Suchmaschine. Das Unternehmen aus Mountain View, das Ende der 90er Jahre von Larry Page und Sergey Brin gegründet wurde, verbucht weltweit knapp 86 Prozent aller Suchanfragen im Web. Seit langem versuchen Konkurrenten sich ihr Stück vom Kuchen des Suchmaschinenmarktes zu sichern. Microsoft hat seine Suchmaschine vergangenes Jahr vollkommen neu überarbeitet, Millionen von Dollar hineingesteckt und viel Lob dafür eingeheimst - Bings Anteile liegen global dennoch derzeit bei 3,17 Prozent. Der Grund wieso Google als Suchmaschine so erfolgreich ist, klingt wenig sexy: Algorithmen. Welche fantastischen "Zaubertricks" sich dahinter tatsächlich verbergen, hat sich Wired zeigen lassen.

Google versteht

Jährlich werden hunderte Verbesserungen an den Suchalgorithmen vorgenommen. Alle paar Jahre wird die Search Engine von Grund auf überarbeitet. Das hat dazu geführt, dass Google bei der Suche nach bestimmten Begriffen relevantere Ergebnisse als die Konkurrenz liefert. Am besten lässt sich das anhand der Suche nach "mike siwek lawyer mi" demonstrieren. Während Google erkennt, dass es sich dabei um den Anwalt Michael Siwek aus Michigan handelt, liefert Bing nur Ergebnisse, die dieser Wörter enthalten (den aktuellen Wired-Artikel ausgenommen). Der Clou hinter Google Suche ist: sie scannt das Web nicht nur nach den Wörtern, sondern erkennt auch den Zusammenhang, in dem sie stehen.

Am Anfang war PageRank

Googles Menü setzt sich aus zahlreichen Zutanten zusammen. Die erste davon war PageRank, das Mitgründer Larry Page 1997 entwickelt hat. Dabei handelt es sich um ein System, das Suchergebnisse danach reiht, wie viele und welche Links auf Seiten verweisen. Diese Links versteht Google als Hinweise darauf, wie wichtig die Ergebnisse für eine Suchanfrage sind. Seither sind viele weiterer Hinweise hinzugekommen. Später wurden beispielsweise der Seitentitel und der Text des Hyperlinks miteinbezogen. Derzeit bezieht Google etwa 200 solcher Hinweise in eine Suche mit ein, um dem User möglichst das zu liefern, was er tatsächlich sucht.

Auf den Kontext kommt es an

Dass eine Suchmaschine wirklich versteht, was Menschen suchen wenn sie beispielsweise "New York Times" eingeben, ist eine trickreiche Angelegenheit. Es reicht nicht nur, den von der Suchmaschine erstellten Index aller Websites nach den Wörtern zu durchforsten, denn dann würden wahllos Seiten gelistet, in den die Wörter "new", "york" und "times" vorkommen. Die Suchmaschine muss tatsächlich begreifen, dass es sich dabei um eine Zeitung handelt, dass mit der Suche nur nach "New York" wiederum die Stadt gemeint ist. Die Engine muss den Kontext einer Suchanfrage verstehen. Nur Wortsynonyme interpretieren zu können reicht nicht. So weiß Google, dass das Wort "puppies" (Welpen) als Synonym für "dogs" verwendet werden kann und "boiling water" ("kochendes Wasser") auch "hot" ist. Die Engine muss aber auch verstehen, dass "Hot Dogs" keine "boiling puppies" sind. Das wurde erreicht, indem die Suchmaschine auf den indexierten Websites auch die Worte neben den gefundenen Suchbegriffen einbezieht.

Twitter-Updates und Goggles

Mit Caffein, der jüngsten Überarbeitung der Engine, können Entwickler solche Hinweise schneller integrieren. Zu den aktuellsten Neuerungen zählen etwa die Integration von Twitter-Posts. Bei 50 Millionen Tweets am Tag muss Google gründlich aussortieren, welche Updates in den Suchergebnissen auftauchen - Retweets, wie viele Follower eine Person hat und ob das Tweet "manuell" verbreitet wurde, oder von einem Bot sind wichtige Kriterien. Eine weitere Entwicklung ist Goggles, bei dem User mit der Handy-Kamera aufgenommene Fotos als Suchanfragen dienen, beispielsweise um Informationen zu berühmten Gebäuden zu erhalten.

Der Motor ist nicht das Wichtigste

Die Konkurrenz versucht dieser Überlegenheit der Suchalgorithmen mit anderen Ansätzen entgegenzutreten. Bing gibt beispielsweise Auskunft über aktuelle Flüge oder Produktpreise. Es kommt nicht alleine auf den Algorithmus an, ist man bei Microsoft überzeugt. Man kauft ein Auto schließlich auch nicht nur wegen des Motors. Es könnte sich in Zukunft stärker herauskristallisieren, dass User für verschiedene Suchanfragen verschiedene Suchmaschinen verwenden. Die Redmonder nennen Bing daher nicht Such- sondern Entscheidungsmaschine. Auch Wolfram Alpha schlägt in diese Kerbe. Daneben existieren dutzende Seiten, die sich auf bestimmte Aufgaben spezialisiert haben. Bei der Aufgabe, die allgemeine Suchanfrage eines Users so zu interpretieren, dass die für ihn relevantesten Ergebnisse geliefert werden, ist Google nach wie vor aber unschlagbar. (red)

Kommentar posten
Posting 1 bis 25 von 136
1 2 3 4
Guybrush-Threepwood
00
24.2.2010, 21:58

Jetzt hätte ich beinahe folgendes gelesen:
Google setzt sich aus zahlreichen Mutanten zusammen .. :-)

Reginald Barclay
01
24.2.2010, 17:47
Lötzinn

Das, was Googles nachhaltigen Erfolg sichert, ist die *schlicht* aussehende, *schnelle* Startseite.
Die ist nämlich das perfekte Beispiel für gutes Interface-Design - schlicht, schnell, nützlich. Kein bunter Blinkscheiss lenkt vom wesentlichen ab wie bei der Konkurrenz (Yahoo, MSN search (immerhin, Microsoft lernt langsam dazu, siehe Bing-Startseite)). Und die bezahlten Ads sind schön unaufdringlich.

Bastian Balthasar Bux
00
25.2.2010, 21:04

nur der depperte Javascript einblend effekt nervt mich tierisch.
Hab mir schon überlegt ob ich nicht einen startseiten-fork mach deswegen ... .

ndaa
00
27.2.2010, 09:24
scroogle ?

°|°
00
24.2.2010, 17:41
kann

es sein, dass 'learning by doing' als prozess nicht nur für sterbliche menschen, sondern auch für eine suchmaschine gelten kann, die von sterblichen menschen konzipiert, programmiert und gewartet wird ?
es werden wohl auch selbstlern-routinen eingebaut sein und weiterentwickelt, und -
es wird sich das suchverhalten der nutzer auch im lauf der zeit ändern / anpassen,
odr ?
vielleicht auch nicht ausser acht lassen: google war vort 10 jahren eine newcomer-gschicht', allerdings mit neuem ansatz.

mercesdes zb. baut schon recht lange automobile, und schaffte es, mit 'elchtest' auf die witzseiten zu kommen.

bösartigster Schlechtmensch
00
24.2.2010, 17:30
Der beste Zaubertrick lautet: MONEY, MONEY, MONEY.

Woyt'sa Vadshn?
 
02
24.2.2010, 16:56
Man kauft ein Auto schließlich auch nicht nur wegen des Motors

Also besser viel buntes Drumherum und unter der Haube ein Spindelöl-Zweitakter.

Typisch Microsoft!

ndaa
00
27.2.2010, 09:25
Tja, was man nicht z'sammbringt, das brauchen die User eh nicht :-)

Dr. Bitter
11
24.2.2010, 15:42
Vorauseilende Anpassung an die Maschine

Die Suchmaschine wird vielleicht nicht wirklich "intelligenter".

Möglicherweise ist es so, dass die Nutzer immer mehr so denken wie es der Programmierung der Suchmaschine entspricht.

Ist das ein weitere Indiz für die Entindividualisierung des Denkens durch Software?



Erich Hofbauer
01

nein. Beispiel: Google (was machen wenn da pc das modem net findet) *g*

der gerüchterstatter
 
00
25.2.2010, 12:07
Anpassung

Was hat das mit Entidividualisierung zu tun?

Menschliches Denken diente immer schon sozialen Zwecken. Und menschliches Denken ist und war auch schon immer Anpassung an die Umgebung.

Oder glauben Sie, dass Bienen, Wespen und Hummeln ihre gelb-schwarzen Streifen deshalb entwickelt haben, weil zuerst menschliches Denken dieses als Zeichen für "das kann wehtun" definiert hat?

fangdenhut
00
24.2.2010, 21:18
Aber möglicherweise ist es auch so

...dass hier jemand zu einem Thema postet, von dem er keine Ahnung hat. Oder haben Sie sich schon einmal auf Entwicklerseite mit künstlicher Intelligenz befasst?

Bono Nobo
04
24.2.2010, 14:23

did you mean Zutanten?

Drew R. Man
01
24.2.2010, 17:23
kann ja mal passieren,

dass jemand statt eines "m" ein "z" schreibt. nobody is perfect.

Bastian Balthasar Bux
00
25.2.2010, 21:07

*rofl*

Langstätter Toni
11
24.2.2010, 12:54

indexiert? das wort gibts ned wirklich oder?

debian1
02
24.2.2010, 14:54

Indiziert hat man früher gesagt, wenn man etwas in einen Index aufgenommen hat. Nur denken bei dem Wort scheinbar die meisten an Zensur...

der gerüchterstatter
 
00
25.2.2010, 12:14

Also ich würde eher sagen, dass früher "Indiziert" ein Synonym für "Zensur" war. Vor allem viel früher.

Das kommt daher dass im 16 Jhd. die katholische Kirchen den "Index Librorum Prohibitorum" (=Verzeichnis verbotener Bücher) erstellte.

Daher kommt das "auf den Index stellen" als Synonym für zensurieren

Langstätter Toni
00
24.2.2010, 15:11

und jetz sagt man indexiert oder wie?

der gerüchterstatter
 
00
25.2.2010, 12:10

lt. duden:
"indexieren (fachsprachl. ein Verzeichnis erstellen)"
"indizieren (auf den Index setzen; mit einem Index versehen ...)"

Bastian Balthasar Bux
00
25.2.2010, 21:10

Ein Verzeichnis erstellen ist aber ganz was anderes als eine Datenbank zu befüllen. Und in diesem Fall ist von letzterem die Rede. ;)

So gesehen kann eine Duden-Definition also recht mehrdeutig sein. ;)

Michael Bakunin
11
24.2.2010, 12:42
find ich gar nicht so toll

wie kann ich bei google erreichen, dass es wirklich nur nach den eingegebenen worten sucht, und nichts hineininterpretiert?

01
24.2.2010, 14:37

um genau ihre phrase zu suchen setzen sie diese in anführungszeichen:
"meine suchanfrage"

weitere optionen und deren beschreibung:
http://www.google.com/support/w... swer=35890

Dscheneräjschen Makulade
00
24.2.2010, 16:20

bei einzelnen wörtern geht auch ein + direkt vor dem wort
zb: +saltzburg

Langstätter Toni
00
24.2.2010, 12:55

nimmst halt eine andere suchmaschine..

Kommentar posten
Posting 1 bis 25 von 136
1 2 3 4

Die Kommentare von Usern und Userinnen geben nicht notwendigerweise die Meinung der Redaktion wieder. Die Redaktion behält sich vor, Kommentare, welche straf- oder zivilrechtliche Normen verletzen, den guten Sitten widersprechen oder sonst dem Ansehen des Mediums zuwiderlaufen (siehe ausführliche Forenregeln), zu entfernen. Der/Die Benutzer/in kann diesfalls keine Ansprüche stellen. Weiters behält sich die derStandard.at GmbH vor, Schadenersatzansprüche geltend zu machen und strafrechtlich relevante Tatbestände zur Anzeige zu bringen.