Googles neuronales Netzwerk erkennt Aufnahmeorte von Fotos

28. Februar 2016, 14:29
16 Postings

Künstliche Intelligenz stach in direktem Duell zehn reiseerfahrene Menschen aus

Zahlreiche große IT-Konzerne tummeln sich mittlerweile emsig im Feld der künstlichen Intelligenz. Facebook, Apple, Microsoft, Yahoo und Google liefern sich einen Wettlauf und lassen ihre Ergebnisse in Produkte wie Google Now oder Siri einfließen. Google ist aktuell weit vorne dabei und setzt zunehmend auf "neuronale Netzwerke", also Computersysteme, die ähnlich arbeiten wie ein organisches Gehirn.

Dabei meldet man immer wieder Fortschritte. Nachdem die eigene Software bereits den menschlichen Europa-Meister im Brettspiel "Go" bezwingen konnte, tritt sie nun im März gegen den deutlich höher eingestuften Weltmeister an. "Go" gilt als schwierig zu meistern für künstliche Intelligenzen, da das Spiel viel flexibler gespielt werden kann, als etwa Schach.

KI ermittelt Aufnahmeort

Auch etwas anderes konnten Google-Forscher von der Cornell University ihrem künstlichen Denkwerkzeug mittlerweile beibringen. Es ist zunehmend in der Lage, einzuschätzen, an welchem Ort ein Foto aufgenommen wurde, berichtet MIT Technology Review.

Für Menschen gibt es auf einem Bild oft viele Assoziationen, die es im Kontext ermöglichen, auf die geografische Herkunft des Motivs zu schließen. Neben typischen Landschaftsformen und Vegetation geben beispielsweise Aufschriften auf Verkehrstafeln oder Gebäuden Rückschluss auf das "wo". Eine Vorgangsweise, die sich eine KI erst aneignen muss. Deutlich schwieriger wird es bei Schnappschüssen aus Innenräumen oder Nahaufnahmen von Tieren und Gegenständen, wo viele solcher Hinweise fehlen.

Hohe Erkennungsrate

Tobias Weyand und sein Team haben die Welt in 26.000 viereckige Areale unterschiedlicher Größe eingeteilt, wobei Gebiete, in denen kaum Fotos aufgenommen wurden, nicht berücksichtigt waren. Anschließend fütterten sie das neuronale Netzwerk mit 91 Millionen Bildern, deren Aufnahmeort in den Exif-Daten ausgeschildert war. Auf dieser Basis erlernte die KI die Zuordnung verschiedener Merkmale zu verschiedenen Regionen.

Schließlich wurde das System, das sie "PlaNet" getauft haben, mit 2,3 Millionen Bildern von Yahoos Fotoplattform Flickr auf die Probe gestellt. In 48 Prozent der Fälle konnte die KI Bilder korrekt dem richtigen Kontinent, auf dem sie aufgenommen wurden, zuordnen. Bei 28,4 Prozent der Aufnahmen platzierte "PlaNet" das Foto im korrekten Land. Bei jedem zehnten Bild stimmte auch die Stadt und 3,6 Prozent verortete der Computer sogar im richtigen Block.

Neuronales Netzwerk schlägt Menschen

Auch gegen zehn reiseerfahrene Menschen ließ man das System antreten. Für das Duell wurde "Geoguessr" genutzt. Bei dem Browserspiel wird der Nutzer via Google Street View an einen zufälligen Ort versetzt und muss auf einer Weltkarte markieren, wo er denkt, sich zu befinden. Von 50 Durchgängen konnte "PlaNet" 28 für sich entscheiden.

Die durchschnittliche Abweichung zum tatsächlichen Aufnahmeort war dabei mit 1132 Kilometern nicht einmal halb so weit, wie jene des menschlichen Teams, das sich im Schnitt um 2.321 Kilometer irrte. Die Forscher erklären, dass der große Vorteil der KI ist, dass sie schlicht über einen viel größeren Datenschatz verfügt, als ein Mensch. Das ermöglicht ihr, viel differenziertere Unterscheidungen bei verschiedenen Merkmalen zu treffen.

Weiterentwicklung

Mittlerweile wurde die Software weiterentwickelt und kann nun auch Fotos zuordnen, die keinen Außenbereich zeigen. Das tut sie allerdings nicht anhand des einzelnen Bildes, sondern in dem sie andere Fotos im gleichen Album nach Hinweisen durchkämmt und daraus den Aufnahmeort ableitet.

Künstliche Intelligenz wie diese hätte mittlerweile auch problemlos auf einem modernen Smartphone Platz. Laut den Wissenschaftlern belegt "PlaNet" lediglich 377 Megabyte an Speicherplatz. (gpi, 28.02.2016)

  • "PlaNet" erkennt Aufnahmeorte nicht nur durch allgemein bekannte Sehenswürdigkeiten, sondern kann durch das Erkennen vieler kleiner Assoziationen auch weniger aussagekräftige Bilder einordnen.
    foto: cornell university

    "PlaNet" erkennt Aufnahmeorte nicht nur durch allgemein bekannte Sehenswürdigkeiten, sondern kann durch das Erkennen vieler kleiner Assoziationen auch weniger aussagekräftige Bilder einordnen.

Share if you care.