Google zeigt, welche Erfolge und Schwierigkeiten bei Bilderkennungsverfahren auftreten

Foto: Google

In wenigen Worten prägnant zusammenfassen, was man auf einem beliebigen Bild sieht: Was Menschen meistens relativ leicht fällt, ist für Software bisher eine Herkulesaufgabe. Denn es gilt viele Faktoren zu beachten: Ist die Farbe das wichtigste? Steht die Interaktion zwischen zwei Menschen im Vordergrund? Sind auf dem Bild bekannte Persönlichkeiten abgebildet? Bislang schafften es Anwendungen nicht, eine Methode für das komplexe Verfahren zu entwickeln.

System wird klüger

Bis jetzt: Denn Google hat bekanntgegeben, mit einem Ansatz namens "Neural Image Caption" eine bislang unerreichbar natürliche Beschreibung von Bildern schaffen zu können. Wie die Süddeutsche Zeitung berichtet, vermischt das Prozedere dabei Ansätze aus der digitalen Bildverarbeitung und dem Forschungsgebiet der natürlichen Sprache. Das System wird dabei weiter trainiert und so klüger.

Durchbruch

Das genaue Prozedere können Interessierte im Google Research Blog nachlesen. Funktioniert die Methode wirklich so gut wie Google behauptet, ist dem Suchmaschinisten ein Durchbruch gelungen. Damit können künftig Suchergebnisse verbessert und Sehbeeinträchtigte bei der Nutzung unterstützt werden. (fsc, derStandard.at, 18.11.2014)