Wie neuronale Netzwerke die Computerwelt umkrempeln

19. Februar 2013, 10:53
27 Postings

Spracherkennung von Android verbessert - Forscher wollen Sprachbarrieren niederreissen

Manche Softwareänderungen geschehen mehr unter der Haube, denn offensichtlicht. Mit "Jelly Bean" hat Google sein mobiles Android-Betriebssystem nicht nur um neue Interfacemerkmale und "Project Butter" erweitert, sondern auch um "neuronales Computing".

Spracherkennung: Fehlerquote um 25 Prozent gesenkt

Die Spracherkennungssoftware arbeitet nicht mehr nach traditionellen Algorithmen, sondern auf Basis eines "neuronalen Netzwerks", einem lernfähigen System, das in seiner Funktionsweise dem menschlichen Gehirn nachempfunden ist. Mit erstaunlichem Erfolg, wie Wired berichtet.

Die Fehlerquote des Voice Recognition-Systems ist damit um ein Viertel gesunken, was selbst Google-Forscher Vincent Vanhoucke überrascht hat. Für den Nutzer wird die Interaktion dadurch auch komfortabler. Sie können ihrem Telefon mit natürlicher Sprache Anweisungen geben und müssen nicht mehr selbst reden wie Roboter, um verstanden zu werden.

Forschungsgebiet wird wieder interessant

In den 1980er-Jahren war die Erforschung neuronaler Algorithmen ein heißes Feld. Doch der Mangel an anwendbarem Fortschritt – was wohl auch dem Stand der damaligen Hardware-Entwicklung geschuldet war – ließ das Interesse abebben. Heute beschäftigt sich nicht nur Webriese Google damit, auch andere Branchengrößen wie IBM oder Microsoft stecken mittlerweile wieder Ressourcen in die Forschung und ihre Verwendungsmöglichkeiten.

2006 gab es einen Umbruch in der Forschung, wie Computerwissenschaftler Geoffrey Hinton von der University of Toronto erklärt. Zum Einen gelang es ihm und seinem Team, einen besseren Zugang zu komplexeren Neuro-Netzwerken zu erschließen, zum Anderen ermöglichte die Verfügbarkeit günstiger Grafikprozessoren einen deutlichen Sprung in den Rechenkapazitäten. "Es machte einen riesigen Unterschied, weil die Sachen plötzlich 30 Mal so schnell arbeiteten."

Eingaben werden Schicht für Schicht analysiert

Wer sich mit Androids Spracherkennungstool unterhält, schickt ein Spektrogramm des Gesagten auf die Reise in eine von Googles großen Serverfarmen, wo sich acht Rechner um die Analyse kümmern. Anhand des Modells eines neuronalen Netzwerks, gebaut von Vanhoucke und seinem Team, werden die Daten verarbeitet.

Das System versucht zu erkennen, was ein neu aufgetauchtes Spektrogramm bedeuten könnte. Google baut aber auch andere, spezialisierte Netzwerke nach Vorbild des Gehirns – etwa für die Analyse von Eingaben in unterschiedlichen Sprachen oder verschiedenen Datentypen, die in Echtzeit verarbeitet werden. Bei Gesprochenem wird das Erkannte in seine einzelnen Buchstaben zerlegt. Dem folgen weitere Analyseebenen, die das System am Schluss zur Erkennung des Gesagten führen sollen.

Das gleiche Prinzip lässt sich auch für Bilder verwenden. Hier geht es beispielsweise um die Erkennung von bestimmten Formen, die Stück für Stück mehr Erkenntnis über das Gesehene zulassen.

Neuronale Netzwerke sollen Sprachbarriere einreissen

Die Möglichkeiten des neuronalen Computings erstrecken sich dabei längst nicht nur auf Sprach- und Bilderkennung. Jeff Dean, jener Techniker, der als Erfinder des modernen Datencenters in seiner heutigen Form gilt, sagt, dass die Technologie auch in andere Produkte Eingang finden könnte. Street View könnte künftig verschiedene Objekte im Sichtfeld voneinander unterscheiden. Medizinforscher aus Toronto nutzten neuronales Computing letzten November erstmals, um das Verhalten von Molekülen bestimmter Medikamente im Voraus zu errechnen.

Microsoft zeigte im Oktober sein eigenes Spracherkennungssystem im chinesischen Tianjin. Chef-Forscher Rick Rashid redete auf Englisch mit dem Publikum. Das System übersetzte das Gesagte simultan und lieferte dem Publikum die chinesische Übersetzung mitsamt Intonation, um so zu klingen wie Rashid.

"In diesem Bereich muss noch viel getan werden", meinte Rashid. "Aber diese Technologie ist sehr vielversprechend und wir hoffen, dass wir in wenigen Jahren die Sprachbarrieren zwischen den Menschen aufheben können. Ich persönlich denke, dass dies zu einer besseren Welt führen wird." (red, derStandard.at, 19.02.2013)

Links:

Wired

Android

  • Die Erforschung neuraler Netzwerke treibt auch die Computertechnik voran.
 
    foto: de lima @ sxc.hu

    Die Erforschung neuraler Netzwerke treibt auch die Computertechnik voran.

     

Share if you care.