Computer lernen Lippenlesen

29. April 2003, 09:49
posten

Intel veröffentlicht Open-Source-Software zur Unterstützung der Spracherkennung

Der Halbleiterhersteller Intel hat auf seinem Developer Forum in Berlin ein Programm vorgestellt, das Computern das Lippenlesen beibringen soll. Das System kommt aus der Forschungsabteilung von Intel und besteht aus einem Gesichtserkennungsalgorithmus sowie der Audio Visual Speech Recognition (ASVR). Das Paket wird im Rahmen einer Open-Source-Lizenz für Entwickler veröffentlicht, die die Spracherkennungsfähigkeiten ihrer Computer verbessern wollen.

Probleme

Zurzeit wird die Spracherkennung von Computern sehr stark von Hintergrundgeräuschen beeinträchtigt. Das System aus Gesichtserkennung und ASVR erkennt das Gesicht des Sprechers und folgt dessen Mundbewegungen. Die Synchronisation der Videodaten mit Sprachidentifizierung macht nach Angaben von Intel deutlich genauere Spracherkennung möglich. Die ASVR Software ist Teil der Intel OpenCV Computer Vision Bibliothek. Diese Toolbox besteht aus mehr als 500 Bildverarbeitungsfunktionen, mit deren Hilfe Forscher bilderkennende Applikationen entwickeln können.

Interagieren

Intel will mit der Technologie vor allem eine natürlichere Art der Interaktion zwischen Benutzer und Computer fördern. "Die Erkennung durch den Menschen basiert nur selten auf einer einzigen Informationsart. Wir treffen Entscheidungen durch die Kombination von Informationen aus einer Vielzahl von Quellen", sagte Justin Rattner, Intel Senior Fellow der Enterprise Platform Group und Director des Intel Microprocessor Research Labs. "Die Ergänzung von Intels OpenCV Bibliothek durch Audio/Video Spracherkennungscode wird die Forschung und Entwicklung in bildgestützter Spracherkennung ganz sicher vorantreiben."

Entwicklung

Der US-Konzern forscht bereits seit Jahren nach Einsatzmöglichkeiten für Video-Applikationen auch im PC-Bereich. Die Code-Basis OpenCV wurde für eine Innovationsbeschleunigung in diesem Bereich entwickelt, indem sie Quellcode für einen weiten Bereich aus bilderkennenden und bildverarbeitenden Funktionen bereitstellt. Intel fördert damit gleichzeitig ganz bewusst den Bedarf nach immer leistungsfähigeren Prozessoren. ASVR wurde im Pekinger Forschungslabor des Konzerns entwickelt.

Die Software beinhaltet C Source-Code für alle Funktionalitäten der Bibliothek sowie eine Redistributions-Lizenz ohne anfallende Lizenzgebühren. Informationen über ASVR finden sich unter www.intel.com/research/mrl/research/avcsr.htm . (pte)

Link

Intel

  • Bild nicht mehr verfügbar
Share if you care.