Forscher rekonstruieren Gespräche durch Filmen einer Chipspackung

6. August 2014, 10:13
99 Postings

Algorithmus kann deutlich wahrnehmbare Sprache aus durch Schallwellen erzeugten Vibrationen wiederherstellen

Wissenschaftler am MIT haben in Zusammenarbeit mit Forschern von Microsoft und Adobe einen Algorithmus entwickelt, mit dem sie in Audiosignale anhand der Vibration von mit Kameras aufgenommenen Objekten rekonstruieren können. In einem der Versuche konnten sie über die Vibrationen einer Chipspackung, die aus einer Entfernung von über 4 Metern durch schalldichtes Glas aufgenommen wurde, deutlich wahrnehmbare Sprache wiederherstellen.

Vibrationen durch Schallwellen

"Wenn Schallwellen ein Objekt treffen, lösen sie Vibrationen aus", erklärt Abe Davis, einer der Forscher. "Die Schwingungen dieser Vibrationen erzeugen ein sehr unscheinbares visuelles Signal, das normalerweise mit bloßem Auge nicht sichtbar ist." Um diese Signale auswerten zu können, werden die Objekte mit Hochgeschwindigkeitskameras aufgenommen, die 2.000 bis 6.000 Bilder pro Sekunde aufzeichnen können. Zum Vergleich: Das iPhone 5s schafft Zeitlupenaufnahmen mit 120 Bildern pro Sekunde.

Funktioniert auch mit Blättern einer Topfpflanze

Die Forscher konnten in weiteren Versuchen brauchbare Audiosignale auch durch die Aufnahme von Alufolie, der Oberfläche eines mit Wasser gefüllten Glases und der Blätter einer Topfpflanze rekonstruieren. Die Schwingungen der Objekte bewegten sich dabei in der Größenordnung von einem Zehntel eines Mikrometers, so die Forscher.

abe davis's research

Bedingte Rekonstruktion auch mit normalen Kameras

In einer weiteren Versuchsreihe haben die Forscher zur Videoaufnahme eine handelsübliche Kamera, die mit 60 Bildern pro Sekunde aufnimmt, verwendet. Die Qualität der rekonstruierten Audiosignale war zwar schlechter als bei den Versuchen mit Hochgeschwindigkeitskameras, trotzdem könne man zumindest die Geschlechter der Personen in einem Raum und die Anzahl der Sprecher feststellen. Hat man genügende Informationen über die akustischen Eigenheiten von Stimmen, sei womöglich sogar eine Identifizierung von Personen möglich.

"Könnte aus einem Hollywood-Thriller stammen"

"Wir sind Wissenschaftler und manchmal schauen wir uns Filme wie James Bond an und denken: 'Das ist Hollywood. So etwas ist nicht möglich. Das ist doch lächerlich.' Und plötzlich haben wir es. Das könnte aus einem Hollywood-Thriller stammen. Der Killer entlarvt sich, weil eine Überwachungskamera seine vibrierende Chipspackung aufgenommen hat", so Alexei Efros, einer der an der Studie beteiligten Professoren des MIT.

Überwachungsinstrument?

Efros ist gespannt darauf, welche Anwendungen sich für die Technologie finden lassen. Auf eine mögliche Verwendung als Überwachungsinstrument gehen die Forscher bei der Ankündigung ihrer Ergebnisse jedoch nicht ein. Die gesamte Publikation soll auf der Computergrafik-Konferenz SIGGRAPH, die am 10. August in Vancouver startet, vorgestellt werden. (wen, derStandard.at, 6.8.2014)

Links

MIT

  • Die neueste Entdeckung der MIT-Forscher könnte direkt von Q aus den James-Bond-Filmen stammen.

    Die neueste Entdeckung der MIT-Forscher könnte direkt von Q aus den James-Bond-Filmen stammen.

  • Bei einem Versuchsaufbau wird die Hochgeschwindigkeitskamera mehrere Meter von der Chipspackung hinter einer Glasscheibe positioniert.
    foto: mit

    Bei einem Versuchsaufbau wird die Hochgeschwindigkeitskamera mehrere Meter von der Chipspackung hinter einer Glasscheibe positioniert.

Share if you care.