Lyrebird: Künstliche Intelligenz spricht wie Trump, Obama und Clinton

    4. Mai 2017, 13:34
    7 Postings

    Software soll in der Lage sein, Stimmen schon mit Hilfe einer einminütigen Aufnahme zu kopieren

    Neben unserem Aussehen definiert vor allem unsere Stimme früh den ersten Eindruck, den anderen Menschen von uns haben. Sie ist auch ein wichtiges Identifikationsmerkmal, an dem man andere erkennt, selbst wenn man sie nicht sieht.

    Die Stimme zeichnet sich auch dadurch aus, dass sie als Identitätsmerkmal nur schwer fälschbar ist. Zumindest bis jetzt. Denn Firmen wie Lyrebird arbeiten an Software, die mit nur geringem Aufwand Stimmen imitieren kann – demonstriert am Beispiel von Donald Trump, Barack Obama und Hillary Clinton.

    Eine Minute an Tonmaterial reicht

    In einem Test lässt man die drei US-Politiker ein kurzes Gespräch über Lyrebird führen. Wenngleich insgesamt gut erkennbar ist, dass es sich um künstliche Sprachwiedergabe handelt, gibt es doch manche Passagen, an denen eine Unterscheidung schwer fällt.

    Was allerdings beachtet werden sollte: Die Technologie soll in der Lage sein, aus lediglich einer Minute Originalaufnahmen die individuellen Besonderheiten einer Stimme zu lernen und eine digitale Version von ihr zu erzeugen. Dabei soll sie auch mit verrauschten Tonaufnahmen umgehen können. Je mehr Material zur Verfügung steht, desto besser klingt freilich das Imitat.

    Bei der reinen Wiedergabe der fremden Stimme macht man allerdings nicht Halt. Um realistischer zu wirken, ist Lyrebird in der Lage, die Intonation bei der Wiederholung gleicher Sätze abzuwechseln.

    Für Sprachassistenten und Vorlesefunktionen

    Das Start-up, das an der University of Montreal in Kanada residiert, will die künstliche Intelligenz in Zukunft über eine Programmierschnittstelle verfügbar machen. So sollen beispielsweise App-Entwickler einfach neue Stimmen generieren und in ihre Programme einbinden können.

    So ließe sich etwa mehr Auswahl für Sprachassistenten schaffen oder E-Books von berühmten Persönlichkeiten vorlesen. Interessenten können sich per E-Mail über den Start des Betatests benachrichtigen lassen.

    Tonaufnahmen als Beweismittel bald obsolet?

    Die Technologie wirft allerdings ethische Fragen auf, wie auch die Entwickler selber einräumen. Denn Tonaufzeichnungen genießen allgemein eine hohe Glaubwürdigkeit. In vielen Ländern sind sie bei Gerichtsverfahren gewichtige Beweismittel.

    "Unsere Technologie stellt die Gültigkeit solcher Beweise in Frage, weil sie es ermöglicht, Audioaufnahmen leicht zu manipulieren", heißt es in einer kurzen Erklärung zur Ethik des Projekts. Sie ließe sich potenziell missbrauchen, um Diplomaten zu täuschen oder andere Verbrechen mittels Identitätsklaus zu begehen.

    Durch das Veröffentlichen der eigenen Entwicklung an alle wolle man dazu beitragen, diese Risiken zu minimieren. Es gehe auch darum, darauf aufmerksam zu machen, dass es möglich sei, anderer Leute Stimme zu kopieren und daher Tonaufnahmen ihre Beweiskraft in Zukunft verlieren könnten.

    Auch Adobe entwickelt Stimmensynthesizer

    Lyrebird ist auf seinem Entwicklungsfeld nicht alleine. Adobe, eigentlich bekannt für seine Bildbearbeitungssoftware, werkt unter dem Titel Voco ("Voice Conversion") ebenfalls an einem Tool zur Stimmenmanipulation. Vorgestellt wurde das Projekt im November 2016 auf der hauseigenen Entwicklerkonferenz Adobe Max. Dieses setzt jedoch zumindest 20 Minuten an Tonmaterial voraus, mit dem es ein Stimmprofil ermitteln kann. (gpi, 04.05.2017)

    adobe creative cloud
    • Lyrebird lässt Donald Trump (l.), Obama und die demokratische Präsidentschaftskandidatin Hillary Clinton eine kleine Unterhaltung führen.
      foto: reuters

      Lyrebird lässt Donald Trump (l.), Obama und die demokratische Präsidentschaftskandidatin Hillary Clinton eine kleine Unterhaltung führen.

    Share if you care.