Mit der Stimme des Originalsprechers – Übersetzungsqualität derzeit aber noch unter klassischen Modellen

Wer "Per Anhalter durch die Galaxis" gelesen hat, wird die Idee kennen: Unter dem Namen "Babelfisch" gibt es in den Werken von Douglas Adams einen Universalübersetzer, der zwischen verschiedensten Sprachen übersetzen kann. Ganz so weit ist die technische Entwicklung derzeit zwar noch nicht, sie hat aber in den vergangenen Jahren massive Fortschritte gemacht. Und in einem Blogeintrag demonstriert Google jetzt, was aktuell bereits möglich ist.

Direkter Weg

Unter dem Namen "Translatotron" stellt Google ein neues Modell zur direkten Übersetzung von Gesprochenem in eine andere Sprache vor. Bisherige Ansätze nehmen den Umweg über die Umwandlung in Text, es werden also schlicht mehrere Maschinenlernmodelle aneinander gereiht. Hier passiert all dies hingegen in einem einzigen Schritt.

Möglich wird dies durch die Nutzung eines Sequence-to-Sequence-Modells, das die Spektogramme des Gesprochenen übersetzt. Die Ausgabe erfolgt dann über einen Vocoder, und zwar einen, für den man sich ebenfalls etwas Besonderes einfallen hat lassen: Bildet dieser doch die Stimme des Originalsprechers nach. Damit kommt man der Idee eines Babelfischs also schon ziemlich nahe.

Probleme

Bis das Ganze wirklich in einem alltagstauglichen Produkt landen, wird es aber wohl noch einige Zeit dauern. Aktuell ist die Qualität der Übersetzung noch nicht auf dem gleichen Niveau wie herkömmliche System. Wer sich aber trotzdem schon einmal von dem derzeit technisch Machbaren überzeugen will, sollten einen Blick auf den entsprechenden Eintrag im AI Blog werfen. Finden sich dort doch auch Audio Samples, die verdeutlichen, wie eine solche Übersetzung mit nachgeahmter Stimme dann klingt. (apo, 19.5.2019)