Der Algorithmus macht die Musik

7. Juli 2009, 18:30
11 Postings

Wie Linzer Grundlagenforscher mithilfe eines Computeralgorithmus einer Stereoanlage das Hören und musikalische Intelligenz beibringen

"Mots" soll digitale Stereoanlagen zum "Mitdenken" bewegen. Und das funktioniert so: Wählt man ein Musikstück, sucht dieser Algorithmus, der in seiner Langform den bezeichnenden Namen "More of the same" trägt, im Hintergrund nach weiteren abgespeicherten Titeln, die bestimmte Ähnlichkeiten aufweisen. Daraus erstellt die Anlage selbstständig Musiklisten in Echtzeit.

Zu finden ist Mots in einer Musikanlage des Herstellers Bang & Olufsen. "Das ist etwas für bequeme Gastgeber, die es der Stereoanlage überlassen, die passende Musik auszuwählen", meint Gerhard Widmer, der mit seinem Team das wissenschaftliche Know-how für die "BeoSound 5" getaufte Highend-Anlage lieferte, augenzwinkernd. Die Zusammenarbeit mit dem Hersteller laufe seit 2003, sagt der Vorstand des Instituts für Computational Perception der Johannes-Kepler-Universität Linz und Abteilungsleiter am Österreichischen Forschungsinstitut für Artificial Intelligence (OFAI) in Wien. Widmer erregte bereits mit seinen Computerstudien zum Interpretationsstil großer Pianisten Aufsehen und erhielt 1998 den Start-Preis.

"Es geht darum, die Maschine dazu zu bringen, herauszufinden, wie Musikaufnahmen klingen, wie sie zusammenpassen", schildert der Grundlagenforscher, dessen Arbeit vom Wissenschaftsfonds FWF gefördert wird. "In diesem Fall versucht der Computer zu berechnen, wie ähnlich Musikstücke sind, und zwar klanglich und rhythmisch."

Damit das funktioniert, müssen die Stücke in die Mathematik übertragen werden. Dazu werden "Features" aus dem Audiosignal berechnet, die ein Musikstück charakterisieren. In die Charakterisierung fließen mit Rhythmus und Klang (also Frequenzmuster, Klangfarbe etc.) Aspekte ein, die für die menschliche Wahrnehmung von Musik wesentlich sind.

Aus den Features werden dann wiederum statistische Modelle berechnet, die das Musikstück repräsentieren und im Vergleich zur Original-Audiodatei sehr kompakt sind: Ein Lied, das als Audiodatei rund 40 Megabyte, das heißt, 20 Millionen Zahlen/Messwerte groß ist, wird durch Mots auf ein Feature-Modell von etwa 800 Zahlen reduziert. "Zwischen den Modellen operiert ein mathematisches Ähnlichkeitsmaß, das für jedes Paar von Stücken ausrechnet, wie ähnlich oder verschieden sie sind", erklärt Widmer. Mots sucht diese Ähnlichkeiten live. "Sobald ich ein Musikstück auswähle, geht die Maschine im Hintergrund die gesamte Datenbank nach ähnlichen Stücken durch und sortiert sie."

Playlists ohne Metadaten 

Die Implementierung in die Stereoanlage sei eine echte Herausforderung gewesen, schildert Dominik Schnitzer, Projektmitarbeiter und Dissertant bei Widmer. "Es ist sehr aufwändig, die Feature-Extraktion durchzuführen, das heißt, bestimmte Muster herauszulesen", erläutert er. Wenn dies auf einem Computer passiere, dürfe der Rechenvorgang ruhig 20 Sekunden dauern. "Die Stereoanlage muss allerdings in einem Bruchteil dieser Zeit damit fertig sein", sagt Schnitzer. "Wir haben erst im Zuge des Projekts diesen Algorithmus sozusagen massentauglich gemacht." Die Anlage sei auch die erste weltweit, die einen solchen Algorithmus verwendet, die anhand des Signals Musikempfehlungen abgibt und automatisch Playlists erstellen kann. Und das ganz ohne Metadaten, wie Schnitzer betont.

"Das Gerät weiß zum Beispiel nicht, was ein Genre ist", fügt Widmer hinzu, "es hat keine Informationen zu Stilen etc. Es hat nur das Audiosignal." Es sei somit eine "Stand-alone-Maschine", die ganz anders arbeite als etwa Apples "Genius", eine Funktion, die es in iTunes ermöglicht, Wiedergabelisten mit - nach Apples Ansicht - "gut zueinander passenden" Titeln zu erstellen.

Wie Ähnlichkeitsmaße arbeiten, kann man auch auf der ORF-Online-Plattform FM4 Soundpark, auf der Nachwuchsmusiker ihr Material kostenlos veröffentlichen können, ausprobieren. Dort laufe ein sogenannter Recommender, den man während einer Kooperation mit FM4 eingebaut habe, erzählt Widmer und erläutert: "Wenn man sich im Soundpark irgendetwas anhört, schlägt dieser sofort drei andere Bands vor." Das sei in diesem Kontext deshalb wichtig, weil der User viele Künslter sonst vielleicht gar nicht entdecken würde. "An den Downloads sieht man, dass die Diversität der Stücke durch den Recommender gestiegen ist. Es gibt also den Effekt, dass sich Menschen Dinge anhören, die sie sich vielleicht sonst nie angehört hätten", sagt Widmer. Durchaus möglich also, dass Mots auch verborgene Schätze der eigenen digitalen Plattensammlung hebt. (Markus Böhm, DER STANDARD, Print-Ausgabe, 8. Juli 2009)

Serie
Dies ist Teil 1 der Serie über die fünf Sinne. Die Serie wird in loser Folge während der Sommermonate fortgesetzt.

Links

Department of Computational Perception

Austrian Research Institute for Artificial Intelligence

FM4 Soundpark

FWF Der Wissenschaftsfonds

  • Gerhard Widmer entwickelte mit einem Team einen Algorithmus, der Musikstücke nach Aspekten charakterisiert, die für die menschliche Wahrnehmung von Musik wesentlich sind.
    foto: standard/corn

    Gerhard Widmer entwickelte mit einem Team einen Algorithmus, der Musikstücke nach Aspekten charakterisiert, die für die menschliche Wahrnehmung von Musik wesentlich sind.

Share if you care.