"Bullshit-Maschine", Artikelklau: Schwere Vorwürfe gegen KI-Suchmaschine Perplexity

Wird Künstliche Intelligenz die Suchmaschine in ihrer bisherigen Form ablösen? Eine Frage, die manche, die ChatGPT, Gemini und Co besonders intensiv nutzen, wohl mit einem klaren Ja beantworten würden. Und auch der langjährige Branchendominator Google lässt immer mehr KI in seine Antworten einfließen – wenn auch mit bislang eher durchwachsenen Ergebnissen. Deutlich offensiver legt es da manches Start-up aus diesem Bereich an, so will etwa Perplexity zur KI-Suche schlechthin avancieren, und dafür ist man offenbar bereit, die Grenzen des Akzeptablen recht weit zu dehnen.

Alles nur Bullshit?

Perplexity sei eine "Bullshit-Maschine", fasst es Wired in einer aktuellen Artikelserie zusammen. Das nicht nur in Hinblick auf die Qualität der Ergebnisse, die wie bei allen auf solch großen Sprachmodellen basierenden Diensten von erfundenen Inhalten durchsetzt sind, sondern auch auf die dahinterstehende Firma selbst. Der Vorwurf: Perplexity stehle wissentlich Artikel und ignoriere dabei lange etablierte Webpraktiken.

Doch worum geht es konkret? Neben jenem Material, auf das die hinter Perplexity stehende KI trainiert wurde, kann die "Antwortmaschine", wie der Anbieter seinen Service in Abgrenzung zur alteingesessenen Konkurrenz bezeichnet, auch auf aktuelle Inhalte zugreifen. Dabei bedient man sich einer Reihe von Diensten, die das Web laufend durchsuchen – also dann doch wieder sehr ähnlich zu einer klassischen Suchmaschine. Allerdings werden diese Inhalte am Ende von der KI zusammengefasst und in einen Überblicksartikel zum Thema verwandelt.

Eine Praxis, die bereits an sich nicht unumstritten ist, bei Perplexity kommt aber noch ein anderer Faktor hinzu: Offenbar ignoriert die KI-Suche nämlich einfach das seit Jahrzehnten etablierte "Robots Exclusion Protocol" und greift auch auf Artikel zu, die eigentlich explizit für solche Systeme blockiert sein sollen.

Testlauf

Um das zu belegen, hat Entwickler Robb Knight einen Test gestartet und einen Artikel auf einer seiner Websites platziert, in dem der Testablauf im Detail beschrieben wurde. Parallel dazu wurde mittels einer robots.txt-Datei Suchmaschinen und anderen Bots der Zugriff auf besagten Artikel verboten. Trotz dieser Blockade konnte Perplexity den Inhalt bereits kurz danach im Detail wiedergeben. Das passt zu jenem Eindruck, den Wired gewonnen hat. Selbst eigene Artikel, die explizit für die Indexierung verboten wurden und die hinter einer Paywall stehen, gibt Perplexity im Detail wieder. Das mit zum Teil sehr ähnlichen Formulierungen im Vergleich zum Original.

Es ist nicht das erste Mal, dass sich Perplexity mit solchen Vorwürfen konfrontiert sieht. Erst vor wenigen Wochen hat Forbes der KI-Suche Artikeldiebstahl vorgeworfen. Diese würde zum Teil ganz Absätze aus eigenen Bezahlartikeln kopieren, daraus dann auch noch automatisch einen Podcast erstellen und sie zum Teil sogar in Youtube-Videos verwandeln, wo dann gar keine Quellenangabe des Originals mehr zu finden ist. Inhalte, die dann oft besser bei klassischen Suchmaschinen gerankt sind als das Original selbst. Perplexity sei alles, was bei KI falsch laufen könnte, fasste Forbes damals die eigene Kritik scharf in der Überschrift zusammen.

Herumrudern

Der Hersteller versucht diese Vorwürfe bislang auszusitzen, Firmenchef Aravind Srinivas beantwortet Fragen zu dem Thema durchgängig vage – und ohne Konsequenzen. Hinter all dem stehe ein Missverständnis darüber, wie Perplexity eigentlich funktioniere, ließ er auf Nachfrage von US-Medien zuerst verlauten. Um dann danach zu betonen, dass man die Inhalte von externen Web-Crawlern bekomme.

Offenbar ist es also einer dieser Dienstleister, die Sperren ignoriert. Um welchen konkret es sich dabei handelt, könne er aber leider nicht sagen, betont Srinivas. Grund dafür sei, dass man mit dem Partner ein Geheimhaltungsabkommen unterschrieben habe. Besagtem Anbieter anzuordnen, das kritisierte Verhalten einzustellen, geht offenbar auch nicht. "Es ist kompliziert", wird Srinivas auf solche Fragen philosophisch.

Grundlegende Fragen

Klar ist allerdings: Andere Anbieter wie ChatGPT, Gemini oder Claude von Anthropic halten sich an die Sperren von Wired. Neben solch besonders zweifelhafter Vorgangsweise werfen KI-Suchmaschinen aber auch grundlegende Fragen zur Zukunft des Webs auf. Wenn Produkte wie Perplexity oder Arc Search und zum Teil eben auch schon die Google-Suche immer mehr wiedergekäute Inhalte direkt wiedergeben, was bedeutet das dann für die als Quellen herangezogenen Webseiten und deren Geschäftsmodell? Und in weiterer Folge: Wer soll dann überhaupt noch Inhalte mit welcher Motivation erstellen – oder um den Kreis zu vollenden: Woher wollen dann die KI-Suchmaschinen in weiterer Folge noch neues Wissen beziehen?

Fragen, auf die Anbieter solcher Dienste bisher keine Antwort haben, das Geschäftsmodell soll erst später ersonnen werden – eine in der Techbranche zugegeben nicht ganz ungewöhnliche Praxis. Bis dahin kann man ganz gut vom aktuellen KI-Hype leben: Hinter Perplexity steht eine Reihe namhafter Investoren, darunter Amazon-Gründer Jeff Bezos oder auch der Chiphersteller Nvidia. Getragen von der Begeisterung für das Thema zielt das Unternehmen in einer neuen Finanzierungsrunde mittlerweile auf eine Bewertung von drei Milliarden US-Dollar ab.

Ironie

Fürs Erste ist eigentlich nur eines klar: Bei Perplexity sieht man derzeit keinen Grund, die eigene Vorgehensweise zu ändern. Und so hat die "KI-Suche" denn auch den ultimativ-ironischen Akt vollzogen: Jener Wired-Artikel, der über den Artikelklau von Perplexity berichtet, wurde natürlich ebenfalls wieder von Perplexity übernommen. (Andreas Proschofsky, 24.6.2024)

Kritik