Herkömmlicher Spam ist leicht erkennbar – der Algorithmus soll jedoch auch gewieftere Betrugsversuche erkennen.

Foto: derStandard.at/Pichler

Wenn sich per E-Mail mal wieder der Nachlassverwalter eines dahingeschiedenen Ölmagnaten meldet oder der Bekannte eines nigerianischen Astronauten um finanzielle Unterstützung ansucht, um diesen nach jahrzehntelangem All-Aufenthalt auf die Erde zurück zu holen, weiß der geübte Nutzer schnell: Es handelt sich um Betrug. Doch nicht jeder Abzockversuch bedient sich solcher plumper bis skurriler Geschichten. Professionellere Betrüger geben sich wesentlich mehr Mühe, um sich etwa als legitime Handelspartner auszugeben.

Zwei britische Forscher arbeiten nun an einem Algorithmus, der betrügerischen Schriftverkehr entlarven soll. Im Harvard Business Manager erklären sie mehr zum Stand der Dinge. Das komplette Interview wurde nun vom Spiegel veröffentlicht.

Analyse auf drei Ebenen

Das System nimmt sich die getippte Korrespondenz auf drei Ebenen vor. Erstens werden ausschließlich Wörter und Wortgruppen auf Häufigkeit und Abweichungen im Gebrauch analysiert. Dann wird der strukturelle Aufbau der Argumentation geprüft und schließlich ermittelt man auch, wie der Verfasser seinen Stil an den Empfänger anpasst.

Dem Zugang zugrunde liegen verschiedene Erkenntnisse. Wird in einem Text gelogen, finden sich darin oft mehr deutliche Adjektive und weniger persönliche Ansprachen. Wird der Leser direkt adressiert schwingt oft implizites Lob mit. Außerdem sind Lügentexte oft stark strukturiert, was daran liegen könnte, dass das Geschilderte auf keiner realen Erfahrung basiert. Dies fällt in der Regel aber erst auf, wenn man sehr aufmerksam liest.

Gleichzeitig sollen Lügner sich im Laufe einer Korrespondenz immer stärker ans Gegenüber anpassen. Dies trifft dabei sowohl auf den Sprachstil, als auch auf das Vokabular zu.

Bis zu 70 Prozent Genauigkeit

Ausschließlich auf Basis der Textanalyse erreicht der Algorithmus mittlerweile eine Treffsicherheit von 60 Prozent – und liegt damit etwa vor Polizisten bei Verhören, die außerdem auch auf nonverbale Signale achten können. Durch die Zufuhr weiterer Daten über den Verfasser lassen sich auch 70 Prozent erreichen. Schwierigkeiten hat das System jedoch noch mit sprachlichem Lokalkolorit, mit Texten von Nicht-Muttersprachlern und der Kontexterfassung.

Als künftigen Einsatzzweck ließen sich etwa Produktbewerbungen auf ihren Wahrheitsgehalt prüfen. Allerdings warnen die Wissenschaftler auch vor anderen Verwendungsmöglichkeiten – etwa zur Überwachung oder Bewertung von Mitarbeitern in einem Unternehmen.