SPEAR forscht Spammer in sozialen Netzwerken aus

1. August 2009, 14:25
posten

Software unterteilt Internet-User in "Discoverer" und "Follower"

Ein deutsch-britisches IT-Wissenschafterteam hat eine Software namens SPEAR (Spamming-resistant Expertise Analysis and Ranking) entwickelt, die Internetuser in Spammer und vertrauenswürdige Experten unterteilt. Basierend auf dem bekannten Algorithmus HITS (Hypertext-Induced Topic Selection), der Webseiten automatisch auf ihren Inhalt beurteilt und unter anderem von Suchmaschinen wie Google verwendet wird, ist es dem Team gelungen, User in sogenannte "Discoverers" und "Followers" einzuteilen. Die Discoverers sind jene Nutzer, die einen gewissen Inhalt zuallererst auf sozialen Netzwerken wie Flickr oder Delicious entdecken, beschlagworten und ihn daraufhin mit anderen Nutzern teilen. Die treue Gefolgschaft der Discoverer, die Followers, forcieren die Popularität des Inhalts wiederum, indem sie ihn im großen Maß weiter über das WWW verbreiten. Unter Zweiteren sind jedoch häufig Spammer zu finden, die sich ein populäres Thema im Web zu Nutze machen und mit meist ungewünschtem Werbeinhalt aufladen. Die Einführung von SPEAR stellt damit einen neuerlichen Versuch dar, die Verbreiter von Spam-Nachrichten im Netz auszuforschen und zu bekämpfen.

Quantität und Qualität

Üblicherweise wird die Vertrauenswürdigkeit eines Internetnutzers über die Quantität seiner Online-Beiträge bewertet. Michael Noll, der das Forschungsprojekt am Hasso Plattner Institut der Universität Potsdam geleitet hat, sagt verständlicherweise aber, dass "Quantität nicht automatisch Qualität bedeutet." SPEAR verfolge demnach einen anderen Ansatz, der auf dem Konzept der "gegenseitigen Verstärkung" basiert, so der Wissenschafter. Der Algorithmus von SPEAR bewertet populäre User und populären Inhalt und definiert anhand dessen die Experten als jene User-Gruppe, die als einzige wichtige Inhalte identifizieren kann. Die Qualität der Inhalte wird wiederum durch die Beschlagwortung der Nutzer entscheidend beeinflusst. "Das Resultat ist, dass sowohl die Experten als auch qualitätsvolle Inhalte identifiziert werden können", fasst der nicht im Projekt involvierte IT-Wissenschafter Jon Kleinberg das Konzept der gegenseitigen Verstärkung zusammen.

Einstufung

Das Expertenlevel des jeweiligen Users wird in "gut", "durchschnittlich" und "Anfänger" abgestuft und zusätzlich noch um einen zeitlichen Faktor gemäß dem Ansatz "Der frühe Vogel fängt den Wurm" ergänzt. Jene User, die einen bestimmten Inhalt im Internet als erste entdecken und ihm in der Folge zu großer Popularität verhelfen, können als Trendsetter in der Community bezeichnet werden. "Sie sind es, die den Nutzwert eines Dokuments erkennen, bevor es andere tun", erklärt Ching-man Au Yeung, der ebenfalls an der Entwicklung des SPEAR-Algorithmus mitgearbeitet hat, gegenüber Technology Review. Au Yeung vergleicht den steigenden Einflussgewinn eines Expertennutzers mit jenem eines Akademikers, der sich im wissenschaftlichen Milieu einen guten Ruf verschaffen möchte.

Unter der Lupe

Die Wissenschafter haben SPEAR mithilfe von Daten der Social-Bookmarking-Seite Delicious getestet und kürzlich auf der SIGIR-Konferenz präsentiert. Mehr als 71.000 Internetdokumente, 500.000 User und zwei Mio. geteilte Lesezeichen wurden unter die Lupe genommen. "Wir haben zum Beispiel nach Experten für JavaScript gesucht und daraufhin eine Liste von Usern erhalten. An der Spitze standen zwei professionelle Software-Entwickler und unter den ersten 200 war kein einziger Spammer zu finden", berichtet Noll. Dem Wissenschafter zufolge könne der Algorithmus praktisch auf jedes soziale Netzwerk im Internet ausgeweitet werden. Unternehmen wie Microsoft hätten bereits Interesse bekundet und wollen den Algorithmus vor allem im Rahmen von Social-Search-Angeboten, wo Dokumente aufgrund von Nutzer-Lesezeichen bewertet werden, einsetzen. "Ich denke, dass die Kombination von gegenseitiger Verstärkung mit der Unterscheidung zwischen Discoverer und Follower in vielen Bereichen hilfreich sein kann", so Noll zusammenfassend. (pte)

  • Bild nicht mehr verfügbar
Share if you care.