Selbst Facebook-Verweigerer bleiben dem Netzwerk nicht verborgen

  • Alle sind sie im Netz: Beziehungen zwischen Nicht-Mitgliedern, deren 
E-Mail-Adressen dem Netzwerk von Mitgliedern mitgeteilt wurden (rote 
Verbindunglinien), beidseitig bestätigte 
Freundschaftsbeziehungen zwischen Mitgliedern (schwarze Linien) und 
deren Verbindungen zu Nicht-Mitgliedern (grüne Linien).
    vergrößern 600x800
    abbildung: agnes horvát

    Alle sind sie im Netz: Beziehungen zwischen Nicht-Mitgliedern, deren E-Mail-Adressen dem Netzwerk von Mitgliedern mitgeteilt wurden (rote Verbindunglinien), beidseitig bestätigte Freundschaftsbeziehungen zwischen Mitgliedern (schwarze Linien) und deren Verbindungen zu Nicht-Mitgliedern (grüne Linien).

Indirekt lässt sich eine Menge Wissen über Nicht-Mitglieder sammeln, fanden deutsche Forscher heraus

Heidelberg - Was können soziale Netzwerke im Internet über Menschen wissen, die selbst kein Nutzerprofil besitzen, aber Freunde von Mitgliedern sind? Gar nicht so wenig, wie die Ruprecht-Karls-Universität Heidelberg berichtet, nachdem Forscher des Interdisziplinären Zentrums für Wissenschaftliches Rechnen (IWR) das Thema näher betrachtet haben.

Ihre Arbeiten zeigen, dass sich Informationen aus der Netzwerkstruktur von Mitgliedern auf Nicht-Mitglieder übertragen und mit Hilfe von netzwerkanalytischen Strukturmerkmalen auswerten lassen. Unter bestimmten Voraussetzungen ist es möglich, etwa 40 Prozent der existierenden Freundschaftsbeziehungen zwischen Nicht-Mitgliedern auf der Basis reiner Kontaktdaten korrekt vorherzusagen.

Schattenprofile

Bereits seit einigen Jahren gehen Wissenschafter der Frage nach, welche Schlussfolgerungen sich mit Hilfe des Computers aus direkt oder indirekt eingegebenen Daten durch entsprechende Lern- und Vorhersagealgorithmen ziehen lassen. In einem sozialen Netzwerk können auch Angaben wie sexuelle Orientierung oder politische Ausrichtung, die ein Mitglied nicht selbst angegeben hat, mit sehr hoher Präzision "berechnet" werden, wenn genug Freunde des betreffenden Nutzers die entsprechende Information über sich selbst freigegeben haben. "Sobald bestätigte Freundschaftsbeziehungen bekannt sind, ist die Vorhersage bestimmter unbekannter Eigenschaften keine allzu große Herausforderung mehr für die maschinelle Datenanalyse", sagt Fred Hamprecht, Mitbegründer des Heidelberg Collaboratory for Image Processing (HCI).

Untersuchungen dieser Art beschränkten sich bislang jedoch auf Personen, die in einem sozialen Netzwerk tatsächlich über ein Nutzerprofil verfügen - und damit den jeweiligen Datenschutzbedingungen zugestimmt haben. "Nicht-Mitglieder besitzen hingegen keine derartige Vereinbarung. Aus diesem Grund haben wir ihre Anfälligkeit für die automatische Generierung sogenannter Schattenprofile untersucht", erläutert die an der in "PLoS ONE" veröffentllichten Untersuchung beteiligte Katharina Zweig.

In einem sozialen Netzwerk im Internet ist es möglich, unter anderem mit Hilfe einer Funktion zum Auffinden von Bekannten an Informationen über Nicht-Mitglieder zu gelangen. So werden Neumitglieder von Facebook dazu aufgefordert, bei ihrer Registrierung dem Netzwerk ihre kompletten E-Mail-Kontakte zur Verfügung zu stellen - auch Kontakte zu Personen, die selbst nicht Mitglied bei Facebook sind. "Dieses sehr grundlegende Wissen darüber, wer mit wem in einem sozialen Netzwerk bekannt ist, lässt sich mit Informationen darüber verknüpfen, wen Nutzer außerhalb des Netzwerks kennen. Mit dieser Verknüpfung kann dann wiederum ein wesentlicher Teil des Bekanntschaftnetzes zwischen Nicht-Mitgliedern abgeleitet werden", erläutert Ágnes Horvát vom IWR.

Trefferquote erstaunlich hoch ... und noch ausbaufähig

Für ihre Berechnungen nutzten die Heidelberger Wissenschafter ein Standard-Verfahren des maschinellen Lernens, aufbauend auf netzwerkanalytischen Strukturmerkmalen. Da die Daten, die für diese Untersuchung benötigt wurden, nicht frei erhältlich sind, haben die Forscher mit einem Testset echter Grunddaten gearbeitet. Die Aufteilung in Mitglieder und Nicht-Mitglieder sollte dabei mit einer möglichst großen Bandbreite von Methoden simuliert werden. Mit der Simulation war es zugleich möglich, die Untersuchungsergebnisse zu validieren. Mit handelsüblichen Computern konnte in nur wenigen Tagen berechnet werden, welche Nicht-Mitglieder mit großer Wahrscheinlichkeit miteinander befreundet sind.

Für die Heidelberger Wissenschafter war dabei überraschend, dass alle Simulationsansätze qualitativ dasselbe Ergebnis brachten. "Unter realistischen Annahmen darüber, wieviel Prozent einer Bevölkerung Mitglied eines sozialen Netzwerkes sind und mit welcher Wahrscheinlichkeit diese ihr E-Mail-Adressbuch hochladen, hat sich gezeigt, dass es mit den Berechnungen möglich war, rund 40 Prozent richtige Vorhersagen über Bekanntschaften zwischen den Nicht-Mitgliedern zu treffen." Dies stellt nach Angaben von Michael Hanselmann vom HCI eine 20-fache Verbesserung gegenüber einfachem Raten dar. "Verbesserung" in neutralem Sinne, wenn man an Datenschutz denkt.

"Unsere Untersuchung hat deutlich gemacht, welches Potenzial soziale Netzwerke besitzen, um Informationen über Nicht-Mitglieder abzuleiten. Die Resultate sind auch deshalb erstaunlich, weil sie auf reinen Kontaktdaten beruhen", betont Hamprecht. Viele soziale Netzwerke und Dienstleister verfügen jedoch über weitaus mehr Informationen der Nutzer, etwa Alter, Einkommen, Ausbildung oder Wohnort. Mit der Verwendung solcher Angaben, einer entsprechenden technischen Infrastruktur und weiteren Strukturmerkmalen der Netzwerkanalyse ließe sich - so die Wissenschafter - die Vorhersagegenauigkeit vermutlich noch deutlich steigern. 

Die Schlussfolgerung

"Insgesamt zeigt unser Projekt damit auf, dass wir als Gesellschaft eine Vereinbarung dafür finden müssen, inwieweit Informationen genutzt werden dürfen, zu denen es keine Freigabe der betroffenen Personen gibt", sagt Zweig. (red, derStandard.at, 6.5.2012)

Share if you care