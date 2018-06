Raspberry Pis und Intel Compute-Sticks suchen problematisches Material – tausende Fotos bei Bilderhoster aufgespürt

Christian Haschek ist ein Entwickler aus der texanischen Metropole Austin, der in Wien lebt. Er programmiert, seit er 12 Jahre alt ist und betreibt eine quelloffene Image Hosting-Plattform namens PictShare. Diese hatte er ursprünglich für eigenen Bedarf programmiert, jedoch wurde sie auch zunehmend von anderen Personen genutzt. Vor kurzem, so berichtet er in seinem Blog, stellte sich ihm allerdings ein neues Problem: Kinderpornos.

Ein Nutzer hatte ihm mitgeteilt, dass jemand ein entsprechendes Foto hochgeladen hatte. Eine Angabe, die sich als wahr herausstellte. Ein Anruf bei der Polizei verlief jedoch wenig hilfreich. "Der Polizist hatte keine Ahnung, was ein Image Hoster ist und sagte mir, ich solle das Foto herunterladen und ausdrucken, um es auf den Polizeiposten mitnehmen zu können", schildert Haschek.

foto: christian haschek

Minicomputer auf USB-Stick

Letztlich fand er heraus, dass die internationale Polizeiorganisation Interpol sich intensiv mit diesem Problem befasste. Diese teilte ihm mit, er solle das Bild löschen und melden, wenn von der gleichen IP-Adresse weitere Uploads getätigt werden. Haschek wollte jedoch eine weiter reichende Lösung schaffen und möglichst viele einschlägige Fotos von seiner Plattform entfernen. Die vielen tausend Fotos auf Pictshare manuell durchzusehen ist aber freilich aufgrund des Zeitaufwands keine Option.

Also griff er zum Intel Movidius Compute Stick. Dabei handelt es sich um einen Rechner im Format eines USB-Sticks, der dafür designt ist, neurale Netzwerke für Bilderkennung auszuführen. Dieser lässt sich auch an einen Raspberry Pi anschließen und verbraucht deutlich weniger, als es ein Grafikchip würde.

Erfolgreicher Testlauf

Der Entwickler schaltete schließlich drei Raspberry Pis zusammen, auf zwei davon hängte er einen Compute Stick an. Auf den Sticks läuft ein neurales Netzwerk mit dem einem "vortrainierten" Modell namens "open nsfw" von Yahoo. Mit einem Skript wurden die Raspberry Pis schließlich genutzt, um die Sticks mit heruntergeladene Bildern von PictShare zu "füttern".

Diese liefern nun für jedes ausgewertete Foto eine Zahl zurück, die angibt, mit welcher prozentualen Wahrscheinlichkeit das jeweilige Bild Nacktheit enthält. Das Resultat wird in einer Datenbank gespeichert und die Datei selbst danach gelöscht. Für jedes Bild, bei der eine Wahrscheinlichkeit von über 30 Prozent ausgegeben wird, erstattet das System eine Meldung an den Entwickler.

Das Diagramm des Systems.

Das ermöglichte es, eine große Menge an Fotos vorab auszusortieren und letztlich die Entdeckung 16 weiterer kinderpornografischer Aufnahmen, deren Fund Haschek an Interpol meldete.

Fast 3.300 Kinderpornofotos entdeckt

Nach dem Testlauf einer eigenen Seite wandte sich der Entwickler an eine "sehr große Bilderhosting-Plattform". Dort zeigte man sich sehr interessiert an dieser Vorgehensweise und ermöglichte ihm den automatisierten Zugriff. Rund eine Woche lang waren die Rasperry Pis und Movidius-Sticks im Einsatz. Fast 3.300 Kinderporno-Fotos konnten aufgespürt werden, welche von den Betreibern bei ihren lokalen Strafverfolgungsbehörden gemeldet wurden.

Das ganze System mit drei Rasperry Pis und zwei Neural Computing-Sticks sowie einer Platine zur Überwachung des Stromverbrauchs kommt mit einer Stromzufuhr von nur zehn Watt aus und wird mit einem Solarpanel versorgt. Dazu lässt es sich problemlos "horizontal" erweitern, im Prinzip kann man so viele Raspberry Pis und Compute Sticks kombinieren, wie man möchte, um die Auswertung zu beschleunigen.

Test-Tool online

Haschek will nun auch an andere Bilderhosting-Plattformen herantreten und ihnen Hilfe anbieten, auch andere Unternehmen können sich bei Interesse melden. Wer möchte, kann die Genauigkeit über eine Website selber testen. Es gibt auch eine Programmierschnittstelle, mit der man online gespeicherte Bilder überprüfen lassen kann. Hochgeladene Bilder werden laut Angabe auf der Seite automatisch gelöscht und IP-Adressen nach einer Woche anonymisiert. Alle erfassten Daten – Hashes der Bilder, Auswertungsergebnis und anonymisierte IP-Adressen – werden in einem österreichischen Rechenzentrum gespeichert. (red, 18.06.2018)

