Schürfen in riesigen Datenbergen

5. Juli 2004, 12:42
posten

Data-Mining ist ein Instrument, um gezielte Infos über Kunden herauszufiltern. Der Statistiker Marcus Hudec leitet eine Forschungsgruppe am Kompetenzzentrum EC3, die sich mit dem Thema beschäftigt. Mit Doris Griesser sprach er über Einsatzbereiche und Datenschutz

STANDARD: Das Ziel von Data-Mining ist die Gewinnung von neuem und ökonomisch verwertbarem Wissen aus großen Datenbeständen. Welche Art von Informationen wird hier generiert?

Hudec: Die Informationen dienen in erster Linie dazu, die Beziehung eines Unternehmens zu seinen Kunden zu verbessern, indem sie über deren Verhalten Auskunft geben. Mit diesem Wissen können Geschäftsprozesse und Marketingaktivitäten besser an die Wünsche der Klientel angepasst werden. Früher hatten Unternehmen eine relativ überschaubare Zahl von Kunden, deren Charakteristika bis zu einem gewissen Grad bekannt waren. Bei vielen großen Betrieben ist das heute einfach nicht mehr möglich. Wenn ein Unternehmen mit Hunderttausenden Kunden typische Kundenmuster herausfinden oder eine gezielte Direct-Marketing-Aktion bei einem Teil davon durchführen möchte, braucht man leistungsfähige Algorithmen, um die für diese Gruppe relevanten Informationen herauszufiltern.

STANDARD: In welchen Branchen wird Data-Mining eingesetzt?

Hudec: Am häufigsten wird es zurzeit von Banken und Versicherungsgesellschaften betrieben. Aber auch große Mobilfunk- und Telefoniebetreiber oder Supermarktketten und Versandhäuser setzen es für gezielte Marketingaktivitäten ein. Bei uns entwickelte sich dieser Bereich erst in den letzten Jahren, in den USA kommt Data-Mining schon seit mindestens zehn Jahren intensiv zum Einsatz.

STANDARD: Geht es zum Beispiel Banken dabei ausschließlich um verbessertes Marketing?

Hudec: Hier geht es vor allem um Kreditrisikoanalysen, was einer der klassischen Anwendungsbereiche des Data-Minings ist. Ziel ist eine möglichst automatisierte Beurteilung der Bonität von Kunden. Die Basis dafür liefern die Datenbanken der Vergangenheit, aus denen man errechnen kann, welche Charakteristika von Kunden statistisch gesehen verstärkt zu Rückzahlungsausfällen oder -verzögerungen führen.

STANDARD: Wie verträgt sich Data-Mining mit Datenschutz?

Hudec: Interessant ist es, möglichst viele Informationen zu verknüpfen. Wenn man mit anonymisierten Daten arbeitet und nur gruppenspezifische, also statistische Aussagen macht, gibt es datenschutzrechtlich kein Problem. Wird auf Einzeldatenbasis gearbeitet, sieht die Sache allerdings anders aus. Grundsätzlich gilt das Gleiche wie für viele andere Entwicklungen: Man muss ethisch verantwortungsvoll damit umgehen. Um Kundengruppen zu analysieren, muss man nicht wissen, wie der einzelne Kunde heißt. Es zeichnen sich aber durchaus bedenkliche Tendenzen ab: In den USA werden seit 9/11 Data-Mining-Projekte etwa zur Analyse von Fluggästen durchgeführt, wo auf individueller Basis vielschichtige Verknüpfungen beispielsweise mit Melderegistern hergestellt werden. Auch hinsichtlich der Kreditbonität wird immer wieder die Frage gestellt, ob Banken eine "Blacklist" auf Personenbasis nutzen und untereinander austauschen dürfen. In den USA zumindest ist das definitiv so.

STANDARD: Ist Data-Mining auch für Klein- und Mittelbetriebe interessant?

Hudec: Für KMU, die über das Netz verkaufen, ist vor allem das Web-Mining von Bedeutung. Mit Web-Usage-Mining kann man zum Beispiel herausfinden, wie sich die Käufer von jenen Homepage- Besuchern unterscheiden, die nichts gekauft haben. Dadurch kann man das Markt- potenzial und den Kundenstock gezielt vergrößern. Das ist auch im EC3 eine der wichtigsten Anwendungen. Zur Zeit analysieren wir beispielsweise den Onlineshop der Firma Swarovski. Auch für die Tourismusplattform Tiscover machen wir immer wieder Web-Usage-Analysen. Ziel ist, die Seiten im Netz so zu gestalten, dass sie noch besser genutzt werden.

STANDARD: Können Firmen, die mit der nötigen Software ausgerüstet sind, selbst Data-Mining betreiben, oder sind sie auf Experten angewiesen?

Hudec: Experten sind jedenfalls unverzichtbar. Für die Beantwortung der diversen Fragestellungen gibt es heute eine Vielzahl konkurrieren- der Data-Mining-Algorithmen-Ansätze. Allein die Auswahl von adäquaten Algorithmen für eine bestimmte Fragestellung ist nicht ganz trivial. Bei großen Unternehmen gibt es deshalb auch immer öfter eigene Data-Mining-Spezialisten. KMU lagern diese Aufgabe sinnvollerweise aus. Auch wir bieten Kooperationen an. Bisher haben wir zwar vor allem mit großen Unternehmen gearbeitet, aber wir sind dabei, eine spezielle Software für KMU zu entwickeln, mit der sie ohne großes Fachwissen vorhandene Informationen besser nutzen können. Grundsätzlich geht es uns darum, einem Unternehmen nicht nur Ergebnisse zu präsentieren, sondern ihm auch den Weg dorthin zu zeigen. Schließlich soll es in Zukunft in der Lage sein, die Datenanalysen auch ohne EC3 durchzuführen. Denn Data-Mining ist kein einmaliges Projekt, es muss wiederholt angewendet werden, um tatsächlich zu wirken - der Markt ändert sich ja wirklich ständig. (DER STANDARD, Print-Ausgabe, 28. 6. 2004)

Share if you care.