Data Scientist: "Der Großteil der Daten ist Müll"

    5. Mai 2018, 17:00
    70 Postings

    Seine Aufgabe: Aus einer Masse an Daten Informationen zu gewinnen. Oft verlaufe die Suche länger ergebnislos, sagt ein Data-Scientist, mit dem wir gesprochen haben

    "Jeder von uns erzeugt abertausende Daten pro Tag – ob als Autofahrer mit dem Navi oder als Konsument beim Einkaufen, ob mit dem Smartphone oder der Kreditkarte. Die Aufgabe von uns Data-Scientists ist es, aus dieser unglaublichen Fülle sinnvolle Informationen herauszufiltern. Dafür spielen wir sehr viel mit Daten herum, drehen sie, wenden sie, werten sie aus – um herauszufinden, wie man damit ein Produkt verbessert, die Ansprache der Kunden oder neue Erkenntnisse für die Wartung hervorbringt und so schließlich Zeit und damit Geld sparen kann.

    Ein gutes Beispiel für den Nutzen von Data-Science liefern die Wiener Linien: Sie sammeln beinahe minutiös verschiedene Informationen über die Straßenbahnen – messen die Temperatur der Bremsen ebenso wie den Neigungswinkel der Führerkabine. Anhand der Ergebnisse wird schließlich versucht, zu prognostizieren, wann die Bahn kaputtgeht, damit man rechtzeitig ein Wartungsteam hinschicken, so die Stehzeiten minimieren und letztendlich effizienter sein kann.

    Data-Science wird aber noch in vielen anderen Gebieten angewendet, es ist ein sehr breites Feld. Der Online-Versandhändler Amazon sieht sich beispielsweise an, was Kunden gekauft haben, um sie noch zielgenauer anzusprechen. Jeder kennt den Hinweis: "Kunden, die diesen Artikel gekauft haben, kauften auch ..." Dahinter steckt Data-Science.

    Eine Querschnittsmaterie

    Ein mathematisches Verständnis, um gewisse Trends zu erkennen, ist Grundvoraussetzung für den Beruf. Im Grunde genommen ist er jedoch eine Querschnittsmaterie. Man braucht neben Analysefähigkeiten auch Fachexpertise, Programmierkenntnisse, und am allerwichtigsten ist Kommunikationsstärke.

    Denn die besten Ergebnisse nutzen nichts, wenn ich sie nicht visualisieren und verständlich weitergeben kann. Mit einem bloßen Excel-Sheet kann niemand etwas anfangen. Die Geschäftsführung muss wissen, was die Zahlen sagen.

    Die Erwartungen an Data-Scientists sind inzwischen sehr hoch. Jeder Geschäftsführer scheint zu glauben, dass er damit das Zauberrezept findet.

    Man braucht viel Geduld

    Das Problem: Data-Science ist keine genaue Wissenschaft, sondern immer nur eine Annäherung. Ich schaue mir sehr viele Daten an, und der Großteil ist kompletter Müll, komplett ergebnislos. Es geht also sehr viel Zeit verloren, ohne Resultat. Da braucht man in der Geschäftsführung schon sehr viel Geduld, und gerade in Österreich sind viele Geschäftsführer nicht die geduldigsten.

    Typischerweise führt der Weg in den Job über ein IT-Studium. Österreichische Universitäten und Fachhochschulen bieten ebenfalls schon entsprechende Spezialisierungen und Aufbauprogramme an. Es gibt mittlerweile auch Fernstudien. Die waren mir allerdings zu langwierig, deshalb habe ich in den letzten zwei Jahren verschiedene Lehrgänge absolviert.

    Ich bin also nicht der klassische Data-Scientist, sondern ein Sonderfall. Ich habe Publizistik studiert, war Pressesprecher und habe zuvor 15 Jahre lang im Journalismus gearbeitet.

    Für Quereinsteiger öffnen

    Die meisten Stellenausschreibungen richten sich nicht an Quereinsteiger wie mich, sondern an Mathematik- und Informatikabsolventen. Es ist so wie bei vielen Jobs: Die Firmen suchen idealerweise 23-Jährige mit einem akademischen Abschluss und sieben Jahren Auslandserfahrung, die fünf Sprachen sprechen. Und den Job am besten für 1700 Euro brutto machen. Das spielt es nicht.

    Die ersten akademischen Programme werden erst in ein bis zwei Jahren abgeschlossen sein und Absolventen bringen. Man ist also auf Quereinsteiger angewiesen.

    Sich zu öffnen und nicht nur an der Technischen Universität nach Mitarbeitern zu suchen wäre keine blöde Idee. Zumal die Firmen sich auch nicht so richtig darüber im Klaren zu sein scheinen, was genau sie eigentlich wollen oder suchen. In den Stelleninseraten wird alles Mögliche – zum Beispiel Business-Intelligence und Datenbankexpertise – mit Data-Science vermischt.

    Jeden Tag etwas Neues

    Was ich an meinem Beruf mag, ist, dass ich jeden Tag etwas Neues lerne. Man muss unglaublich wissbegierig sein, weil sich gerade in diesem Feld unglaublich viel tut. Es gibt tagtäglich neue Funktionen, Algorithmen.

    Ein Nachteil ist vielleicht, dass ich jetzt mehr am Computer sitze als in meinem früheren Job. Da man die Datenanalysen ja aber nicht zum Selbstzweck macht, bin ich auch viel im Haus unterwegs und führe Gespräche mit den Fachabteilungen.

    Was die Zukunftsträchtigkeit dieses Berufs angeht, bin ich zuversichtlich. Künstliche Intelligenz wird in Zukunft sicherlich viele Tätigkeiten ersetzen – deskriptive Statistiken können Computer beispielsweise viel besser, viel schneller und exakter erstellen als der Mensch. Ich habe dennoch keine Angst, in den nächsten Jahren automatisiert zu werden. Denn sobald es darum geht, Ergebnisse zu kommunizieren, kann die künstliche Intelligenz nicht mithalten." (Jobgespräch: Lisa Breit, 5.5.2018)

    Schwerpunkt "Zukunft der Arbeit":
    Werden Roboter unsere Jobs übernehmen? Falls ja, was macht das mit unserer Gesellschaft? Welche sozialen Folgen haben die tiefgreifenden Veränderungen der Arbeitswelt, die gerade erst begonnen haben? Und welche neuen Chancen eröffnet der technologische Arbeitswandel? Wir finden das Thema "Zukunft der Arbeit" so wichtig, dass wir ihm diesen Schwerpunkt widmen. In den kommenden Tagen finden Sie auf https://derStandard.at/Die-Zukunft-der-Arbeit eine Serie von Artikeln: Die STANDARD-Redaktion hat Forscherinnen und Forscher befragt, ist dorthin gefahren, wo die neue Arbeitswelt bereits zu spüren ist, und macht sich in Essays Gedanken – alles handgefertigt, natürlich.

    • "Ich schaue mir sehr viele Daten an, und der Großteil ist kompletter Müll, komplett ergebnislos. Es geht also sehr viel Zeit verloren, ohne Resultat", sagt ein Data Scientist, mit dem DER STANDARD gesprochen hat.
      illustration: simon klausner

      "Ich schaue mir sehr viele Daten an, und der Großteil ist kompletter Müll, komplett ergebnislos. Es geht also sehr viel Zeit verloren, ohne Resultat", sagt ein Data Scientist, mit dem DER STANDARD gesprochen hat.

    Share if you care.