Hadoop – Ein gelber Elefant elektrisiert das Silicon Valley

18. Dezember 2014, 12:23
8 Postings

Kostenlos vertriebene Open-Source-Software sorgt für Furore

Im Silicon Valley herrscht generell kein Mangel an hysterischen Übertreibungen. Doch selbst dort sind nur wenige Begriffe mit derart großen Erwartungen befrachtet wie das Zauberwort "Big Data". Allüberall klopfen Verkäufer an die Tore der großen Konzerne. Sie versprechen den Verantwortlichen Hilfe bei der Analyse der anschwellenden Flut an Informationen von Webseiten, Smartphones, sozialen Netzwerken und einer immer breiter werdenden Palette an mit Sensoren ausgestatten Geräten.

Ein traditioneller Einzelhändler etwa kann anhand der Kaufhistorie einer Kundin, anhand ihrer Einträge in sozialen Medien und an ihren Standorten erkennen, dass sie ein Kind erwartet. Sobald die werdende Mutter nun seinen Laden betritt, kann der Händler ihr ein Sonderangebot für Windeln aufs Smartphone schicken und sie möglicherweise zu einem Spontankauf verleiten.

Datenbank-Revolution

Beflügelt wird die Euphorie um das Geschäft mit den großen Datenmengen derzeit von einem kleinen, gelben Elefanten namens Hadoop. Das Plüschtier gehört dem Sohn eines Yahoo -Programmierers und stand Pate für eine Softwarereihe, die der Entwickler Mitte der 2000er Jahre auf den Weg brachte, um Ordnung in überbordende Datenmassen zu bringen.

Traditionelle Datenbanken wie die von Oracle speichern auf einzelnen Servern vordefinierte Informationen in Reihen und Spalten. Hadoop dagegen ist imstande, nicht kategorisierte Daten über ein Netz von tausenden von billigen Computern auszubreiten. Sich vervielfachende Eingabeströme lassen sich damit kostengünstiger und skalierbarer katalogisieren.

Kostenfrei verwendbar

Die Software, die unter einer Open-Source-Lizenz vertrieben wird, kann kostenlos genutzt, weitergegeben und abgewandelt werden. Und viele Anbieter, vom eisernen Datenbankverfechter Microsoft bis hin zu Analysedienstleistern wie Splunk, bedienen sich ihrer, um das Geschäft mit der digitalen Informationsflut über die Hochburg des Silicon Valley hinaus zu bugsieren.

Der Markt für Werkzeuge, um die ungeheuren Datenmengen in den Griff zu bekommen, könnte bis 2018 rund 41,5 Milliarden Dollar wert sein, schätzt der Marktforscher IDC. Investoren haben bereits mehr als 2 Milliarden Dollar in Unternehmen gesteckt, die auf Hadoop aufbauen. Dazu gehören Hortonworks, die in der vergangenen Woche an die Börse gegangen ist, deren Rivalen Cloudera und MapR Technologies sowie eine wachsende Liste winziger Jungunternehmen.

Anfängliche Schwierigkeiten

Konzerne, die Hadoop einem Feldversuch unterziehen wollten, haben jedoch frustriert aufgegeben. Die Bank of New York Mellon hatte die Software eingesetzt, um Fehlerstellen in ihrem Handelssystem ausfindig zu machen. Einigermaßen gut funktioniert hat dies allerdings nur in kleinem Maßstab. Versuchten jedoch viele Angestellte zur gleichen Zeit Zugriff auf das Programm zu nehmen, kamen sie nur noch im Schneckentempo voran. Außerdem hatten nur wenige der insgesamt 13.000 IT-Spezialisten der Bank die nötigen Fachkenntnisse, um Fehler in dem System zu beheben. David Gleason, damals bei dem Institut hauptverantwortlich für die Datenverarbeitung, betont, er habe Hadoop zwar befürwortet. Aber die Software sei damals noch "nicht für die Primetime reif gewesen".

Software reagiert nicht immer im gewünschten Tempo

"Das schmutzige kleine Geheimnis ist, dass eine beträchtliche Mehrheit an Big-Data-Projekten überhaupt keine nützlichen, umsetzbaren Ergebnisse hervorbringt", sagt Michael Walker, ein Partner von Rose Business Technologies, die Unternehmen dabei unterstützt, Systeme zur Verarbeitung großer Datenmengen aufzubauen. Gemäß einem jüngsten Bericht der Forschungsgruppe Gartner werden "bis Ende 2017 rund 60 Prozent der Big-Data-Vorhaben nicht über die Pilot- und Experimentierphase hinauskommen und fallen gelassen werden".

Wie sich gerade herausstellt, war wohl auch das Vertrauen in Hadoop größer als die Fähigkeit der Technologie, Big Data in den Massenmarkt zu hieven. Die Nachfrage nach der Software steigt zwar. Doch Anwender haben bereits herausgefunden, dass eine Technologie die entwickelt wurde, um das Web zu kartieren, möglicherweise nicht ausreicht, damit Unternehmen ihre Aufgaben im Zusammenhang mit der Erschließung enormer Informationsmengen erfüllen können, erklärt Nick Heudecker, bei Gartner in der Forschung für Informationsmanagement zuständig.

Herausforderungen

Es kann sehr arbeitsintensiv werden, wenn man Daten, die in bestehenden Depots aufgehoben werden, mit den Daten, die auf Hadoop gespeichert wurden, verknüpfen will. Außerdem reagiert die Software nicht immer im gewünschten Tempo. Bei einigen Aufgaben kann Hadoop zwar viel schneller vorankommen als traditionelle Datenbanken. Oftmals ist das Programm aber nicht schnell genug, um umgehend auf Anfragen zu reagieren oder eintrudelnde Informationen in Echtzeit zu bearbeiten. Es kann sich außerdem als Herausforderung erweisen, die Anforderungen an die Datensicherheit und Unternehmensrichtlinien zu erfüllen.

"Wagniskapitalgeber hatten sich von der Idee überzeugen lassen, dass Hadoop die traditionelle Datenbanktechnologie im Unternehmen ablösen wird", berichtet Heudecker. "Aber die Unternehmen sind nicht einfach so auf diesen Zug aufgesprungen."

Noch immer Lücken

Der Börsengang von Hortonworks trägt zwar seinen Teil dazu bei, das Profil der Technologie zu schärfen. Doch gleichzeitig bildet sich bereits eine neue Generation von Werkzeugen heraus, um immer noch klaffende Lücken zu schließen.

Hortonworks ist nicht nur wegen einer nicht vollständig entwickelten Technologie unter Druck geraten. Der Firma setzt auch zu, dass sie fest entschlossen ist, ihr Geschäft auf kostenloser Software aufzubauen. Die Einnahmen des Unternehmens stammen hauptsächlich daher, dass Hortonworks Unternehmen technisch unterstützt, die mit Hadoop herumexperimentieren.

"Es ist schwierig, kostenloses Zeug zu verkaufen"

Im November hatte Hortonworks berichtet, die Einnahmen des Unternehmens hätten in den ersten neun Monaten 2014 rund 33,4 Millionen Dollar erreicht. Damit ist die Firma weit hinter den 100 Millionen Dollar zurückgeblieben, die der Unternehmenschef Rob Bearden im März für das Gesamtjahr angepeilt hatte. Im Berichtszeitraum war außerdem ein Verlust von 87 Millionen Dollar angefallen. Damit hatte Hortonworks den Fehlbetrag des vorhergehenden Quartals fast verdoppelt. Der ausgeweitete Verlust "legt den neuen Hochwasserpegel für den Umfang an Betriebsverlusten fest, den öffentliche Investoren zu tolerieren bereit sind", kommentiert Sunil Dhaliwal, der Gründer von Amplify Partners.

Hortonworks legte den Preis für die erste Portion öffentlich angebotener Aktien um 34 Prozent unter dem Niveau fest, das Investoren während einer privaten Finanzierungsrunde im März gezahlt hatten. Einige Marktbeobachter fühlten sich deswegen in ihren Zweifeln über die Aussichten für ein Unternehmen bestärkt, das sich nur auf Hadoop stützt. Beim Börsengang am vergangenen Freitag sorgten die Investoren allerdings dafür, dass die Kapitalisierung von Hortonworks, ohne Berücksichtigung von Mitarbeitern zuerkannten Aktien, auf 1,1 Milliarden Dollar stieg.

"Es ist schwierig, kostenloses Zeug zu verkaufen", sagt John Schroeder, der Chef des Konkurrenten MapR. Auch wenn viele Startups aus dem Boden geschossen sind, um Open-Source-Software zu versilbern, wird generell nur eine börsennotierte Firma in diesem Bereich als erfolgreich angesehen. Dabei handelt es sich um Red Hat, die das Linux-Betriebssystem vertreibt und unterstützt. Und im Vergleich zu führenden Unternehmen, die wie Amazon oder VMWare Open-Source-Software um eigene Programme erweitern, schneide Red Hat auch wiederum nicht so glänzend ab, betont Peter Levine, ein Partner bei Andreessen Horowitz.

Börsengänge

Der Börsengang von Hortonworks "bestätigt sicher, dass Open Source ein unglaublich tragfähiges Geschäftsmodell ist", hielt Unternehmenschef Bearden am Freitag in einem Interview dagegen.

Seine Konkurrenten MapR und Cloudera bieten in Eigenregie entwickelte Erweiterungen zu Hadoop an, um die Software für Großunternehmen attraktiver zu machen. Cloudera, die 2008 den Hadoop-Market als Pionier erschlossen hatte, hatte bei einer Bewertung von rund 4,1 Milliarden Dollar mehr als 1 Milliarde Dollar bei den Anlegern eingesammelt.

MapR, das im darauf folgenden Jahr gegründet worden war, kam auf 174 Millionen Dollar. Sowohl Schroeder und Cloudera-Finanzvorstand Jim Frankola räumen jedoch Probleme dabei ein, der amerikanischen Unternehmenswelt Hadoop näher zu bringen. "Wir haben erfahren, was Hadoop gut kann und was Hadoop nicht gut kann", gibt Frankola zu.

Mittlerweile setzen Unternehmen alles daran, in die Bereiche vorzudringen, die Hadoop nicht sonderlich gut beherrscht. Dabei dreht es sich vor allem um Aufgaben, für die hereinströmende Daten in Echtzeit verarbeitet werden müssen. Das Heranziehen von Lokalisierungsdaten im Smartphone, um genau im richtigen Moment Lockangebote wie den Windelrabatt für die werdende Mutter anzubieten, wäre ein Beispiel.

Markt wird zunehmend chaotischer

Was Big-Data-Projekte in Unternehmen angeht, könnte sich Hadoop letztendlich als ein Pfeil in einem Köcher erweisen, der immer größer wird. Databricks, die von Wagniskapitalgebern mit 47 Millionen Dollar unterstützt wird, schlägt aus Spark Kapital. Die Open-Source-Software ist in der Lage, mit Echtzeitdaten geschickter als Hadoop zu verfahren. Altiscale mit 42 Millionen Dollar bietet Hadoop als Dienst an, der in der Cloud geliefert wird. Splice Machine, die 22 Million Dollar eingesammelt hat, fertigt ein Werkzeug, das Hadoop bei Anfragen wie eine traditionelle Datenbank behandelt. Andere Instrumente, darunter auch die jüngste Google -Ausgliederung Metanautix, zielen darauf ab, Hadoop ganz obsolet zu machen.

Die Hadoop-Anbieter reagieren auf die Angriffe mit Verbesserungen und Erweiterungen. Hortonworks sorgte federführend für eine Aktualisierung, bei der neben Hadoop auch andere Anwendungen laufen können. Cloudera und MapR haben die Software mit eigenen, für Unternehmen geeignete Funktionen wie etwa der automatischen Sicherung erweitert. MapR arbeitet an Lösungen, die eigens auf spezielle Branchen wie den Finanzdienstleistungssektor, das Gesundheitswesen oder die Telekommunikationsbranche zugeschnitten sind. Alle drei werden jedoch mit einem zunehmend chaotischen und sich schnell herausbildenden Markt zu kämpfen haben.

"Momentan gibt es da draußen eine ganze Buchstabensuppe an Technologien, was den Markt in vielerlei Hinsicht verwirrender macht", klagt T.M. Ravi, der Gründer von The Hive, einem Inkubator für Big-Data-Firmen. "Und am Schluss gibt es vielleicht Platz für eine eigenständige Firma – wenn überhaupt." (Elizabeth Dwoskin, WSJ.de/derstandard.at, 18.12.2014)

  • Die Software Hadoop sorgt für Furore
    foto: ap/pitarakis

    Die Software Hadoop sorgt für Furore

Share if you care.