Auf dem SQLPass Summit 2011 hat Microsoft Corporate Vice President Ted Kummert die Microsoft Roadmap und Strategie zu “Big Data” vorgestellt. Ein wichtiger Baustein in dieser Roadmap ist hierbei das Apache Projekt Hadoop. Doch was steckt hinter Big Data, Hadoop und der Ankündigung von Microsoft sich im Umfeld von Big Data zu engagieren.
Was versteht man unter Big Data?
Wie der Name “Big Data“ schon vermuten lässt, geht es in der Regel darum, große Datenmengen mit hohem Durchsatz zu verarbeiten, die klassische Datenbanken und auch entsprechende Analyse Werkzeuge nur sehr eingeschränkt verarbeiten können. Dies können z. B. Log Files, Images, Videos, Sensor Daten , Finanz oder auch Börsendaten sein. Um derartige große Datenmengen effizient verarbeiten zu können, wird bei Big Data auf den Ansatz einer Massiv Parallelen Architektur zugegriffen, die die Last auf z.B. mehrere 1000 Server verteilt.
Für Facebook und Yahoo gibt es im Zusammenhang mit „Big Data“ z. B. folgende beeindruckende Zahlenwerte, die ich dem Hadoop Wiki entnommen habe.
Und was ist Hadoop?
Das Apache Projekt Hadoop ist ein Framework zur parallelen Datenspeicherung und -verarbeitung sehr großer Datenmengen, die verteilt in Clustern von Servern „fehlertolerant“ im lokalen Filesystem gespeichert werden. Das Design von Hadoop ermöglicht Skalierungen von einem einzelnen Server bis zu mehreren tausend Servern. Eine umfangreiche Referenzenliste finden Sie HIER.
Das Projekt besteht primär aus den folgenden Unter-Projekten:
Weitere Details zu Hadoop finden Sie auf der Hadoop Projektseite HIER.
Was beinhaltet die Microsoft-Ankündigung?
Weiterführende Informationen finden Sie auch in dem White Paper HIER., der Webseite HIER. und der Original-Ankündigung Hier.
Welche Möglichkeiten ergeben sich aus der Ankündigung?
Mit diesem Ansatz ermöglicht Microsoft den Kunden, beide Welten zusammen zu führen - die Welt der „Big Data“ und der relationalen Welt mit dem SQL Server – und die Stärken aus beiden Welten für sich nutzbar zu machen. Die Vorteile sind u. a.:
Viel Spaß mit GROßEN Daten wünscht
FSeiwerth
Ein Bericht von der Hadoop World 2011, der Konferenz für Big Data: www.memonews.com/.../hadoop-world-conference2011-tag1