Untersuchung und Bewertung cloud-basierter Streaming-Technologien zur Echtzeit-Datenanalyse

Bok av Christian Voigtlander
Das Internet sorgt fr ein rasches Wachstum von verfgbaren Daten. Dem EMC/IDC Digital Universe" Report nach verdoppelt sich die Menge an Daten alle zwei Jahre. Es werden tglich eine Millionen Uber-Fahrten gebucht, monatlich 10 Milliarden Stunden Netflix-Videos konsumiert und jhrlich eine Trillion US-Dollar auf E-Commerce-Webseiten ausgegeben. Dabei spielt der Umgang mit diesen Daten eine groe Rolle fr den Erfolg dieser Unternehmen. Insbesondere die Echtzeit-Datenanalyse hilft den Unternehmen, Kundenwnsche schnellstmglich zu erkennen und diese auszuschpfen. Ein weiterer Faktor des immensen Datenwachstums sind Web 2.0 Plattformen. In diesem Bereich sind die Benutzer der treibende Faktor fr die stetig wachsende Datenflut dieser Plattformen, indem sie Beitrge verffentlichen, Fotos teilen und Videos streamen. Beispielsweise sammelt Twitter 8 Terabyte, Facebook 500 Terabyte und Google 20 Terabyte an benutzergenerierten Daten tglich. Inhalte sind nicht lnger statisch, sondern dynamisch. Diese Datenflut gilt es, zu kontrollieren. Unmittelbar nachdem Daten entstehen, haben sie den hchsten Wert. In der heutigen Zeit wird erwartet, Ergebnisse in schnellstmglicher Zeit bereitzustellen. Analytische Prozesse werden in Minuten, Sekunden oder Bruchteilen von Sekunden durchgefhrt, welche frher Monate, Tage oder Stunden gebraucht htten. Aufgrund dieser Evolution der stetig neu entstehenden Daten mssen Vernderungen in der Art und Weise, wie diese Daten empfangen, transportiert, verarbeitet und analysiert werden, stattfinden. Die Technologie, die Echtzeit-Datenanalysen durchfhrt, wird in der vorliegenden Arbeit genauer betrachtet.