Frank PientkaInnovation und Technologie

Big Data-Zeitalter – Ein Blick aus der Cloud zurück in das relationale Zeitalter

Wie ein Donnerschlag schlug 2005 die Veröffentlichung von Michael Stonebraker ein: „One Size Fits All: An Idea Whose Time Has Come and Gone“. Immerhin gehört er als Professor zu den renommiertesten Forschern und Gründern in der Datenbankszene.

Letztlich schrieb er einen Abschiedsbrief an die bis dahin omnipräsenten und auf der Höhe ihres Zenites stehenden relationalen Datenbankprodukte. Weitere Rückschläge für die Hersteller dieser Produkte kamen kurz danach von den beiden damals schon sehr großen Internet-Firmen Amazon und Google. Da diese Unternehmen als erstes an die physikalischen und architekturellen Grenzen der relationalen Datenbanken stießen, mussten sie eigne Systeme entwerfen, die effizienter, skalierbarer und ausfallsicher mit weltweit verteilten Daten umgehen konnten, als es mit den damals bestehenden Produkten möglich war. Ab diesem Zeitpunkt fing man auch an von Big Data und NoSQL-Systemen zu sprechen.

Durch die Veröffentlichung von wissenschaftlichen Papieren zu Google MapReduce und Amazon Dynamo war es möglich, diese nachzubauen und als Open Source-Produkte Apache Hadoop und Apache HBase allen zugänglich zu machen. Dynamo wurde nicht als Produkt, sondern als erster Amazon Web Services Simple Storage Service (S3) zur Verfügung gestellt. Später sind noch viele weitere Nachfolgeprodukte und Alternativprodukte in diesem NoSQL-Bereich entstanden, um die Anforderungen von Big Data-Systeme erfüllen zu können. Bis heute stellen solche Systeme die Basis für die von Google, Amazon, IBM und Microsoft angebotenen Cloud-IaaS- und PaaS-Dienste dar.

Es ist immer schwieriger, die Anzahl der Produkte und ihre Unterschiede zu überblicken. Um die besonders erfolgreichen Open Source-Produkte haben sich inzwischen auch kommerzielle Firmen gestellt, die dafür Support anbieten und die Weiterentwicklung vorantreiben. Immerhin werden inzwischen auch SQL-artige Abfragesprachen und Konnektoren zu relationale Datenbanken angeboten, um möglichst einfach eine Brücke zwischen der neuen und der alten Welt zu schlagen.

Diese NoSQL-Systeme sind auch typische Beispiele wie für das Internet heute eigene Systeme entwickelt werden. Diese werden von vornherein auf Open Source-Basis zur Verfügung gestellt und vermeiden eine Produktmonopolstellung. Stattdessen konzentrieren sie sich auf die Anwendung von Diensten in der Cloud.

„Wer zu spät kommt, den bestraft das Leben“ war nicht nur die Botschaft von Glasnost und Perestroika, sondern dies gilt ganz besonders für die Innovations- und Disruptionskraft durch das Internet. Da die Internet-Konzerne eben nicht ihr Geld mit Software-Lizenzen verdienen, ist IT und Big Data für sie Mittel zum Zweck.

Doch auch für Cloud-Späteinsteiger stehen diese Produkte und Services für kleines Geld flexibel zur Verfügung. Dabei muss man noch nicht einmal die dazu gehörigen wissenschaftlichen Grundlagen-Papiere gelesen haben oder sich um die Konfiguration oder Installation kümmern. Trotz allem sollte man sich mit den Grundlagen beschäftigen, um den Paradigmenwechsel besser zu verstehen und die neuen Möglichkeiten besser nutzen zu können.

Bei den Einsatzgebieten von Big Data und maschinellem Lernen stehen wir auch nach über einem Jahrzehnt noch am Anfang. Es ist ein guter Zeitpunkt, um sich mit diesen neuartigen Systemen zu beschäftigen und sie für neue Anwendungsfälle und Geschäftsmodelle zu nutzen. So sind mit dem Internet-Zeitalter viele traditionelle Systeme an ihre Grenzen gekommen. Es bleibt spannend, was davon in die neue Welt hinüber gerettet werden kann.

Schlagwörter: ,