Frank Int-VeenInnovation und Technologie

Big Data – von Jägern und Sammlern

Big Data revolutioniert die IT. Was steckt hinter Big Data und welchen Einfluss hat die Sammelleidenschaft auf unser Leben? Darum geht es in dieser Blog-Reihe.

Stellen Sie sich vor, Sie schlendern am Samstagnachmittag durch die City und das Smartphone meldet sich: „Hey, es ist 14:15 Uhr. Du hast seit fünf Stunden nichts mehr gegessen und müsstest eigentlich Hunger haben. An der nächsten Ecke rechts und dann noch 50 Meter weiter geradeaus ist auf der linken Seite eine Imbissbude. Sie hat heute Currywurst mit Pommes im Angebot. Das isst du doch so gerne!“

Zukunftsmusik? Absolut nicht. In Texas hat die Supermarktkette Target das Einkaufsverhalten seiner Kunden durchleuchtet und festgestellt, wann und wie sich das Einkaufsverhalten ändert. Beispielsweise tendieren schwangere Frauen zu mehr Bioprodukten und unparfümierten Körperpflegeartikeln. Dem Unternehmen ist es sogar möglich, aus verschiedenen Parametern herauszulesen, wie lange es noch bis zur Geburt dauert.

Echtzeitanalyse – Das Zauberwort in der modernen IT-Technik

Möglich werden solche Szenarien mit Produkten, wie sie beispielsweise HPE im Angebot hat: Mit dem Produkt Vertica kann HPE Daten nahezu in Echtzeit analysieren. Dazu brauchen die Informationen noch nicht einmal strukturiert vorzuliegen. Basis ist eine Hadoop-Datenbank, in der die Daten nicht wie in herkömmlichen Datenbanken spaltenweise, sondern zeilenweise abgefragt werden. Das eignet sich hervorragend für die Analyse großer Datenmengen und wird durch spezielle SQL Engines und ausgeklügelte Algorithmen unterstützt, die sich selbst optimieren und automatisiert Strukturen in den Daten erkennen.

Dadurch ist es beispielsweise Online-Händlern möglich, anhand des Konsumverhaltens der Kunden festzustellen, in welcher Lebensphase sich der Kunde befindet, ob eine Trennung vom Lebenspartner ansteht, ob der Kunde heiraten wird und ob er gesund ist.

Ein besonderes Augenmerk gilt dabei auch den Fitness Trackern. Sei es mittels einer App oder Online auf Webseiten. Bereitwillig werden persönliche Gesundheitsdaten freiwillig gespeichert, sodass sie überprüft, ausgewertet und vor allem weiterverarbeitet werden können.

Speichern macht glücklich – Die Datensammlung steigt stetig

Das Unternehmen Seagate hat eine Prognose aufgestellt, welches Datenvolumen sich im Netz ansammelt: Das Volumen personenbezogener Daten wird sich demnach von 3,5 Zettabyte im Jahre 2013 auf 40 Zettabyte im Jahre 2020 vervielfachen. Quelle: Heise/c‘t (ein Zettabyte sind eine Milliarde Terabyte).

Facebook hat nach eigener Auskunft bereits ein Datenvolumen von 300 Petabyte über seine Mitglieder gespeichert (ein Petabyte entspricht 1.000 Terabyte). Geht man von 1,7 Milliarden Nutzern aus, von denen 1,13 Milliarden aktive Nutzer sind (SMI Stand: Juli 2016), so macht dies rund 177 Megabyte pro Nutzer.

Facebook ist heute schon in der Lage, ein Charakterbild seiner Nutzer anzulegen. Hierfür analysiert Facebook Satzstellungen, die Nutzung bestimmter Wörter, die Zugehörigkeit zu Facebook-Gruppen, die Freundschaftsbeziehungen und die sozialen Angaben, die die Nutzer bei Facebook speichern.

Datenfusionierung – die Königsdisziplin

Durch die Fusionierung von Daten aus verschiedenen Quellen lässt sich ein nahezu perfektes Charakterbild eines Menschen generieren. Dazu zählt beispielsweise die Krankheitswahrscheinlichkeit, der Gesundheitszustand, die Gemütsverfassung, das Bildungsniveau, die Kreditwürdigkeit und vieles mehr.

Aus diesem Grund stellt „HPE Vertica“ eine Vielzahl an Konnektoren zu unterschiedlichen Datenpools, um Daten zu aggregieren und auszuwerten. Durch die Analyse von Diskussionen in den sozialen Netzwerken ist es Parteien beispielsweise möglich, schnell auf politische Meinungen und Situationen unmittelbar zu reagieren und die Ausrichtung ihres Wahlkampfs zu korrigieren. In Amerika sind die sozialen Netzwerke bereits ein fester Bestandteil des politischen Wahlkampfes.

Auch in der IT-Technik selbst kommt Big Data eine immer größere Bedeutung zu. Durch das optimale Auswerten von Log-Dateien ist es möglich, Störungen in Netzwerkinfrastrukturen zu analysieren, bevor überhaupt Fehler auftreten. So können die Unternehmen proaktiv anhand von Kenngrößen auf Probleme agieren, noch bevor sie aufgetreten sind.

Voraussetzung dafür sind kognitive Systeme, bei denen nicht die Programmlogik, sondern ein selbstständig lernender Computer die Probleme löst. Durch diese „künstliche Intelligenz“ kann beispielsweis auch ein User Helpdesk effizienter gestaltet und schrittweise automatisiert werden.

Auch in der Krebsdiagnostik wird Big Data intensiv genutzt. Patientendaten, die in großem Maße gesammelt werden, sowie die Auswertung von Medikamentierung und Erfolgsquoten ermöglichen es, bedeutende Erkenntnisse in der Behandlung und Früherkennung auch von seltenen Krebsarten zu erlangen.

Innovationen sollen unser Leben erleichtern. Big Data geht einen Schritt weiter und nimmt uns Entscheidungen ab oder versucht sogar, uns Lebenstipps zu geben, sei es für die Gesundheit, bei der Auswahl von Produkten oder im sozialen Umfeld. Ob wir wollen oder nicht, wir können uns der Sammelleidenschaft von Daten kaum mehr entziehen. Wir hinterlassen Spuren, die von Unternehmen heute ausgewertet werden und, wenn wir es möchten, unser Leben vereinfachen.

Im nächsten Blog-Beitrag geht es um „Big Data – Verstecken gilt nicht“. Dann beleuchte ich, woher die Daten kommen, die wir bewusst oder unbewusst hinterlassen.

 

Schlagwörter: ,