Say „Cheese“: Was mein erstes Selfie mit Big Data zu tun hat

Bildquelle: Pexels
Liebes Tagebuch,
schau mal, was ich gefunden habe: Mein allererstes Selfie, entstanden 2002! Wir waren auf dem Rückweg von unserem sonntäglichen Waldspaziergang. Damals musste man mich regelrecht dazu zwingen. Die Kamera war wohl eine raffinierte Strategie meiner Eltern, um mir unterwegs etwas Spannendes zu tun zu geben. Zumindest an diesem Tag hat das gut funktioniert – neben mir selbst kam noch eine Hummel, gefällte Baumstämme und der Hinterkopf meiner Schwester vor die Linse. So verzottelt, wie wir waren, wollte sie wohl partout nicht in die Kamera schauen.
So viel ist seitdem passiert! Um das einmal bildlich gegenüberzustellen, habe ich heute noch ein Selfie für dich gemacht:
Unabhängig davon, ob mir gut zwei Dekaden stehen: Über die Jahre habe ich ordentlich zugelegt. Genau genommen um das 59-fache, denn bei den Bildgrößen stehen den anfänglichen 40,2KB heute 2,3MB gegenüber.
Das ist nur ein winziges Beispiel dafür, wie Datenmengen über die Zeit anwachsen: Im Jahr 2025 wird das weltweite Datenaufkommen voraussichtlich bei 188 Zettabytes liegen. Könnte man das auf Blue-Rays packen, würde der Disk-Stapel mehr als 20-mal bis zum Mond reichen.1. Genauso schwer vorstellbar ist, wie viele Schätze in diesem Datenstapel verborgen liegen. Und damit landen wir bei einem Thema, an dem uns kein Weg vorbeiführt: Big Data.
Heute möchte ich mir ein grundlegendes Verständnis über dieses Thema verschaffen und die wichtigsten Begriffe kennen- und unterscheiden lernen.
Was versteht man unter Big Data?
Wie der Name sagt, dreht sich Big Data um große und komplexe Datenmengen mit dem Ziel, daraus Erkenntnisse und Mehrwerte zu gewinnen.2.
Ein solcher Mehrwert kann zum Beispiel vorausschauende Wartung sein, indem sich Maschinenausfälle datenbasiert vorhersagen lassen. Oder optimierte Fahrtrouten durch Stau- und Wetterprognosen. Auch mein Beruf, Wettbewerbsfähigkeit durch personalisierte Angebote zu steigern, basiert auf Big Data.3.
So verschieden die Gründe auch sind – kurz gesagt geht es immer darum, Gewinne zu steigern, Kosten einzusparen und Risiken zu minimieren. Und dafür müssen digitale Informationen massenhaft erhoben, verarbeitet und analysiert werden.
Das macht Big Data aus: Das 5-V-Modell
Das 5-V-Modell fasst die Eigenschaften von Big Data zusammen:3.
- Volume (Menge)
Das Datenvolumen gilt als Hauptmerkmal von Big Data und erfordert eine Infrastruktur, die Datenmassen speichern, verwalten und abrufen lässt. - Velocity (Geschwindigkeit)
Viele Geschäftsmodelle erfordern mittlerweile eine Reaktion in Echtzeit. Das bedeutet, dass nur Millisekunden bleiben, um Daten zu analysieren. - Variety (Vielfalt)
Wenn ich mir einen Datensatz vorstelle, denke ich in erster Linie an eine Excel-Tabelle. Doch ein großer Teil von Daten, wie etwa Fotos, Videos oder etwa Musik, lässt sich nicht so feinsäuberlich strukturieren und demnach verarbeiten wie etwa eine Teilnehmerliste. Big Data muss mit beiden Fällen umgehen können. - Veracity (Richtigkeit)
Qualität vor Quantität gilt auch bei Datenmassen. Neben fragwürdigen Quellen oder auch Voreingenommenheit reicht auch schon ein Tippfehler aus, um der Aussagefähigkeit von Analysen erheblich zu schaden. - Value (Wert)
Wenn die Einblicke in die Datenwelt noch so spannend sind – am Ende geht es darum, Wert zu schaffen, mitunter in Form von höherer Wettbewerbsfähigkeit und besserem Kundenservice.
Es gibt noch weitere „V’s“, die als Merkmal verwendet werden, doch obenstehend habe ich die gängigen zusammengefasst.
Warum Big Data? Anwendungsfälle im Überblick
Ohne Big Data wäre unsere Welt nicht so, wie wir sie kennen. Kaum ein Themenbereich kommt darum herum: Dass wir am einen Tag eine Online-Bestellung tätigen und am nächsten Tag die Lieferung eintrifft, geht nur, wenn Transportunternehmen ihre Routen optimal planen können. In der Medizin ermöglichen Datenmassen, Risikofaktoren für Krankheiten zu ermitteln und genauere Diagnosen zu stellen. Branchenübergreifend haben Unternehmen einen Wettbewerbsvorteil, wenn sie die Präferenzen ihrer Kunden kennen und darauf gezielt Marketingkampagnen abstimmen.4.
Des Weiteren ist Big Data essenzielle Grundlage für künstliche Intelligenz. Denn KI-Systeme sind darauf angewiesen, mit Informationen gefüttert zu werden. Kurz gesagt: Ohne Input kein Output.3.
Das Big Data 1×1: Diese Begriffe gehören dazu
Wie so oft in der IT-Welt ranken sich um Big Data Begrifflichkeiten, die höchstkompliziert klingen und sich nicht immer eindeutig voneinander abgrenzen lassen. Im Folgenden habe ich das gängige Vokabular für dich entwirrt:
Vorgänge rund um Big Data:2., 5.
- Big Data: Sammeln und Analysieren unstrukturierter Datenmassen aus Bild, Ton, Text, Videos usw., die sich nur mit spezialisierter Technologie verarbeiten lassen
- Business Intelligence (BI): Strukturieren der Daten, die von Big Data bezogen werden, um Muster zu erkennen
- Data Mining: Erkennen von Zusammenhängen als Teilbereich von BI, z.B. Produktvorlieben einer bestimmen Altersgruppe
- Data Visualization: Darstellen von Daten in einer Weise, die sich leicht verstehen und auswerten lässt
- Business Analytics: Ableiten von Verbesserungen durch Erkenntnisse der Datenanalyse
Wege, um Datenmassen zu speichern:6.
- Data Lake: Nimmt unstrukturierte Daten verschiedener Quellen auf und legt sie so, wie sie sind, ab.
- Data Warehouse: Wandelt Daten aus verschiedenen Quellen in eine Struktur um, die eine direkte Analyse ermöglicht.
Diese Liste ist mit Sicherheit noch nicht vollständig, doch für’s Erste hilft es mir, oft gehörte Begriffe besser einzuordnen.
FAZIT
Bevor ich für diesen Beitrag recherchiert habe, war Big Data für mich nicht viel mehr als ein Schlagwort. Nun weiß ich: Es wirkt sich auf die ein oder andere Weise auf jeden von uns aus. Ob du nun eine Kundenkarte hast, einen Social Media Auftritt oder eine Smart Watch – es ist fast unmöglich, keine Daten zu generieren. Jetzt habe ich einen guten Überblick, warum es Big Data braucht und was mit dazugehört. Letzteres gibt mir mehr als genug Anlass, um weiter in das Thema einzutauchen. Ohne allzu viel zu verraten steht fest: Es war garantiert nicht der der letzte Big Data Beitrag.
Quellen:
- https://www.verbraucherzentrale.de/wissen/digitale-welt/datenschutz/die-geschichte-von-big-data-54898
- https://blog.hubspot.de/sales/big-data
- https://www.sap.com/germany/products/technology-platform/what-is-big-data.html
- https://datascientest.com/de/big-data-definition-technologien-anwendungen-weiterbildung
- https://blog.hubspot.de/sales/business-intelligence
- https://www.bigdata-insider.de/was-ist-ein-data-lake-a-686778/