#explainIT: Big Data erklärt

24. August 2020
Ein Beitrag von Dr. Stefan Döring

Forschung in der Medizin, Verbrechensbekämpfung oder Pop-ups mit personalisierter Werbung. Für all das und mehr benötigen wir Big Data. Doch was steckt hinter dem Begriff? Ein neuer Beitrag unserer Serie #explainIT.

Big Data – Was ist das?

Big Data beschreibt große, unstrukturierte, komplexe Datenmengen. Im Deutschen spricht man auch von Massendaten. Gerade die zunehmende Digitalisierung, die massive Internetnutzung in Kombination mit der stetig wachsenden Anzahl an unterschiedlichen Diensten verursacht ein unvorstellbares Datenaufkommen, dass nicht mehr manuell verarbeitet werden kann.

In diesen Datenmengen schlummert ein enormes Potenzial – für Wirtschaft aber auch Forschung und Wissenschaft. In unverarbeiteter Form sind sie allerdings nutzlos. Big Data hat sich daher auch hierzulande als Begriff für digitale Technologien etabliert, die das Sammeln und Auswerten solcher Daten ermöglichen.

Der Amerikaner Doug Laney prägte die heutige Definition von Big Data in seinem 3-V-Modell. Er skizziert 3 Dimensionen:

  • Volume (Masse)
    Die Daten stammen aus einer Vielzahl von Quellen, wie unter anderem geschäftlichen Transaktionen, intelligenten Geräten (IoT) und Social Media.
  • Velocity (Geschwindigkeit)
    Die Datenströme müssen schnell verarbeitet werden. Anwendungen, wie zum Beispiel das Einlesen von Personalausweisen funktionieren nur, wenn die riesigen Mengen an Daten nahezu in Echtzeit verarbeitet werden.
  • Variety (Vielfalt)
    Die Daten gibt es in unterschiedlichsten Formaten. Dazu zählen strukturierte, numerische Daten aus Datenbanken, aber auch unstrukturierte Texte, E-Mails und Börsenticker.

In jüngster Zeit wurde die Definition um Value (Daten liefern Mehrwert) und Validity (Daten haben eine nutzbare Qualität) ergänzt.

Industrie 4.0, Verbrechensbekämpfung oder Medizin: Big Data ist vielseitig einsetzbar

Laut einer Studie des Bitkom e.V. steht Big Data für sechs von zehn Unternehmen bei zukunftsorientierten Technologien an wichtigster Stelle. Das macht das Potenzial nochmals deutlich.
Eine Statistik über die Nutzung von digitalen Technologien in Unternehmen
Welche digitalen Technologien werden von Unternehmen genutzt?, Quelle: Bitkom (2018)
Big Data kann in vielen verschiedenen Bereichen angewendet werden. So ist es eine Voraussetzung für die Industrie 4.0 und wird oft mit Cloud Computing verbunden. Doch nicht nur in diesem Gebiet werden Massendaten benötigt.

Der Staat setzt Big Data unter anderem im Bereich der Verbrechensbekämpfung ein. In München kommt beispielsweise seit 2014 das Big-Data-System „PRECOPS“ zum Einsatz. Das System versucht unter anderem anhand vorhandener Daten vergangener Kriminalitätsmuster vorherzusagen, wo ein nächster Einbruch stattfindet.

Auch in der Medizinforschung können Big Data Analysen helfen. In Sekunden kann ermittelt werden, ob eine Chemotherapie bei Erkrankten Heilung oder nur unnötiges Leiden verursacht. Darüber hinaus können Zusammenhänge in anonymisierten Patientendaten neuer Behandlungsansätze identifiziert werden. So wird derzeit auch die Forschung an einem Corona-Medikament betrieben.

Einen Einblick in das Thema Big Data bietet das Video der explainity GmbH:

Herausforderungen und Risiken von Big Data

Die Herausforderungen im Bereich Big Data sind zuerst die Speicherung, Übertragung, Verteilung und Bereitstellung der großen Datenmengen. Für die Datenanalyse braucht es dann geeignete Algorithmen, die auch mit großen und sich ständig ändernden oder weiter zunehmenden Datenvolumina klarkommen.

Die Auswertung von Big Data birgt aber auch einige Risiken. So ist nicht immer klar, aus welchen unterschiedlichen und eventuell unsicheren Quellen die Daten stammen und welche Qualität sie haben. Die Folge kann sein, dass deren Analyse zu falschen Ergebnissen führt. Analysen sind daher immer kritisch zu hinterfragen.

Auch soziale Medien, Smartphones, Smart Homes und viele weitere vernetzte Geräte und Plattformen sind Quellen für Big Data. Sie bilden das Kommunikations-, Konsum- oder Surfverhalten der Nutzenden ab. Deshalb kommt es beim Thema Big Data häufig zu Konflikten zwischen dem Wunsch, die Daten zu nutzen und dem Persönlichkeitsrecht der Anwendenden. Durch die Anonymisierung von Daten kann der Konflikt gelöst werden. Es ist dennoch zwingend notwendig, Vorkehrungen gegen Datendiebstahl zu treffen.

Das häufigste Problem ist aber, dass trotz vorhandener Daten, ausgeklügelter Auswertungstechniken und damit potenzieller Antworten, es an den richtigen Fragestellungen mangelt. Welche Zusammenhänge in den Daten bestehen und welche Probleme damit gelöst werden könnten, übersteigt oft das menschliche Vorstellungsvermögen.

Kommentare (0)


Schreiben Sie doch den ersten Kommentar zu diesem Thema.

Kommentar absenden

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Weitere Beiträge

Feedback zum Beitrag:
1 Bewertungen mit 5 von 5 Sternen
Dr. Stefan Döring
Ein Beitrag von:
Dr. Stefan Döring
Mareike Rupertus -
Co-Autoren­schaft:
Mareike Rupertus