Organisationen analysieren Daten, um bessere Entscheidungen zu treffen. Doch wo liegen eigentlich all die „großen Daten“, die dafür systematisch ausgewertet und analysiert werden? Genau hier kommt das Data Warehouse ins Spiel. Wir erklären diesen Begriff in unserer Serie #ExplainIT:
Data Warehouse – was ist das?
Big Data sowie das darauf aufbauende Business Intelligence oder weitergehend Business Analytics sind alles Begriffe, die wir in unserer Reihe #ExplainIT bereits erklärt haben und die den Umgang mit großen Datenmengen betreffen. Diese müssen irgendwo “liegen”. Data Warehouse ist in diesem Sinne wörtlich ein Warenhaus für Daten, also ein Datenlager. Hinter dem Begriff verbirgt sich eine für Analysezwecke optimierte zentrale Datenbank, die die Daten einer Organisation aus mehreren, oft unterschiedlichen Quellen zusammenführt.
Eingeführt wurde der Begriff Mitte der 80er Jahre ursprünglich als „Information Warehouse“ durch die Firma IBM. Der damalige IBM-Ingenieur Barry Devlin veröffentlichte 1988 einen Fachartikel, in dem das erste Mal von Data Warehouse die Rede war. Obwohl es keine einheitliche Definition gibt, umfasst das darauf basierende heutige Verständnis folgende Eigenschaften:
- Daten werden aus unterschiedlichen Quellen kopiert und aufbereitet. Dadurch entsteht der Inhalt des Data Warehouse.
- Die Ermöglichung einer globalen Sicht auf unterschiedliche und verteilte Daten. Das Data Warehouse konsolidiert diese Daten aus verschiedenen Datenquellen zu einem konsistenten Datenbestand.
- Relevante Kennzahlen werden zusammengelegt und als Basis für Analysen genutzt.
- Anwendungsspezifische Auszüge aus dem Datenbestand werden erstellt.
Wie funktioniert ein Data Warehouse?
Zwei Leitgedanken liegen der Erstellung eines Data Warehouse zugrunde. Zum einen werden Daten integriert und einheitlich strukturiert, um eine übergreifende Auswertung zu ermöglichen. Zum anderen werden Daten des operativen Geschäfts von anderen Daten, zum Beispiel des Controllings oder des Berichtswesens, separiert.
Das sogenannte Data Warehousing besteht aus vier Teilprozessen:
- Datenbeschaffung: die Sammlung und Extraktion der Daten aus unterschiedlichen Datenquellen.
- Datenhaltung: die Speicherung und Langzeitarchivierung von Daten. Das langfristige Vorhalten der Daten im Data Warehouse ermöglicht Langzeit-Vergleichsanalyse und eine verlässliche Planungsgrundlage für das Geschäft.
- Datenversorgung: die Versorgung von nachgelagerten Systemen mit den benötigten Daten.
- Datenauswertung: die Analyse und Auswertung der Datenbestände.
Ein zentraler Bestandteil eines Data Warehouse ist das Extrahieren, Transformieren und Laden von Rohdaten (kurz: ETL). Die ETL-Prozesse sind dafür verantwortlich, dass Rohdaten zunächst aus unterschiedlichen Quellen extrahiert, dann im Zuge der Transformation bereinigt und vereinheitlicht werden. Anschließend werden die Daten im Zuge des Ladens im Data Warehouse abgelegt.
Wo wird ein Data Warehouse angewendet?
Hauptsächlich kommt das Data Warehouse im Unternehmensumfeld zum Einsatz. In Verbindung mit Business Analytics kann man verborgene Zusammenhänge zwischen Daten ermitteln und umfassende Informationen zu Geschäftsobjekten und ihre Zusammenhänge bereitstellen. Durch die schnelle und flexible Verfügbarkeit von Berichten, Statistiken und Kennzahlen können zum Beispiel Angebot-Nachfrage-Beziehungen ausgewertet werden.
Im Bereich des Marketings ist das Data Warehouse von großer Bedeutung. Hier spielen Analysen der Daten hinsichtlich Pflege und Aufbau von Kundenbeziehungen eine wichtige Rolle. Genaue Analysen der Marktsituation helfen passgenaue Marketingformate für Kundinnen und Kunden zu erstellen. Zielgruppen können so separat angesprochen werden. Auch sind Unternehmen somit in der Lage auf kurzfristige Kundenbedürfnisse und Trends zu reagieren.
Fluggesellschaften profitieren ebenfalls von Data Warehouses und den verknüpften Daten. Durch die gesammelten und aufbereiteten Daten können die Gesellschaften Wartezeiten und Ausfallwahrscheinlichkeiten besser planen und so Verspätungen im Flugverkehr reduzieren. Durch die Analyse der Flugstrecken können ebenfalls unrentabel Strecken identifiziert werden. Auch kann die Analyse der verfügbaren Daten den Kerosinverbrauch von Strecke und Flugzeugtyp optimieren.
Kommentare (0)
Schreiben Sie doch den ersten Kommentar zu diesem Thema.