(auch: Data-Warehouse-Prozess) ist der Prozess der Nutzung eines Data Warehouse, der die folgenden Schritte umfasst:
(1) Datenbeschaffung, d.h. die Extraktion der relevanten Daten aus den Quellsystemen, Transformation und ggf. Bereinigung der Daten in einem Arbeitsbereich sowie Laden in das Data Warehouse (siehe auch ETL-Prozess),
(2) Datenhaltung, d.h. die langfristige Speicherung der Daten im Data Warehouse,
(3) Versorgung und Datenhaltung der für die Analyse notwendigen Datenbestände (siehe auch Data Mart),
(4) Datenauswertung durch Analyse der Daten im Data Warehouse bzw. einzelnen Data Marts und Versorgung nachgelagerter Anwendungssysteme.
Das Sammeln und Speichern ungleichartiger Daten aus allen Bereichen eines Unternehmens und die Anpassung an bestimmte Strukturen, die die einst nicht verknüpfbaren Informationen zueinander kompatibel machen.
Die Datenflut hat mittlerweile auch die kleinsten Unternehmen erreicht. In den Computersystemen erzeugen vielfältige Programme die unterschiedlichsten Daten, die untereinander jedoch in keinerlei Beziehung gestellt werden können.
Durch ein Data-Warehouse werden die bislang im Unternehmen brach liegenden Mengen von Daten und Informationen in entscheidungsrelevantes und rentables Wissen umgewandelt. Dies geschieht, indem die Daten in diesem zentralen Datenlager gesammelt, geordnet, strukturiert, die wichtigen Informationen herausgefiltert und diese zu unternehmensrelevantem Wissen angereichert werden, so dass sie eine Wissensgrundlage bilden, auf der sich gesicherte strategische Entscheidungen fällen lassen.
Zu diesem Data-Warehouse gehört als Basis eine Datenbank mit entscheidungsrelevanten Informationen über die einzelnen Unternehmensbereiche, die aus operativen Datenbanken und externen Datenquellen entsprechend des internen Informationsbedarfs herausgefiltert werden.
Für die Arbeit mit einem Data-Warehouse müssen zunächst zwei Probleme überwunden werden:
* In einem Unternehmen befinden sich viele kleinere und größere Datenbanken, zum Teil auch an unterschiedlichen Orten.
* Diese Daten liegen in den unterschiedlichsten Formen vor, bspw. als Texte, Tabellenkalkulationen oder auch als Zettel auf den Schreibtischen der Mitarbeiter.
Zunächst werden die Inhalte der verschiedenen Quellen zusammengeführt. Dann müssen sie konvertiert werden, damit sie verknüpft werden können bzw. zueinander kompatibel sind. Im nächsten Schritt wird untersucht, in wieweit sich Datenlücken ergeben. Hierfür werden gezielt extern eruierte Daten dem Bestand hinzugefügt. Schließlich muss eine Form gefunden werden, die es dem Anwender ermöglicht, aus den vorhandenen Daten seine relevanten Informationen zu erhalten. Auch entscheidet die Qualität der Daten darüber, ob der Bestand sinnvoll genutzt werden kann. Deshalb ist die Datenbereinigung und -qualifizierung eine wichtige Vorarbeit.
Damit diese Qualität erhalten bleibt, müssen die Inhalte eines Data-Warehouse laufend auf aktuellem Stand gehalten werden.
Datenbestand des Unternehmens, aus dem man sich im Sinne eines Warenhauses für vielfältige Auswertungen bedienen kann. Data-Warehouse stellt einerseits zunächst zwar nur ein Element der betriebswirtschaftlichen Grundrechnung dar, andererseits sind in einem solchen Warehouse auch Daten enthalten, die üblicherweise nicht in der Grundrechnung im engen Sinne gehalten werden (z.B. Reklamationsquoten). Um umfangreiche Warehouses bzw. Datenbestände überhaupt „zugreifbar“ zu halten, werden in der Praxis sog. Marts, d.h. abteilungs- bzw. anwenderspezifische Teilmengen, ausgegliedert und bereitgehalten. Auf diese Weise entsteht faktisch eine Nähe zur Sonderrechnung. Der Nutzen besteht vor allem in der Vielfalt der möglichen Auswertungen, bedingt aber auch eine strukturierte und zielorientierte Datenerfassung.
Siehe auch: Datenbanken
Vorhergehender Fachbegriff: Data Warehouse | Nächster Fachbegriff: Data-Base-Marketing
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|
|