Formal ausgedrückt ist eine Datenmatrix ein rechteckiges (zweidimensionales) Schema, das aus Zeilen und Spalten zur Aufnahme von Daten besteht.
Die Datenmatrix besteht aus den Zeilen I = 1,2, ..., n, den Spalten j = 1, 2, ..., m, und den Elementen (Daten) xij. Üblicherweise werden die Objekte zeilenweise angeordnet, die einzelnen Variablen (Merkmale) spaltenweise .
Die Darstellung von Datenmaterial in Matrixform stellt l. d. R. einen ersten systematisierenden Schritt der Analyse dar (Datenanalyse). Werden Merkmale für verschiedene Objekte zu unterschiedlichen Zeiten er-fasst, so können diese in Form eines Datenkubus dargestellt werden. Der Datenkubus ist ein dreidimensionales Gebilde; er ist als Aufeinanderschichtung von Matrizen vorstellbar, wobei jede Schicht Daten einer anderen Periode oder eines anderen Zeitpunkts enthält. Werden Daten zu einem Zeitpunkt erhoben und ausgewertet, spricht man von Querschnittsanalyse; erfolgen mehrere Messungen hintereinander zu verschiedenen Zeitpunkten, handelt es sich um eine Längsschnittanalyse.
In der Wirtschaftssoziologie: Tabelle mit N x K Informationen (N = Anzahl der Untersuchungseinheiten, K = Anzahl der Variablen), die Ausgangspunkt und Gegenstand der statistischen Analyse ist.
Werden an n Objekten (statistischen Einheiten, Merkmalsträgern) die Ausprägungen von jeweils p Variablen (Merkmalen) Xj (j = 1,2, ..., p) beobachtet und bezeichnet Xij die Ausprägung der Variablen Xj am i-ten Objekt, so lassen sich die Ausgangsdaten in einer Matrix, der sog. Datenmatrix, zusammenstellen. Die am i-ten Objekt beobachteten Variablenausprägungen (x(, xi2, ..., Xip) bezeichnet man oft als i-ten Datensatz und die Gesamtheit der n Datensätze als Datei. Besondere Schwierigkeiten bei der Analyse können entstehen, wenn die Datenmatrix Variablen (Merkmale) unterschiedlicher Skalenniveaus (Skalen) enthält. Ist die Datenmatrix unvollständig, so können die fehlenden Werte (missing values) z.B. durch geeignete Schätzwerte ersetzt werden. Dem Begriff der Datenmatrix kommt deshalb besondere Bedeutung zu, weil sie den Ausgangspunkt einer jeden multivariaten Analyse darstellt. Literatur: Hartung, J./Elpeit, B., Multivariate Statistik, 3. Aufl., München, Wien 1989. Krzanow- ski, W., Principles of Multivariate Analysis, Oxford 1988.
Datenanalyse
Siehe Matrix
Vorhergehender Fachbegriff: Datenmanipulationssprache | Nächster Fachbegriff: Datenmigration
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|
|