Gegenstand der Datenanalyse ist die Ermittlung statistischer Messgrößen aus empirisch gewonnenen Daten. Die dabei angewandten statistischen Verfahren lassen sich nach verschiedenen Gesichtspunkten einteilen.
Eine erste Differenzierung lässt sich danach treffen, ob eine Teilung (Partitionie-rung) der zu analysierenden Variablen vorgenommen wird oder nicht.
Bei der Interdependenz- oder Unabhängigkeitsanalyse geht es um die Klärung des Beziehungsgefüges zwischen gleichrangigen Variablen; bei der Dependenz- oder Abhängigkeitsanalyse handelt es sich dagegen um Verfahren, die mit Hilfe der Werte der unabhängigen Variable(n) Aussagen über die abhängige(n) Variable(n) treffen. Der Abhängigkeitsbegriff ist hier jedoch nur in einem formalen Sinne zu verstehen. Mit Hilfe von mathematisch-statistischen Verfahren können lediglich assoziative Beziehungen, nicht aber Kausalzusammenhänge (Kausalität) festgestellt werden.
Eine zweite Differenzierung führt zur Einordnung der Verfahren der Datenanalyse nach dem Skalenmveau der abhängigen und unabhängigen Variablen. Die Anwendungsbereiche von Regressionsanalyse und Diskriminanzanalyse können erweitert werden, wenn nominale Variablen durch Verwendung binärer Variablen wie metrische behandelt werden. Ordinale Variablen können (mit Informationsverlust) in nominale Variablen transformiert werden.
genzanalyse, die einfache Korrelationsanalyse sowie einfache Regressionsanalyse.
Die multivariaten Verjähren analysieren die gegenseitigen Beziehungen zwischen mehr als zwei Variablen. Zu diesen Analyseverfahren zählen u.a. die multiple Korrelations- und die multiple Regressionsanalyse, die kanonische Analyse, die Faktorenanalyse, die Clusteranalyse und die Diskriminanzanalyse. Zu den multivariaten Verfahren gehören weiterhin die Varianzanalyse und die Kontingenzanalyse, die mindestens zwei unabhängige Variablen berücksichtigen.
Eine Integration mehrerer Verfahren, unter simultaner Berücksichtigung der In-terdependenzen zwischen den Variablen bzw. Konstrukten ermöglicht die Kausalanalyse (LISREL).
In der Wirtschaftssoziologie: umfassende Bezeichnung für alle Schritte der Aufbereitung und Auswertung vorliegender Daten über gesellschaftliche Prozesse und Sachverhalte, die durch quantitative oder qualitative Methoden gewonnen wurden. Der Zugang zur gesellschaftlichen Wirklichkeit ist in der Datenanalyse stets vermittelt durch die besonderen Methoden der Erhebung von Daten.
Nach der Datenerhebung und Datenaufbereitung erfolgt die Auswertung der Daten durch Methoden der Datenanalyse. Als ein erstes Differenzierungskriterium kann dabei die Anzahl der untersuchten Variablen herangezogen werden. Entsprechend unterscheidet man uni-, bi- und multivariate Verfahren. Univariate Verfahren begnügen sich mit der Analyse einer Variablen (bzw. ihrer Ausprägungen) in bezug auf die Messelemente oder Untersuchungseinheiten (z.B. Personen). Sie eignen sich zur Bestimmung von Häufigkeitsverteilungen und zur Berechnung von Mittelwerten und Streuungsmassen. Bei einer bivariaten Analyse wird gleichzeitig die (Inter-)Dependenz zweier Variablen untersucht. Die Varianten reichen hier von der Kreuztabellierung bis hin zu Korrelationsanalysen oder (einfachen) Regressionsanalysen. Mit multivariaten Verfahren (multivariate Analyse) werden im allgemeinen drei oder mehr Variablen hinsichdich ihrer (Inter-) Dependenz analysiert. Liegt eine Trennung zwischen unabhängigen (erklärenden) und abhängigen (zu erklärenden) Variablen vor, so spricht man von einer (multivariaten) Dependenzanalyse. Wenn bei Problemstellungen die erklärenden Variablen nicht unabhängig voneinander sind, was in der Realität häufig vorkommt, würden für mehrere erklärende Variablen separat durchgeführte bivariate Dependenzanalysen zu verzerrten Ergebnissen führen. Berücksichtigt man auch noch das Skalenniveau der untersuchten Daten, so führt die Unterscheidung zwischen metrischen und nominalskalierten Variablen einerseits sowie abhängigen und unabhängigen andererseits zu vier Untergruppen der Dependenzanalyse (vgl. Abb.). Wird keine Trennung zwischen erklärenden und zu erklärenden Variablen vorgenommen, so spricht man von einer Interdependenzanalyse. Die Notwendigkeit einer multivariaten (simultanen) Vorgehensweise ergibt sich zwingend aus der Zielsetzung, die Beziehungsstruktur der Variablen untereinander zu untersuchen. Tritt im Rahmen der Interdependenzanalyse der Aspekt der Datenreduktion in den Vordergrund, so kann man die Verfahren danach unterscheiden, ob sie eine Reduktion des Variablenraumes, z.B. durch Faktorenanalyse, oder eine Reduktion des Objektraumes, z.B. durch Clusteranalyse, bezwecken. Steht hingegen der Aspekt der Datenanalyse im Vordergrund, so kommen Verfahren wie die kanonische Analyse als Verallgemeinerung der multiplen Korrelationsanalyse zur Anwendung. Literatur: Backhaus, KJErichson, B.IPlinke, W/ Weiber, R., Multivariate Analysemethoden, 6. Aufl., Berlin u.a. 1990. Berekovett, L./Eckert, W/ Ellenrieder, P., Marktforschung, 5. Aufl., Wiesbaden 1991. Hüttner, M., Informationen für Marketing-Entscheidungen, München 1979.
Vorhergehender Fachbegriff: Daten | Nächster Fachbegriff: Datenaufbereitung
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|
|