Mit Hilfe der Kontingenzanalyse ist es möglich, die Abhängigkeit bzw. Unabhängigkeit von zwei oder mehreren nominalskalierten Variablen zu untersuchen (Skalenniveau). Die Unterscheidung der Variablen in abhängige und unabhängige ist lediglich für die Interpretation der Ergebnisse, nicht jedoch für die Analyse selbst von Bedeutung (vgl. Hammann/Erichson, 2000, S. 322).
Eine Fragestellung der Kontingenzanalyse ist z.B. die Untersuchung einer möglichen Abhängigkeit der Wahl zwischen den Marken x und y vom Geschlecht des Käufers. Die Nullhypothese postuliert in diesem Fall Unabhängigkeit vom Geschlecht bei der Wahl von x oder y die Alternativhypothese dagegen Abhängigkeit vom Geschlecht.
Zur Feststellung einer möglichen Abhängigkeit werden zunächst eine Nullhypothese und eine Alternativhypothese gebildet. Die erste postuliert Unabhängigkeit der Merkmalsausprägungen, die letztere dagegen Abhängigkeit. Wird die Hypothese der Abhängigkeit (Altemativhypothese) nicht bestätigt, so bedeutet dies nicht, dass Abhängigkeit ausgeschlossen werden kann. Nur die Nullhypothese (keine Abhängigkeit) lässt sich durch einen statistischen Test widerlegen, womit die Alternativhypothese (Abhängigkeit) dann zwangsläufig angenommen werden muss (Testverfahren).
Die Überprüfung der Hypothesen ist u.a. durch den Chi-Quadrat-Test möglich. Die Vorgehensweise kann an dem einfachen Zwei-Variablen-Fall dargestellt werden (vgl. Hammann/Erichson, 2000, S. 322ff.).
Auf Grund der empirisch gewonnenen Daten über die nominalen Variablen mit den Ausprägungen a (a = 1, 2, ..., A) und b (b = 1, 2, ..., B) lassen sich die Häufigkeiten f b feststellen, die angeben, wie viele der Untersuchungseinheiten die Ausprägungen a und b haben. Unter der Nullhypothese (Unabhängigkeit) kann außerdem für jede Kombination (a, b) eine theoretische Häufigkeit F b angegeben werden. Die Summe der quadrierten Abweichungen (f. - F . )2 bildet ein geeignetes Maß für die Güte der Übereinstimmung zwischen der empirischen und der theoretischen Häufigkeitsverteilung. Daraus ergibt sich die folgende Testgröße der Chi-Quadrat-Analyse:
Unter der Annahme der Nullhypothese ist diese Größe annähernd x2-verteilt mit (A- 1) (B- 1) Freiheitsgraden. Die Werte der x2-Verteilung liegen in Abhängigkeit von bestimmten Freiheitsgraden für verschiedene Signifikanzniveaus in Tabellenform vor, z.B. im Anhang von statistischen Lehrbüchern. Die Nullhypothese muss bei einem bestimmten Signifikanzniveau abgelehnt werden, wenn der empirische Wert von y} größer ist als der aus der Tabelle entnommene theoretische Werl. Weitere Maße für den Zusammenhang zwischen nominalskalierten Variablen sind z.B. Phi, Kendall’s Tau oder Lambda.
Die Kontingenzanalyse ist nicht auf die Auswertung zweidimensionaler Kontingenztabellen beschränkt. Zur Analyse mehrdimensionaler Kontingenztabellen können neuere Verfahren eingesetzt werden, die auf einer logarithmischen Transformation der Variablen beruhen, d.h. auf einer Anwendung des Logit-Modells und (allgemeiner) des Log-Linear-Modells (vgl. Nie-schlag/Dichtl/Hörschgen, 1997, S. 782ff).
Untersuchung der Zusammenhänge zwischen zwei oder mehr nominalskalierten Merkmalen (Skala). Ausgangspunkt ist die sog. Kontingenztabelle, in der die Häufigkeiten aller Merkmalskombinationen enthalten sind. Die Stärke des Zusammenhangs wird mit Hilfe geeigneter Kontingenzkoeffizienten beschrieben. Können die in der Kontingenztabelle enthaltenen Elemente als Stichprobe aus einer übergeordneten Grundgesamtheit aufgefasst werden, lassen sich eine Reihe von statistischen Testverfahren, wie etwa der Chi-Quadrat-Test (Verteilungstests), zur Prüfung der Frage heranziehen, ob in der Grundgesamtheit mit hoher Wahrscheinlichkeit auf Zusammenhänge geschlossen werden kann.
Die Kontingenzanalyse in der Multivariatenanalyse dient zur Untersuchung der Abhängigkeit oder Unabhängigkeit von zwei oder mehreren Variablen. Typische Fragestellungen sind z.B., ob die Wahlentscheidung für ein Produkt (Kauf oder Nichtkauf) von einer kategorialen Größe (Familienzyklus oder Geschlecht) abhängt. Der klassische Test der Kontingenzanalyse gibt an, ob die Nullhypothese „Unabhängigkeit“ widerlegt werden kann. Allgemein läßt sich das Problem der Kontingenzanalyse an quadratischen Tafeln (2 Variablen) darstellen: Bei Annahme einer festen Stichprobengröße (N) und der Zellenbesetzung x;j = n {z® und y(j)j ist xjj eine Zufallsvariable. Der Erwartungswert mij für die Zellbesetzung ist dann definiert über
Ist die Null-Hypothese der Unabhängigkeit nicht zurückzuweisen, ergibt sich der Erwartungswert über die Rand-Wahrscheinlichkeiten der Variablenkategorien von z und y. Ist der x2-Wert größer als ein theoretischer Chi2-Wert (bei Berücksichtigung der Freiheitsgrade 1-1, J-l), muss die Hypothese der Unabhärigigkeit zurückgewiesen werden. Der Modellansatz kann auf mehrdimensionale Kontingenztabellen erweitert werden. Die Spezifikation der Kontingenzbeziehungen in einem Modell zum Test der Effekte einzelner Variablen erfolgt über den Log- linearen-Modell-Ansatz. Varianten dieses Ansatzes mit asymmetrischen Beziehungen wie die Logit- oder Probit-Analyse ermöglichen die Prognose von Zellbesetzungen aufgrund der Häufigkeiten kategorialer Variablen in einer mehrdimensionalen Kontingenztafel. Die Korrespondenzanalyse liefert die Möglichkeit, Informationen aus Kontingenztafeln im mehrdimensionalen Raum darzustellen.
Siehe auch Datenanalyse,
Literatur:
* Bishop, Y.; Fienherg, S. E.; Holland, Discrete Multivariate Analysis, 4. Aufl., 1987, Kap. 2.
* Fienberg, S. E., The Analysis of Cross-Classified Data, Cambridge 1977.
Vorhergehender Fachbegriff: Kontingenz-Ansatz | Nächster Fachbegriff: Kontingenzansatz
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|
|