Der Chi-Quadrat-Test ist ein statistisches Prüfverfahren. Er kann zur Prüfung einer Hypothese über die Verteilung eines Merkmals und zur Prüfung einer Hypothese über den Zusammenhang oder Nicht-Zusammenhang zweier Merkmale eingesetzt werden.
Verteilungstests
(x2-Test): Ein statistischer Signifikanztest zur Prüfung von - Hypothesen und Verteilungen unter Verwendung einer Prüfmaßzahl, deren Verteilung vollkommen oder näherungsweise einer x2-Verteilung, ChiQuadrat-Verteilung, genügt. Sinnvoll ist die Anwendung des Chi-Quadrat-Tests sowohl zur Prüfung der Signifikanz der Abweichung von Erhebungs- oder Beobachtungswerten einer empirischen Verteilung von den x2verteilten - Erwartungswerten einer angenommenen theoretischen Verteilung (Anpassungstest) oder als Hypothesentest auf Unabhängigkeit zur Ermittlung der Signifikanz eines in einer Kontingenztabelle beobachteten Zusammenhangs zwischen zwei oder mehr Variablen.
1. Anpassungstest: Beim Vergleich einer empirischen mit einer theoretischen Verteilung wird die Verteilung der erwarteten Häufigkeiten als Nullhypothese interpretiert, so dass je nach dem gewählten Signifikanzniveau keine großen Abweichungen der empirischen von der Verteilung der erwarteten Häufigkeiten erfolgen dürfen. Bezeichnet man die theoretisch zu erwartenden Häufigkeiten mit fe und die tatsächlich beobachteten Häufigkeiten mit fo, dann ist die Testgröße
mit n - 1 Freiheitsgraden annähernd chi-quadratverteilt. Ist der empirische Wert für Chi-Quadrat kleiner als der theoretische Wert, wird die Nullhypothese angenommen, ist er größer, wird sie bei einem Signifikanzniveau a abgelehnt. Ist x2 = 0, so sind die empirische und die theoretische Verteilung identisch. Je größer x2 wird, desto mehr wächst die Wahrscheinlichkeit, dass die empirische Verteilung nicht der theoretischen Häufigkeitsverteilung entspricht.
2. Test auf Unabhängigkeit: Dabei wird ebenfalls mit Hilfe der Chi-Quadrat-Verteilung die Hypothese über das Bestehen oder Nichtbestehen eines Zusammenhangs zwischen zwei - Merkmalen überprüft. In diesem Fall wird also der Test zur Prüfung der Zufälligkeit zwischen empirischen und theoretischen Varianzen und bei der Kombination von Signifikanztests herangezogen. Dabei wird ausgegangen von N empirischen Objekten, die auf zwei Merkmale A und B mit r bzw. s Ausprägungen verteilt sind (A = A1, ..., Ar und B = B1, ..., Br). Werden A und B kombiniert, kommen A,Bn1i Elemente zu
Die Testgröße auf Unabhängigkeit lautet dann:
Dabei ist die Testgröße für die Nullhypothese, dass A und B unabhängig und die Alternativhypothese, dass sie nicht unabhängig sind, mit (r - 1)(s - 1) Freiheitsgraden chi-quadratverteilt. Die Nullhypothese wird also bei einem Signifikanzniveau von a verworfen, wenn bei (r - 1)(s - 1) Freiheitsgraden x2a <_ x2 ist. Eine Vereinfachung, die besonders häufig angewandt wird, ergibt sich für die Anwendung des Chi-Quadrat-Tests bei Vierfeldertafeln. In diesem Fall nimmt die Testgröße dann die Form
an, wobei a, b, c und d die Häufigkeiten der Kombinationen in den vier Feldern der Assoziationstabelle darstellen. Dabei wird die Nullhypothese bei einem Signifikanzniveau von a verworfen, wenn bei einem Freiheitsgrad von 1 x2a <_ x2 ist.
vgl. McNemar-Test
nichtparametrisches Testverfahren zur Überprüfung der Anpassungsgüte der Verteilung der Stichprobenrealisationen an eine vorgegebene und vollständig spezifizierte Verteilungsfunktion beliebiger Struktur. Will bspw. ein Einzelhändler untersuchen, ob die Zahl der täglich bedienten Kunden in
seinen 6 Filialen gleichverteilt ist, bietet sich dieser Test an. Kann davon ausgegangen werden, dass die Verteilungsfunktion stetig ist und liegen wenige Beobachtungen vor, erweist sich meist der Kolmogoroff-Smir- nov Test als das bessere Prüfverfahren. Der Test kann Daten von beliebigem Meßniveau verarbeiten. Ferner sind die n Beobachtungen xi,.. ,,xn in k disjunkte Klassen eingeteilt. Sie stellen Realisationen der unabhängigen Stichprobenvariablen Xi,. . .,Xndar. In jeder Klasse liegen mindestens m > 5 Beobachtungen. Zur Formulierung der Hypothesen wird eine Verteilungsfunktion Fo(x) als vollständig bekannt angenommen. Mit pi wird die aus Fo(x) bestimmbare Wahrscheinlichkeit dafür bezeichnet, dass die Realisation der Stichprobenvariable Xj in der Klasse i zumTragen kommt. Die dem Testverfahren zugrundeliegenden Hypothesen lauten: Ho : F(x) = Fo(x) für alle x Hi : F(x) * Fo(x) für mindestens ein x Die Teststatistik ist unter Ho approximativ Chi-Quadrat verteilt mit k-1 Freiheitsgraden, wobei die Approximationsgüte stark von der Einhaltung der Bedingung n; > 5 ab
Als Teststatistik wird unter Verwendung der Klassengrößen m der folgende Wert berechnet [Biitiing/Trenkler(l978), S. 93]: hängt. Die Nullhypothese wird zum Signifikanzniveau oc abgelehnt, wenn x2 > X2i-a;k-i, d.h. wenn die Prüfgröße den Wert des 1 - oc Fraktils der Chi-Quadrat Verteilung mit k-1 Freiheitsgraden übersteigt.
Literatur: Büning,H.; Trenkler, G.,Nichtparametrische statistische Methoden, Berlin, New York 1978.
Vorhergehender Fachbegriff: Chi-Quadrat Anpassungstest | Nächster Fachbegriff: Chi-Quadrat-Verteilung
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|
|