ist eine Teilauswahl aus einer Gesamtheit, z.B. Prüfung von 30 Erbsendosen bei einer Lieferung von 1000 Stück. Die Stichprobe muß nach bestimmten Regeln der Statistik gezogen werden; ist dies der Fall, so kann man mit einer bestimmten Sicherheit von der Stichprobe auf die Gesamtheit schließen. Stichproben werden gezogen, weil Vollerhebungen nicht in Frage kommen (z. B. Wahlforschung) oder praktisch nicht möglich sind (z.B. Prüfung von Konserven durch den Handel; öffnet er alle, sind sie unverkäuflich).
bezeichnet eine endliche Teilmenge aus einer statistischen Gesamtheit. Eine statistische Gesamtheit oder Masse ist die Menge von Einheiten oder Elementen mit identisch gleichen Identifizierungsmerkmalen, wobei die Auswahl der Elemente endlich oder unendlich sein kann (Stichprobe aus endlicher oder unendlicher Gesamtheit). Mit Hilfe einer Stichprobe sollen Rückschlüsse auf die Gesamtheit gezogen oder ge-w1Sse Hypothesen bezüglich dieser Gesamtheit getestet werden. Eine Stichprobe muß daher die Gesamtheit möglichst gut widerspiegeln, d. h. sie soll repräsentativ sein. Stichproben können ausgewählt werden als: (1) Nichzufällige Stichproben (Auswahlverfahren). Diese haben den Nachteil, daß der Fehler, der durch die Nichtumfassung aller Elemente der Gesamtheit entsteht (Stichproben oder Auswahlfehler), nicht berechenbar ist. (2) Zufällige Stichproben. Bei ihnen bestimmt eine zufallsgesteuerte Auswahl (Zufallsauswahl), welche Elemente in der Teilerhebung erfaßt werden. Jedes Element hat so eine von Null verschiedene Wahrscheinlichkeit, in die Auswahl zu kommen, so daß der Auswahlfehler berechenbar ist. Das ist Veranlassung, mitunter lediglich zufallsgesteuerte Stichproben als »Stichproben« zu bezeichnen. Neben der einfachen bzw. uneingeschränkten Stichprobe, für die alle Elemente der Gesamtheit die gleiche und vom Umfang der Stichprobe abhängige Wahrscheinlichkeit haben, ausgewählt zu werden, sind die geschichtete Stichprobe, die Klumpenstichprobe und mehrstufige Auswahl zu nennen.
In der Wirtschaftssoziologie: Auswahl Auswahlverfahren
Teilerhebung
Gesamtheit jener Elemente, die in die Teilerhebung einbezogen werden. Dabei müssen die Merkmalsträger so ausgewählt werden, dass sie hinsichtlich der Untersuchungsmerkmale repräsentativ sind, um einen Schluss von der Stichprobe auf die Grundgesamtheit zu ermöglichen. Siehe auch Marktforschungsmethoden (mit Literaturangaben).
In der Marktforschung ist aus Zeit- und Kostengründen vielfach - anstelle einer Vollerhebung - eine Beschränkung auf einen Teil aller (entsprechend der Abgrenzung der Grundgesamtheit) in Betracht kommenden Elemente erforderlich. Eine solche Teilerhebung wird auch als „Stichprobe“ oder „Sample“ bezeichnet. Gelegentlich erfolgt - deshalb die Anführungszeichen - eine Einschränkung des Begriffs auf eine zufallsgesteuerte Auswahl (Auswahlverfahren). (Zwischen den Bezeichnungen Stichprobe e. S. - und Teilerhebung würde also ein Unterschied bestehen.) Nur dann ist nämlich der Repräsentationsschluß, im Sinne der schließenden Statistik (Inferenzstatistik), von der Stichprobe auf die Grundgesamtheit, in der Weise möglich, dass aufgrund der aus der Stichprobe ermittelten Ergebnisse auf die unbekannten Parameter der Grundgesamtheit geschlossen und dafür eine „Fehlergrenze“ angegeben wird. Infolge des Wirkens des Zufallsfehlers ist nämlich nur eine Intervallschätzung möglich. Ein solches Vertrauens- oder Konfidenzintervall, hier nur für den (arithmetischen) Mittelwert, könnte etwa folgende Form haben: „Mit einer Wahrscheinlichkeit von 95% liegen die durchschnittlichen Ausgaben für den Artikel A zwischen 8 und 11 EUR“ (oder, exakter formuliert: In 95 von 100 Fällen wird der „wahre Wert“ der Grundgesamtheit vom Vertrauensintervall umschlossen). Es enthält also zwei Elemente: das Intervall selbst (Fehlerspanne) und den Konfidenzgrad (Genau- igkeits- oder Sicherheitsgrad, Vertrauenswahrscheinlichkeit). In der Praxis ist der Stichprobenumfang meist so groß, dass auch die Anzahl aller möglichen Stichproben recht groß wird und sich - via „zentraler Grenzwertsatz“ - die Stichprobenverteilung einer Normalverteilung nähert. Damit ergibt sich als Mittelwert der Stichprobenverteilung des arithmetischen Mittels: (J,x = |A und als Standardfehler: Oi = a’WrT (a als Standardabweichung der Grundgesamtheit, n für den Umfang der Stichprobe. Der Korrekturfaktor, die sog. Endlichkeitskorrektur, wurde vernachlässigt.) Dies ist in der älteren deutschen Literatur auch als heterograder Fall bezeichnet worden. Für den „homogra- den" Fall, die Proportion (p für die der Stichprobe, P der Grundgesamtheit - und q bzw. Q als Komplement zu 1), resultiert entsprechend Dies zeigt auch, dass - da es sich hier im Grunde um eine Binomialverteilung handelt die Normalverteilung der Stichprobenverteilung sich unabhängig von der Verteilung der Grundgesamtheit ergibt. Nun wird - im „heterograden Fall“ - er, als „wahrer Wert“ der Grundgesamtheit, aber gerade nicht bekannt sein, sondern muss durch die Stichproben-Standardabweichung s (unter Verwendung von n-1 - statt n - als Divisor, damit es sich um eine „erwartungstreue“ Schätzung handelt, Inferenzstatistik) ersetzt werden. Dadurch tritt an die Stelle der Normalverteilung die t-Verteilung, und zwar mit df = n-1 (Freiheitsgrade). Damit muss nun auch eine Normalverteilung der Grundgesamtheit vorausgesetzt (und ggf. mit Anpassungstests überprüft) werden. Da sich mit wachsender Stichprobengröße (jedenfalls ab 100; mitunter werden, als „Faustregel“, auch schon geringere Fallzahlen - etwa 50 oder gar 30 - genannt) die t-Verteilung der Normalverteilung nähert, kann bei großen Stichproben von dieser Voraussetzung abgesehen (und in den folgenden Formeln t durch z ersetzt) werden. Insgesamt erfolgt die Intervallschätzung des arithmetischen Mittels als: Beispiel: n = 500; x = 0,8; s (mit n-1 als Divisor) = 0,3; Vertrauenswahrscheinlichkeit = 0,95, d.h. t= l,96n = 0,80 ± 0,0263. Das Intervall, das in 95% aller Fälle den „wahren Wert“ umschließt, lautet also: 0,77 < < 0,83. In der Praxis der Marktforschung - und auch der amtlichen Statistik - verzichtet man oft auf eine derartige „Fehlerrechnung“. Sie wäre bei großen Bevölkerungsumfragen mit vielen Ergebnissen auch sehr aufwendig. Für den praktischen Gebrauch wurden zudem Tabellen, mit verschiedenen Stichprobengrößen, entwickelt. Zumal für Proportionen sind diese, infolge der Begrenzung des „Wertevorrats“, wegen p + q = 1, relativ leicht aufzustellen und werden mitunter „Berichtsbänden“ als Anhang beigegeben. Auch bei der Festlegung des Stichprobenumfangs - vor der Durchführung der Erhebung-werden in der Praxis oft „Erfahrungswerte“ (z.B. 1000 oder 2000) zugrunde gelegt. Die exakte Berechnung ist wiederum nur bei Proportionen relativ leicht möglich. Bei Mittelwerten ergibt sich eine Schwierigkeit. Die Formel läßt sich zwar noch leicht ableiten. Führt man für die Fehlerspanne das Symbole ein: Da s aber zu diesem Zeitpunkt noch nicht bekannt ist (bei p und q kann - „konservativ“ deren ungünstigstes Verhältnis, nämlich 0,5 : 0,5, angenommen werden), müssen hypothetische Werte - evtl. aus Voruntersuchungen gewonnen - eingesetzt werden. Man beschließt, nur 500 Erhebungen durchzuführen. Trotz der geringeren Stichprobengröße ergibt sich im obigen Beispiel ein niedrigerer Fehler, weil die Streuung kleiner als veranschlagt war.
Literatur: Bohley, P., Statistik, 4. Aufl., München 1991. Hartung,]Elpelt, B.; Klösener, K. -H., Statistik, 7. Aufl.,München 1989.Hüttner, M., Grundzüge der Marktforschung, 4. Aufl., Berlin 1989. Sachs, L., Angewandte Statistik, 6. Aufl., Berlin 1984. Beispiel: Wie oben soll die Vertrauenswahrscheinlichkeit 0,95 betragen (t = 1,96); der absolute Fehler soll nicht höher als 0,03 sein; s wird mit 0,35 angenommen:
Vorhergehender Fachbegriff: Stichkursverfahren | Nächster Fachbegriff: Stichprobe, verbundene
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|
|