Kommen in einer statistischen Gesamtheit vom Umfang N hi Elemente mit der Ausprägung Xi, h2 Elemente mit der Ausprägung x2, ..., hk Elemente mit der Ausprägung Xk vor, so bezeichnet man die hi (i = 1, 2,..., k) als absolute Häufigkeiten (Anzahlen). Als relative Häufigkeiten (Anteile) erhält man: Die Darstellung der Merkmalsausprägungen Xj mit den dazugehörigen Häufigkeiten hi bzw. fi in tabellarischer oder graphischer Form nennt man als Häufigkeitsverteilung. Untersucht man an den Elementen einer statistischen Gesamtheit zwei Merkmale, so lassen sich für die Kombinationen der verschiedenen Ausprägungen ebenfalls absolute und relative Häufigkeiten auszählen; man erhält dann eine zweidimensionale Häufigkeitsverteilung. Allgemein erhält man bei p Merkmalen in analoger Weise eine p-dimensionale Häufigkeitsverteilung. Existieren in einer statistischen Gesamtheit sehr viele unterschiedliche Merkmalsausprägungen, werden diese zweckmässigerweise in Klassen zusammengefasst; die Häufigkeiten werden dann nicht mehr den einzelnen Merkmalsausprägungen, sondern den Klassen zugeordnet. Literatur: Bleymüller, JJGebiert, G./Gülicher, H., Statistik für Wirtschaftswissenschaftler, 8. Aufl., München 1992.
Kommen in einer statistischen Gesamtheit vom Umfang N hi Elemente mit der Ausprägung xi, h2 Elemente mit der Ausprägung X2, . . ., hk Elemente mit der Ausprägung xt vor, so bezeichnet man die hi (i = 1,2. .,k) als absolute Häufigkeiten (Anzahlen). Als relative Häufigkeiten (Anteile) erhält man:
Die Darstellung der Merkmalsausprägungen xi mit den dazugehörigen Häufigkeiten hi bzw. fi in tabellarischer oder graphischer Form bezeichnet man als Häufigkeitsvertei- lung. Bei der Analyse von Anteilen sollten der Klarheit halber die absoluten Werte jeweils zusätzlich angegeben werden. Auf Prozentangaben von Gesamtheiten unter 100 sollte möglichst verzichtet werden. Zusätzliche Aufschlüsse erbringt die Berechnung der kumulierten Häufigkeiten, die sich dann ergeben, wenn man alle Elemente der Größe nach ordnet und von Größenstufe zu Größenstufe fortschreitend die Anzahl der Fälle addiert. Man erhält dadurch die sog. Verteilungsfunktion. Sie läßt Aussagen über die Anteile der Fälle bis zu bzw. über bestimmten Grenzwerten zu. Bei Mehrfachnennungen ergeben sich naturgemäß auch kumulierte Werte über 100%. Will man dies vermeiden, muss jede einzelne Antwort als 0/1 Variable codiert werden, was dann auch eine systematische Auswertung von Mehrfachantworten auf bestimmte Muster hin (z.B. Gruppierungen von Antworten bzw. Antwortern) zuläßt. Für derartige Analysen stehen spezielle Programme (z.B. MULT- RESPONSE in SPSS) zur Verfügung. Häufigkeitsverteilungen lassen sich auch für Kombinationen unterschiedlicher Ausprägungen verschiedener Variablen aufstellen. Sie werden dann in zwei- oder mehrdimensionalen Kreuztabellen dargestellt. Einen komprimierten Eindruck von der Häufigkeitsverteilung erhält man durch Berechnung statistischer Kennwerte über die zentrale Tendenz (insb. Mittelwerte) und die Streuung bzw. Schiefe der Verteilung (Streuungsmaße). Gelegentlich empfiehlt es sich, bei schwacher Besetzung einzelner Ausprägungen mehrere Ausprägungen zu Ausprägungsklassen zusammenzufassen, wodurch die Skala des Merkmals vergröbert wird. Literatur Bleymüller, ].; Gehlert, G.; Gülicher, H., Statistik für Wirtschaftswissenschaftler, 7. Aufl., München 1991. Kritz, ]., Methodenkritik empirischer Sozialforschung, Stuttgart 1981.
In der deskriptiven Statistik wird das Datenmaterial aus Erhebungen der Markt- und Sozialforschung meist systematisch so zusammengefaßt, dass für die Beobachtungswerte (X) angegeben wird, in welchen Häufigkeiten (fo ein einfaches oder zusammengesetztes - Merkmal in allen Klassen (Xi) auftritt. Diese zahlenmäßige oder auch graphische Zusammenstellung der Beobachtungshäufigkeiten heißt Häufigkeitsverteilung. Die Häufigkeitsverteilung gibt an, bei wievielen Untersuchungsobjekten die unterschiedlichen Ausprägungen einer oder mehrerer Variablen beobachtet wurden. Dividiert man dabei die einzelnen Häufigkeiten durch die Gesamtzahl der Objekte (N), so erhält man die relative Häufigkeit.
Nach der Zahl der beobachteten Variablen unterscheidet man univariate (eindimensionale), bivariate (zweidimensionale) und multivariate (mehrdimensionale) Häufigkeitsverteilungen. Nach der Art der Variablen lassen sie sich nach nominal-, ordinal-, intervall- und verhältnisskalierten Häufigkeitsverteilungen, - Skalierung - Skala (Skalenniveau), unterscheiden. Hat eine Verteilung nur eine endliche Zahl von unteilbaren Variablen, - homograde Fragestellung, spricht man von diskreten (unstetigen) Häufigkeitsverteilungen, haben sie hingegen eine theoretisch unendliche Zahl von beliebig teilbaren Variablen, - heterograde Fragestellung, spricht man von einer kontinuierlichen (stetigen) Häufigkeitsverteilung.
In der Wirtschafts- und Sozialstatistik sowie der Marktforschung spielen neben den empirischen Häufigkeitsverteilungen, die sich bei konkreten Erhebungen ergeben, insbesondere die theoretischen Verteilungen der mathematischen Statistik, vor allem als Prüfverteilungen, wie z.B. die - Chi-Quadrat-Verteilung, die - F-Verteilung, die - hypergeometrische Verteilung, die Normalverteilung, die - Poissonverteilung, die - t-Verteilung u,a., eine wichtige Rolle.
Die praktische Bedeutung von empirischen Häufigkeitsverteilungen liegt in der Erleichterung des Uberblicks über das gesamte vorliegende Datenmaterial, insbesondere mit Hilfe einer Reihe von statistischen Maßzahlen, mit deren Hilfe charakteristische Eigenschaften empirischer Häufigkeitsverteilungen berechnet werden können. Zu diesen charakteristischen Maßzahlen von Häufigkeitsverteilungen zählen vor allem Maße der zentralen Tendenz (Mittelwerte), Streuung (Dispersion), die Momente, die Maßzahlen der Schiefe, die Maßzahlen der Wölbung und die Maßzahlen der Konzentration.
Die theoretische Bedeutung empirischer Häufigkeitsverteilungen liegt darin, dass sie die Formulierung von Hypothesen über das Vorliegen eines bestimmten, formal meist durch nur wenige
Parameter definierbaren Verteilungstyps und weitere Annahmen über die Wirkungsweise der die Merkmalsvariation bedingenden Faktoren gestatten. Theoretische Häufigkeitsverteilungen spielen vor allem in der Inferenzstatistik eine große Rolle.
Häufigkeitsverteilungen lassen sich graphisch im Koordinatenkreuz darstellen. Dabei werden die Merkmalsklassen auf der Abszisse und die Häufigkeiten auf der Ordinate eingetragen. Bei diskreten Verteilungen mit ungruppierten Daten eignet sich zur - graphischen Darstellung das Blockdiagramm (Säulen-, Stabdiagramm). Die übliche Darstellungsform für gruppierte Werte einer kontinuierlichen Variablen ist das Histogramm, aus dem durch Bildung der Klassenmitten (oder auch ein - Gewichtungsverfahren, das den unterschiedlichen Häufigkeiten der Merkmale in den einzelnen Klassen Rechnung trägt) und Verbindung durch eine Gerade ein Polygon gebildet werden kann. Die graphische Darstellung einer kumulierten Häufigkeitsverteilung erfolgt in der sog. Galtonschen Ogive.
Je nach der Form der graphischen Darstellung von Häufigkeitsverteilungen unterscheidet man eingipflige (unimodale) und mehrgipflige (multimodale) Verteilungen, linksschiefe, rechtsschiefe und symmetrische Verteilungen, steile (ieptokurtische), mesokurtische und flache (platykurtische) Verteilungen, dreieckige und rechteckige Verteilungen, J-förmige und umgekehrt J-förmige Verteilungen sowie glockenförmige und U-förmige Häufigkeitsverteilungen.
Vorhergehender Fachbegriff: Häufigkeitspolygon | Nächster Fachbegriff: Häufigkeitsziffern
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|
|