(Zuverlässigkeit) Genauigkeit des aus einem psychologischen Test ermittelten Messwerts bzw. das Ausmass, in dem der Messwert aufgrund zufällig wechselnder Bedingungen von Testdurchführung zu Testdurchführung (unterschiedliche Testsituationen, Motivation und Kondition des Probanden, Auswertungsfehler, Testleitereinfluss etc.) oder auch auf Grund von Inhomogenität der Testaufgaben im Durchschnitt mit Messfehlern belastet ist. Den verschiedenen Aspekten der Zuverlässigkeit bzw. den unterschiedlichen Messfehlerarten entsprechend gibt es zahlreiche Methoden der Reliabilitätsprüfung (z. B. Korrelation mit einer Testwiederholung, mit Paralleltests, Korrelation der Testhälften, Konsistenzanalysen etc.) und dementsprechend stets mehrere Indizes für die Reliabilität eines Tests. Als Gütekriterium fungieren demnach zumeist Korrelationskoeffizienten, die das Verhältnis der "wahren" zur beobachteten Varianz angeben. Literatur: Magnusson, P., Testtheorie, 2. Aufl., Wien 1975.
Die Reliabilität ist ein Maß für die Zuverlässigkeit bzw. Genauigkeit von wissenschaftlichen Ergebnissen z. B. aus einer empirischen Untersuchung. Eine Untersuchung und damit die gewonnenen Aussagen sind beispielsweise als reliabel zu bezeichnen, wenn sie bei wiederholter Untersuchung zum gleichen Ergebnis gelangen. Gütekriterien können statistische Maße (z. B. Standardabweichung, Varianz) sein.
Zur Beurteilung der Qualität von Skalierungsverfahren werden die Konzepte der Reliabilität (Zuverlässigkeit) und der Validität (Gültigkeit) eingesetzt. Ein Verfahren ist dann reliabel, wenn es exakte Meßwerte liefert, die sich wiederholen lassen. Als Reliabilitätsmaße können Korrelationskoeffizienten, die die Stabilität und Konsistenz messen, verwendet werden.
[s.a. Messen] Die Reliabilität ist neben der Validität ein Maß zur Beurteilung der Güte von empirischen Messungen. Reliabilität wird auch als Zuverlässigkeit, Genauigkeit und Stabilität der Messung bezeichnet. Sie liegt vor, wenn wiederholte Messvorgänge unter sonst gleichen Rahmenbedingungen zu gleichen Werten führen. Zur Abschätzung der Reliabilität werden verschiedene Kontrollmessungen miteinander verglichen (vgl. Kerlinger, 1979, S. 683ff.).
Zur Reliabilitätsprüfung werden vorwiegend folgende Verfahren angewendet (vgl. Friedrichs, 1998, S. 102):
- Test-Re-Test-Meihode Es erfolgen mehrere Messungen mit demselben Instrument nacheinander, bspw. wird dieselbe Messskala denselben Befragten mehrmals vorgelegt. Von Messung zu Messung abweichende Werte bei Konstanz aller anderen Bedingungen sind ein Hinweis für Unzuverlässigkeit. Hierbei ist jedoch der Einfluss von Lernprozessen (Lernen) bei den Befragten zu berücksichtigen.
- Paralkl-Test-Methode
Bei dieser Methode erfolgt eine Messung des gleichen Sachverhaltes mit mehreren adäquaten alternativen Instrumenten.
- Split-half-Methode
Ein Messinstrument, z.B. eine eindimensionale Messskala, die sich aus mehreren Items zusammen setzt, wird in zwei gleiche Teilskalen geteilt. Es werden die Skalenwerte beider Teilskalen miteinander korreliert.
Als Maß für die Reliabüität wird bei allen drei Methoden die Höhe der Korrelation (Korrelationsanalyse) zwischen den verschiedenen Messwerten betrachtet. Eine starke Korrelation ist Ausdruck einer hohen Reliabüität des verwendeten Messinstrumentes.
Eine inhaltliche Reliabilitätsprüfung der verwendeten Items im Hinblick auf ihre Erklärungskraft für die gemessenen Konstrukte ermöglichen Standardsoftwarepakete der Datenanalyse.
In der Wirtschaftssoziologie: reliability Zuverlässigkeit
kennzeichnet den Grad der formalen Genauigkeit (Zuverlässigkeit), mit dem gemessen wird. Messergebnisse sind reliabel, wenn bei wiederholter Messung unter vollkommen gleichen Bedingungen dasselbe Ergebnis resultiert. Die Reliabilität bezieht sich dabei auf Zufallsfehler (unsystematische, variable Fehler). (Negativ-)Beispiel: Ein Metermass ist aus einem verformbaren Material gefertigt und ändert seine Länge in Abhängigkeit von Umwelteinflüssen. Siehe auch Gütekriterien und Validität.
Grad der Genauigkeit, mit dem ein bestimmtes Merkmal gemessen wird (Messung). Hier steht der Aspekt der Verläßlichkeit und Konsistenz im Vordergrund. Die Wechselwirkung zwischen Validität und Reliabilität verdeutlicht.
1. Sofern man über ein perfektes Meßverfahren verfügt, entspricht ein gemessener Wert X der wahren Ausprägung - dem wahren Wert W-eines Meßobjektes. Letztlich ist aber keine Messung perfekt, so dass jede Messung einen Meßfehl ler F enthält. Diese Erfahrung führte zur Entwicklung der klassischen Meßfehlertheorie mit X = W + F. Der gemessene Wert wird in eine wahre und eine Fehlerkomponente zerlegt. Die Meßfehlertheorie verkörpert somit ein theoretisches Konzept. Die Bestimmung der Reliabilität in Form eines Reliabilitätskoeffizienten kann deshalb nach verschiedenen Methoden erfol- §en\' Im Endergebnis wird die Varianz einer Variablen in zwei Komponenten zerlegt. Man erhält a1 g (gesamte Varianz) = (72w (wahre Varianz) + cr2f (Fehlervarianz) - im engl, auch als total, true und error bezeichnet. Der Reliabilitätskoeffizient wird ganz allgemein durch das Verhältnis der wahren Varianz zur Gesamtvarianz bestimmt: rtt = <jv / (fg. Man unterscheidet drei wichtige Methoden zur Bestimmung der Reliabilität: l.Paralieltest-Reliabilität Zur Bestimmung der Paralleltest-Reliabilität erhebt man an einer Stichprobe von Versuchspersonen zwei streng vergleichbare Meßinstrumente und berechnet anschließend die Korrelation. l.Test-Retest-Reliabilität Hierbei erhebt man die Daten an der gleichen Stichprobe mit dem gleichen Meßinstrument zu zwei verschiedenen Zeitpunkten und ermittelt anschließend die Korrelation der Ergebnisreihen. Interne-Konsistenz-Reliabilität Hier wird vorausgesetzt, dass sich ein Meßinstrument in zwei gleichwertige Hälften zerlegen läßt, so dass gewissermaßen zwei Paralleltcstformen halber Länge resultieren. Die interne Konsistenz läßt sich entweder nach der Testhalbierung (Split-half-Reliabilität), oder besser nach der Konsistenzanalyse - die eine Verallgemeinerung der Testhalbierung darstellt - ermitteln. Die Fehlerkomponente geht wiederum auf zahlreiche Ursachen zurück, z.B. gibt es spontane, unsystematische Unachtsamkeiten, durch Raten erzielte Antworten, kurzzeitige Schwankungen der Umfeldbedingungen, ungenaue Angaben zur Meßdurchführung und Meßbewertung. In Abb. 2 sind die wichtigsten Fehlerkomponenten mit ihren Beziehungen zu den einzelnen Reliabilitätsarten zusammengefaßt. (Annahmen: der durchschnittliche Meßfehler ist Null, die Meßfehler korrelieren nicht mit den wahren Werten und den Fehlern in anderen Tests.) Der Reliabilitätskoeffizient stellt eine statistische Meßgröße zur Quantifizierung der Reliabilität dar. Es lassen sich verschiedene Vorgehensweisenunterscheiden: Split-Half-Methode: Liegt die Korrelation von zwei Testhälften (m) vor (Interne-Kon- sistenz-Reliabilität) so wird nach der Spear- man-Brown Formel die Reliabilität berechnet als: rtt = 2 m / (1 + tu). Dieser Fall geht aus der allgemeinen Formel hervor, die einen n-Item-Test in n äquivalente Teile zerlegt und ein Spezialfall des Koeffizienten-Alpha (coefficient alpha) darstellt, der auch den Einsatz varianzanalytischer Auswertungsmethoden ermöglicht. Für den Fall dichotomer Items ist dieser Koeffizient auch als Kuder- Richardson-Formel(KR20)heknnnt.
Literatur: Lienert, G. A., Testaufbau und Testanalyse,3. Aufl., Weinheimu.a. 1969.Nunnally,J. C., Psychometric Theory, NewYork 1978.
Vorhergehender Fachbegriff: Releve d’ldentite Bancaire | Nächster Fachbegriff: Reliabilität
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|
|