Clusteranalyse, mehrdimensionale Skalierung
Ähnlichkeitsmaße dienen der Quantifizierung von Ähnlichkeiten zwischen beobachteten Objekten, z.B. im Rahmen der Clusteranalyse. Man unterscheidet zwischen Maßen für metrisch skalierte und solchen für nicht-metrisch skalierte Ausgangsdaten. Die Ähnlichkeit metrischer Daten wird mit Hilfe von Distanzmaßen dargestellt; bei nicht-metrischen Ausgangsdaten werden Ähnlichkeitskoeffizienten ermittelt (Ska-knniveau).
Bei Vorliegen ordinalskalierter Werte lassen sich zur Ähnlichkeitsmessung z.B. Rangkorrelationskoeffizienten und somit letztlich metrische Maße verwenden (vgl. Hüttner, 1979, S. 383). Häufiger sind jedoch nominalskalierte Daten, die binari-siert (d.h. auf zwei Ausprägungen reduziert) werden können. Der Vergleich der Merkmalsausprägungen von zwei Objekten (Xj, x,) führt zu einer so genannten Vierfelder-Tafel. Sie enthält die Anzahl der positiven (a), der negativen (d) und die Anzahl der Nicht-Übereinstimmungen (b, c) von Merkmalsausprägungen.
Der »Simple Matching Coefficient« (s) berücksichtigt alle positiven und negativen Übereinstimmungen und stellt sie der Gesamtzahl gegenüber:
Dagegen berücksichtigt der »Tanimoto-Ko-effizient« (t) lediglich die positiven Übereinstimmungen im Verhältnis zur Summe dieser und der Nichtübereinstimmungen, da die negativen Übereinstimmungen für inhaltlich bedeutungslos gehalten werden:
In der Wirtschaftssoziologie:
Distanzmasse
(Ahnlichkeitsmaße): In der Markt-und Sozialforschung und hier z.B. in der Clusteranalyse eine der drei Kategorien von Proximitätsmaßen für nominalskalierte Objekte, also gewissermaßen ein Distanzmass für nominalskalierte Daten. Das bekannteste Ähnlichkeitsmass ist der Tanimoto-Koeffizient.
vgl. Distanzmaße, Korrelationsmaße
Vorhergehender Fachbegriff: Ähnlichkeitsmaße | Nächster Fachbegriff: Ältere Angestellte
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|