[s.a. Ähnlichkeitsmaßel Distanzmaße werden im Rahmen der Datenanalyse (z.B. Clusteranalyse; Mul-tidimensionale Skalierung) zur Bestimmung der Beziehungen zwischen Messobjekten eingesetzt (vgl. Hammann/Erichson, 2000, S. 272f.). Dabei werden durch Vergleiche von metrisch skalierten Ausgangsdaten (Skalenniveau) die zwischen Objekten bestehenden Ähnlichkeiten gemessen. Ist die Distanz gering, dann ist die Ähnlichkeit groß; entsprechend sind sich Objekte bei großer Distanz sehr unähnlich.
In der Wirtschaftssoziologie:
Ähnlichkeitsmasse, Klasse von Massen, die auf der Basis der Messung der „Ähnlichkeit“ von Objekten ihre Abstände in einem metrischen Raum angeben. Hierdurch wird die Datenmatrix in eine Matrix der paarweisen Distanzen zwischen den Untersuchungseinheiten überführt, die weiteren analytischen Zwecken (Cluster-Analyse, smallest space analysis) dient, die i.d.R. zu einer Reduktion der zur Beschreibung der Objekte benötigten Informationen führt. Die Distanz oder Ähnlichkeit zweier Untersuchungseinheiten wird aus dem Vergleich ihrer Merkmalsprofile (Profilanalyse) gewonnen.
Clusteranalyse
Oberbegriff für einen Typ der in der multivariaten Analyse und vor allem in der Clusteranalyse verwendeten Proximitätsmaße, mit denen im Gegensatz zu den Ähnlichkeitsmaßen und den - Korrelationsmaßen die Entfernungsbeziehung zwischen Meßobjekten bestimmt wird. Durch sie wird die Entfernung zwischen Objekten im n-dimensionalen - Merkmalsraum bestimmt. Voraussetzung für die Verwendung von Distanzmaßen ist das Vorliegen intervallskalierter Daten. Die Anwendung von Distanzmaßen ist neben der Clusteranalyse auch in vielen anderen Bereichen der Datenanalyse sinnvoll, so bei Skalierungsverfahren und hier insbesondere bei multidimensionalen Skalierungsverfahren und bei der Diskriminanzanalyse (z.B. Mahalanobis-Distanz).
Die beiden am meisten verwendeten Distanzmaße sind Sonderfälle der zur größeren Familie der als Minkowski-Metrik bezeichneten zählenden Distanzmaße in der allgemeinen Form:
Dabei bezeichnet d die Distanz zwischen den Punkten j und k bei Beachtung des MinkowskiParameters r; xja und xka sind die Koordinatenwerte des Objekts j(k) auf den Achsen a(a = 1,2, ... , m) und r ist der Metrik-Parameter (1 < r < .0). Daraus lassen sich die beiden am meisten verwendeten Distanzmaße, die Euklidische Distanz und die City-Block Distanz ableiten:
(1) Euklidische Distanz: Setzt man in die Minkowski-Metrik für r = 2 ein, ergibt sich die Euklid-Distanz
wobei xia und xka die Projektionen der Punkte j und k auf die Dimension a(a = 1,2, ..., m) darstellen. Durch die Euklidische Distanz wird die kürzeste Distanz zwischen zwei Objekten angegeben.
(2) City-Block-Distanz: Setzt man in die Minkowski-Metrik für r = 1 ein, ergibt sich die City-Block-Distanz:
Die Bezeichnung City-Block-Distanz ist aus dem Bild rechteckig angelegter Straßenzüge abgeleitet, in denen die Entfernung von einem Punkt zum anderen nicht durch die in Form der Luftlinie angegebene kürzeste Distanz zwischen zwei Punkten, sondern nur durch Entlangfahren an den Straßenzügen zurückgelegt werden kann. Im angelsächsischen Sprachraum spricht man deshalb auch von der Manhattan-Distanz bzw. der Taxifahrer-Distanz (taxicab metric).
Vorhergehender Fachbegriff: Distanzindex | Nächster Fachbegriff: Distanzpersönlicher Verkauf
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|