Zur Beurteilung von Verschiedenheiten von zwei und mehreren Objekten oder Objektklassen verwendet man in der Clusteranalyse unterschiedliche Bewertungsindizes. So bezeichnet man einen Index d(i,j) , der die Verschiedenheit zweier Objekte i und j mißt, als Distanzindex auf Objektpaaren. Dabei fordert man d(i,i) = 0 für alle Objekte und d(i,j) = d(j,i) ä 0 für je zwei Objekte. JDie Eigenschaft „i und j sind ähnlicher als i und j“ wird durch d(i,j) < d(i,j) ausgedrückt. Distanzindizes werden entweder direkt erhoben, indem man Objekte paarweise vergleicht oder sie werden geeignet aus den Merkmalsausprägungen der Objekte berechnet (Clusteranalyse). Sind die Ausprägungen a;k aller Merkmale k bei allen Objekten i mindestens intervallskaliert, so ist
ein sinnvoller Distanzindex. Für p = 1 erhält man die City-Block-Distanz, für p = 2 die euklidische Distanz. Zur Bewertung der Verschiedenheit innerhalb von Objektklassen verwendet man einen Index h mit h(K) < h(L), wenn die Klasse K homogener zusammengesetzt ist als L. Beispiele für h(K) sind
Die Verschiedenheit zwischen zwei elementfremden Klassen wird durchweinen Index v bewertet, wobei v(K,L) < v(K,L)durch ;)K und L sind ähnlicher als K und L“ erklärt wird. Beispiele für v(K,L) sind etwa die bei agglomerativen Clusteranalysen verwendeten Indizes
Zur Bewertung einer Klassifikation K benutzt man einen Index b(ic), bspw.
Für spezielle Wahl von h ergibt sich damit das bekannte Varianzkriterium.
Literatur: Opitz, O., Numerische Taxonomie, Stuttgart 1980.
Vorhergehender Fachbegriff: Distanzhandel (Fernhandel, Überseehandel) | Nächster Fachbegriff: Distanzmasse
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|