Agglomerative Verfahren der Clusteranalyse ermitteln eine hierarchische Klassifikation nach folgendem Prinzip: Bei vorliegender disjunkter Klassifikation k= {Ki,.. .,KS) (partitionierende Clusteranalyse) werden zwei Klassen K,, KjEK gesucht, die „optimal“ fusioniert werden können. Für einen vorgegebenen Bewertungsindex der Form v(K,L) (Distanzindex) sucht man die Klassen Ki und Kj, für die der Wert v(K;,Kj) minimal wird. Man erhält eine neue disjunkte Klassifikation, wobei die Klassenzahlum 1 reduziert wird. V erfahrens- vananten ergeben sich je nach Festlegung von v (Single Linkage, Complete Linkage, Average Linkage, Ward, Zentroid). Für diese und eine Reihe anderer agglomerativer Verfahren läßt sich die Anpassung der Indizes v bei Fusion zweier Klassen Ki und K2 durch die Lance/Williams-Formel ausdrücken. Offenbar kann man bei diesen Verfahren mit einelementigen Klassen starten. Der Fusionsprozeß kann solange fortgeführt werden, bis sich die gesamte Objektmenge als einzige Klasse ergibt. Zur Interpretation des Ergebnisses wählt man jedoch die Fusionsstufe, in der der Wert v sprunghaft ansteigt (¥ Ellbogenkriterium, Dendrogramm). In der Anwendung sind agglomerative Verfahren den divisiven Verfahren aus Rechengründen vorzuziehen. Ein Optimum wird j edoch nur für j ede einzelne Fusionsstufe erreicht, da erfolgte Zusammenfassungen nicht mehr rückgängig gemacht werden. Es empfiehlt sich, stufenweise Austauschver- fahren anzuwenden.
Vorhergehender Fachbegriff: agglomerativ | Nächster Fachbegriff: Aggregation
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|