Ziel ist es, Gruppen oder Cluster (v Cluster-analyse) von Objekten durch Linearkombination mehrerer unabhängiger Variablen optimal so zu trennen, dass die Streuung zwischen den Gruppen möglichst groß, die Streuung innerhalb der Gruppen dagegen möglichst klein ist. Anhand der Funktion mit den Variablen lassen sich Objekte bestimmten vordefinierten Gruppen zuordnen.
Methode der Multivariaten Datenanalyse. Sie sucht, im Gegensatz zur Clusteranalyse, nach Merkmalen, durch die sich bereits bekannte Käufergruppen (z. B. BMW- und Mercedes-Fahrer) deutlich voneinander unterscheiden (diskriminieren) lassen.
Das Ziel der Diskriminanzanalyse ist, die Abhängigkeit einer nominalen Variablen von mehreren metrischen Variablen zu unterslichen. Dabei werden aufgrund bestimmter Ausprägungen der nominalen Variablen a priori zwei oder mehrere Gruppen gebildet. Die Diskriminanzanalyse ermittelt nun für diese Gruppen die diskriminatorische Bedeutung der metrischen Variablen. Ein einfaches Beispiel dazu: Ein Hersteller der Marke A möchte wissen, welche Unterschiede zwischen den Käufern der Marke A und den Käufern der Konkurrenzmarke B bestehen. Die nominale Variable ist der Kauf der Marke A oder B, die a priori gebildeten Gruppen sind die Käufer der Marke A bzw. die Käufer der Marke B. Um die Frage des Herstellers beantworten zu können, ist es notwendig, von den Käufern mehrere Daten (wie Einkommen, Alter, verschiedene Einstellungen etc.) zu erheben. Diese Daten stellen die metrischen (unabhängigen) Variablen in der Diskriminanzanalyse dar. Berechnet wird daraus die sog. Diskriminanzfunktion, mit deren Hilfe folgende Fragestellungen beantwortet werden können: Diskriminatorische Bedeutung der unabhängigen Variablen. Beispielsweise könnte damit beantwortet werden, ob im obigen Falle das Einkommen eine höher diskriminatorische Bedeutung für die Markenwahl (A oder b) besitzt als das Alter. Prognose der Gruppenzugehörigkeit. Weiß man von einer Person das Einkommen, das Alter, deren Einstellungen etc., aber nicht ihre Markenpräferenz, so kann man mit Hilfe der Diskriminanzfunktion nun prognostizieren, welche Marke sie wahrscheinlich kaufen wird. Die Diskriminanzanalyse eignet sich also besonders für Problemstellungen, bei denen eine a priori Einteilung der Objekte möglich ist und zusätzlich ausreichend Informationen, eventuell aus früheren Fällen, vorliegen. Ein konkretes Beispiel dazu: Manche Geldinstitute nutzen ihre zurückliegenden Daten von Kreditnehmern (bei denen es ja möglich ist, in »sichere« und »unsichere« Kreditnehmer zu unterscheiden) dazu, um mit Hilfe der Diskriminanzanalyse einen Beurteilungsbogen zur Einstufung der Kreditwürdigkeit eines neuen Antragstellers zu entwickeln.
Die Diskriminanzanalyse ist ein multi-variates Verjähren der Datenanalyse, mit dem Werte einer nominal skalierten abhängigen Variablen durch die Werte zweier oder mehrerer Variablen erklärt bzw. prognostiziert werden können (vgl. Ham-mann/Enchson, 2000, S. 306ff.). Sie dient der Klassifizierung von Objekten und deren Zuordnung zu a priori definierten Teilmengen (Gruppen) der Grundgesamtheit Die Unterschiede zwischen den Teilmengen werden durch die unabhängigen Variablen (Merkmalsausprägungen der Objekte) erklärt. Liegen zwei zu trennende Gruppen vor, spricht man von einfacher, bei mehr als zwei Gruppen von multipler Diskriminanzanalyse. Die Diskriminanzanalyse dient der Beantwortung folgender Problemstellungen (vgl. Backhaus u.a., 2000, S. 146):
- Unterscheiden sich Gruppen signifikant?
- Wie lassen sich die Gruppenunterschiede erklären?
- In welche Gruppe ist ein Objekt, dessen Gruppenzugehörigkeit nicht bekannt ist, auf Grund seiner Merkmalsausprägung einzuordnen?
Eine weitere Anwendungsmöglichkeit der Diskriminanzanalyse ist die Überprüfung der Trennschärfe von Gruppen, die mit Hilfe der Clusteranalyse ermittelt wurden.
umfasst eine Gruppe von Verfahren der multivariaten Analyse. Im einfachsten dis- kriminanzanalytischen Modell, dem Zwei- Gruppen-Fall, geht man von zwei unterschiedlichen Gruppen von Objekten aus, für die jeweils eine Datenmatrix mit den gleichen Variablen gegeben ist. Folgende zwei Fragen stehen im Mittelpunkt: • Gibt es charakteristische Unterschiede zwischen den Objekten der beiden Gruppen und welche Variablen tragen signifikant zur Trennung der Gruppen bei (diskriminierende Variablen) ? • Welcher der beiden Gruppen ist ein neu in die Betrachtung einbezogenes Objekt zuzuordnen (Zuordnungsproblem)? Im statistischen Modell hat die sog. Fishersche Diskriminanzfunktion eine zentrale Bedeutung. Frage 1 wird unter Heranziehung geeigneter Testverfahren (statistische Testverfahren), wie z.B. des Tests nach Hotelling, beantwortet, Frage 2 unter Verwendung der aus der Diskriminanzfunktion berechneten Trennfunktion, in welche die einzelnen Merkmalswerte eingehen. Man unterscheidet die lineare und die nichtlineare Diskriminanzanalyse; weiterhin lässt sich die Diskriminanzanalyse auch auf mehr als zwei Gruppen anwenden. Der hohe Rechenaufwand bei der praktischen Durchführung einer Diskriminanzanalyse stellt heute kein Hindernis für ihre Anwendung mehr dar, da statistische Programmpakete, wie z.B. SAS, SPSS und STATGRA- PHICS, entsprechende Prozeduren enthalten. Literatur: Goldstein, M./Dillon, W. R., Discrete Dis- criminant Analysis, New York u.a. 1978. Flury, B.l Riedu/yl, H., Multivariate Statistics - A Practical Approach, London u.a. 1988. Lachenbruch, RA., Discriminant Analysis, New York 1975.
Vorhergehender Fachbegriff: diskretionäre Wirtschaftspolitik | Nächster Fachbegriff: Diskriminanzanalyse, lineare
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|
|