(AID-Verfahren): Abk Automatic Interaction Detector Ein aus der Sozialforschung in die Marktforschung übernommenes Verfahren der multivariaten Datenanalyse, mit dessen Hilfe bei umfangreichen Datenkombinationen diejenige(n) Variable(n) bestimmt werden soll(en), die das beste Unterscheidungsmerkmal und damit die beste Aufteilung in bezug auf eine abhängige Variable in jeweils zwei Segmente ermöglicht.
Es wird damit also eine große Stichprobe in homogene Unterstichproben aufgeteilt, deren Mittel sich hinsichtlich der Kriteriumsvariablen stark voneinander unterscheiden.
Bei der Segmentation erfolgt die Unterteilung der Grundgesamtheit sukzessive jeweils anhand derjenigen unabhängigen Variablen, die zu Segmenten mit möglichst großer Intragruppenhomogenität und Intergruppenheterogenität bezüglich der Ausprägungen des Außenkriteriums führt. Der Aufspaltung liegt das Bestreben zugrunde, durch die Gruppierung einen möglichst hohen Varianzanteil der abhängigen Variablen zu erklären. Es handelt sich damit um eine Methode zur Erklärung einer abhängigen, metrischen oder in Prozentsätze transformierten dichotomen Variablen durch mehrere unabhängige, dichotomisierte Variablen. Die Segmentationsanalyse setzt also voraus, dass ein Außenkriterium definiert wird: Dabei handelt es sich in der Regel um ein alternatives Merkmal. Mitunter kann allerdings auch ein kontinuierliches Merkmal vorgegeben werden, das dann zu Klassen zusammengefaßt wird;
· aktive Variablen bestimmt werden, anhand deren die Bildung der Segmente erfolgt;
· und schließlich passive Variablen vorgegeben werden. Sind die Segmente gebildet, werden sie als Gruppen gegen die passiven Merkmale gezählt, um zu prüfen, wieweit sie sich in diesen Merkmalen unterscheiden. Passiv heißen die Variablen, weil sie den Prozess der Segmentation nicht beeinflussen können. Sie geben lediglich für die Endsegmente an, wie die prozentuale Verteilung aus dieser Variablen aussieht.
Der Automatic Interaction Detector ist eines von mehreren Verfahren zur Prüfung, welche Variable die stärkste Spreizung hinsichtlich des Außenkriteriums leistet.
Das Verfahren wurde in der amerikanischen Marketingliteratur unter der Bezeichnung seines Software-Programms AID (Automatic Interaction Detector) bekannt. Es hat inzwischen mehrere Phasen durchlaufen, angefangen von AID I, II, Ill bis zur jüngsten Version, die 1971 unter dem Namen “Searching for Structure” publiziert wurde. Das Verfahren ermöglicht es, auf induktivem Wege folgende Probleme zu lösen:
· Die Bestimmung der entscheidenden unabhängigen Variablen;
· Die Gewinnung eines besseren Verständnisses der Beziehungen zwischen den unabhängigen Variablen (der Interaktionen).
· Die Findung verschiedener Marktsegmente, die ein voneinander verschiedenes Durchschnittsverhalten aufweisen.
Das Programm AID teilt die Stichprobe durch eine Serie von binären Splits in einander ausschließende Gruppen, die im Hinblick auf die abhängige Variable am homogensten sind. Die Homogenität eines Segments wird durch die Summe der quadrierten Differenzen zwischen der Ausprägung der abhängigen Variablen bei jedem Individuum und der Varianz gemessen. Je kleiner die Varianz, desto größer ist die Homogenität der Gruppe. Ausgangsbasis ist aus rechentechnischen Gründen nicht die Varianz, sondern die Quadratsumme QS. Zerlegt man die Stichprobe in zwei Gruppen (k = 1, 2) vom Umfang j = 1, ..., nk, so ergibt sich für die Quadratsumme der gesamten Stichprobe (QSgesamt):
Die OS es läßt sich vollständig in eine gruppeninterne Q9S (QS innerhalb der Gruppen) und eine externe QS (QS zwischen den Gruppen) zerlegen, was sich leicht nachweisen läßt, indem man die Formel um die Gruppenmittelwerte xk erweitert:
Zieht man ein Merkmal zur Aufspaltung der Gesamtstichprobe in zwei Untergruppen heran, so kann die QS,, als die durch die Spreizung der Stichprobe nicht erklärte OS und QS” als die durch die Spreizung erklärte QS betrachtet werden. Der Anteil der erklärten Varianz folgt damit aus Ziel der Analyse ist es, zunächst das Merkmal zur Spreizung heranzuziehen, das die erklärte Quadratsumme maximiert:
Erweitert man das Modell um zusätzliche Variablen, so ist in jeder Stufe auch für die anderen Variablen eine Dichotomisierung und QS-Berechnung der Splits erforderlich. Aus der Gesamtheit der Variablen wird jene und hierbei wie-denim die Aufteilung gewählt, die die QSe. maximiert. Als Ergebnis erhält man einen Kontrastgruppenbaum.
Das Verfahren wurde von James N. Morgan und John. A. Sonquist an der University of Michigan entwickelt und wird häufig auch als Baumanalyse (tree analysis) bezeichnet.
Vorhergehender Fachbegriff: AICPA | Nächster Fachbegriff: AID-Technik
Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken
|
|