Zusammenhangsmaßkennzahlen

Korrelationsmaße sind in der Statistik statistische Kennzahlen, die
eine Beziehung in Form eines Zusammenhangs zwischen zwei Merkmalen beschreiben
quantifizieren.

Entscheidend für die Berechnung eines Zusammenhangsmaßes für ein Merkmal
ist die Festlegung des jeweiligen Skalenniveaus.

Die folgende Tabelle veranschaulicht die Einteilung der Kennzahlen nach den
Skalenniveaus:

SkalenniveauNominalOrdinalMetrisch
ZusammenhangsmaßeChi-Quadtrat / KontingenzkoeffizientRangkorrelation nach SpearmanKovarianz ->
Pearson’scher
Korrelationskoeffizient

Kontingenzkoeffizient

Der Kontingenzkoeffizient K* (nach Karl Pearson) ist ein statistisches Zusammenhangsmaß. Der Kontingenzkoeffizient nach Pearson drückt die Stärke des Zusammenhangs zwischen zwei nominalen oder ordinalen Merkmalen aus. Er beruht auf dem Vergleich der tatsächlich beobachteten Häufigkeiten zweier Merkmale mit den Häufigkeiten, die zu erwarten wären, wenn diese Merkmale unabhängig voneinander wären. Die Berechnung in Excel sollte über eine Pivot-Tabelle erfolgen. Diese ermöglicht es, die Häufigkeiten zweier Variablen in einer 2-dimensionalen Übersicht darzustellen. Im ersten Schritt sollte der sogenannte Chi-Quadrat-Wert berechnet werden. Im zweiten Schritt kann der Kontingenzkoeffizient K* endgültig berechnet und interpretiert werden.

Berechnung des Kontingenzkoeffizienten K*:

Mit vorheriger Berechnung des Assoziationsmaßes Chi-Quadrat:

Interpretation für Kontingenzkoeffizient K* zwischen [0;1]:

Wert (K*)Interpretation
0Kein Zusammenhang
0 – 0,3Schwacher Zusammenhang
0,3 – 0,7Mittlerer Zusammenhang
0,7 – 1Starker Zusammenhang
1Vollständiger Zusammenhang

Rangkorrelation

Der Rangkorrelationskoeffizient (nach Spearman) ist ein Maß für die Korrelation zwischen zwei ordinalskalierten Variablen. Die Berechnung erfolgt durch die Rangfolge der einzelnen Ränge der Variablen X und Y:

Die Berechnung in Excel erfolgt über die Formel „=RANG.MITTELW(…; 0 bzw. 1)“ für beide Variablen. Anschließend können die einzelnen Ausprägungen der Ränge von X und Y als Korrelation über die Excel-Formel „=KORREL“ bzw. „=PEARSON“ berechnet werden. Alternativ kann eine Korrelationsmatrix auch über die Datenanalysefunktion in Excel erstellt werden.

Interpretation des Rangkorrelationskoeffizienten: Der Rangkorrelationskoeffizient kann Werte zwischen -1 und +1 annehmen. Ein Wert von +1 bzw. -1 bedeutet, dass zwischen den betrachteten Merkmalen ein vollständig positiver (bzw. negativer) linearer Zusammenhang besteht. Wenn der Korrelationskoeffizient den Wert 0 annimmt, hängen die beiden Merkmale überhaupt nicht linear voneinander ab.

Wert (rs)Interpretation
– 1Vollständig negativer Zusammenhang
[-0,7] – [-1]Stark negativer Zusammenhang
[-0,3] – [-0,7]Mittlerer negativer Zusammenhang
0 – [-0,3]Schwacher negativer Zusammenhang
0Kein Zusammenhang
0 – 0,3Schwach positiver Zusammenhang
0,3 – 0,7Mittlerer positiver Zusammenhang
0,7 – 1Starker positiver Zusammenhang
1Vollständig positiver Zusammenhang

Der Korrelationskoeffizient, ist eine Zusammenhangsmaßkennzahl für den Grad des linearen Zusammenhangs zwischen zwei mindestens metrisch-skalierten Merkmalen.

Die Korrelation errechnet sich aus der Kovarianz beider Variablen. Berechnung in Excel erfolgt über die Excel-Formel „=KORREL“ bzw. „=PEARSON“. Alternativ kann auch eine Korrelationsmatrix erstellt werden über die Datenanalysefunktion in Excel. Hierzu alle Daten mit Überschrift selektieren. Interpretation für den Pearson’schen Korrelationskoeffizienten:
Wert (rxy)Interpretation
– 1Vollständig negativer Zusammenhang
[-0,7] – [-1]Stark negativer Zusammenhang
[-0,3] – [-0,7]Mittlerer negativer Zusammenhang
0 – [-0,3]Schwacher negativer Zusammenhang
0Kein Zusammenhang
0 – 0,3Schwach positiver Zusammenhang
0,3 – 0,7Mittlerer positiver Zusammenhang
0,7 – 1Starker positiver Zusammenhang
1Vollständig positiver Zusammenhang

Er kann Werte zwischen -1 und +1 annehmen. Bei einem Wert von +1 bzw. -1 besteht
ein vollständig positiver (bzw. negativer) linearer Zusammenhang zwischen den
betrachteten Merkmalen. Wenn der Korrelationskoeffizient den Wert 0 aufweist, hängen
die beiden Merkmale überhaupt nicht linear voneinander ab.

Anwendungsbeispiele und Fallstudien zu Zusammenhangsmaßkennzahlen

Anwendungsbeispiel 1: Marktforschung

  • Situation: Ein Unternehmen möchte den Zusammenhang zwischen Kundenzufriedenheit und Kundenloyalität verstehen.
  • Anwendung: Durch die Anwendung von Zusammenhangsmaßkennzahlen wie dem Pearson-Korrelationskoeffizienten auf Umfragedaten kann das Unternehmen feststellen, wie stark diese beiden Variablen miteinander verbunden sind.
  • Ergebnis: Die Erkenntnisse helfen dem Unternehmen, gezielte Maßnahmen zur Steigerung der Kundenzufriedenheit zu ergreifen, was wiederum die Kundenbindung erhöhen kann.

Anwendungsbeispiel 2: Gesundheitswesen

  • Situation: Forscher untersuchen den Zusammenhang zwischen sportlicher Aktivität und dem allgemeinen Gesundheitszustand.
  • Anwendung: Mittels Spearman-Rangkorrelation analysieren sie Daten aus Gesundheitsbefragungen und Fitness-Trackern.
  • Ergebnis: Eine starke positive Korrelation deutet darauf hin, dass regelmäßige körperliche Aktivität mit einem besseren Gesundheitszustand verbunden ist.

Fallstudie: Bildungssektor

  • Hintergrund: Eine Bildungseinrichtung möchte verstehen, ob es einen Zusammenhang zwischen der Teilnahme an Online-Kursen und den akademischen Leistungen der Studierenden gibt.
  • Methode: Die Einrichtung nutzt Kontingenztabellen und Cramers V, um Daten über Kursbeteiligung und Noten zu analysieren.
  • Schlussfolgerung: Die Analyse könnte aufzeigen, ob die Teilnahme an Online-Kursen signifikant mit besseren Noten korreliert ist, was die zukünftige Gestaltung von Lernprogrammen beeinflussen könnte.