Zusammenhangsmaßkennzahlen

Zusammenhangsmaßkennzahlen gelten in der Statistik als statistische Kennzahlen, die
eine Beziehung in Form eines Zusammenhangs zwischen zwei Merkmalen
quantifizieren.

Entscheidend für die Berechnung einer Kennzahl für ein Merkmal
ist die Bestimmung des jeweiligen Skalenniveaus.

Die nachfolgende Tabelle illustriert die Klassifizierung der Kennzahlen durch die
Skalenniveaus:

SkalenniveauNominalOrdinalMetrisch
ZusammenhangsmaßeChi-Quadtrat / KontingenzkoeffizientRangkorrelation nach SpearmanKovarianz ->
Pearson’scher
Korrelationskoeffizient

3.1 Kontingenzkoeffizient

Der Kontingenzkoeffizient K* (nach Karl Pearson) ist ein statistisches Zusammenhangsmaß. Der Pearson‘sche Kontingenzkoeffizient drückt die Stärke des Zusammenhangs zwischen zwei nominalen oder ordinalen Merkmalen aus. Er basiert auf dem Vergleich von tatsächlich ermittelten Häufigkeiten zweier Merkmale mit den Häufigkeiten, die man bei Unabhängigkeit dieser Merkmale erwartet hätte. Die Berechnung in Excel sollte über eine Pivot-Tabelle erfolgen. Damit können die Häufigkeiten zweier Variablen in einer 2-dimensionalen Übersicht erstellt werden. Im ersten Schritt sollte die Berechnung des sog. Chi-Quadrat-Wertes erfolgen. Im zweiten Schritt kann der Kontingenzkoeffizient K* final berechnet und interpretiert werden.

Berechnung des Kontingenzkoeffizienten K*:

Mit vorheriger Berechnung des Assoziationsmaßes Chi-Quadrat:

Interpretation für Kontingenzkoeffizient K* zwischen [0;1]:

Wert (K*)Interpretation
0Kein Zusammenhang
0 – 0,3Schwacher Zusammenhang
0,3 – 0,7Mittlerer Zusammenhang
0,7 – 1Starker Zusammenhang
1Vollständiger Zusammenhang

3.2 Rangkorrelation

Der Rangkorrelationskoeffizient (nach Spearman) ist ein Maß für Korrelationen, um den Zusammenhang zweier ordinal skalierten Variablen zu berechnen. Die Berechnung erfolgt über die Klassifizierung der einzelnen Ränge der Variablen X und Y:

Berechnung in Excel erfolgt über die Formel „=RANG.MITTELW(…; 0 bzw. 1)“ für beide Variablen. Anschließend können die einzelnen Ausprägungen der Ränge von X und Y als Korrelation berechnet werden über die Excel-Formel „=KORREL“ bzw. „=PEARSON“. Alternativ kann auch eine Korrelationsmatrix erstellt werden über die Datenanalysefunktion in Excel.

Interpretation für den Rangkorrelationskoeffizienten: Er kann Werte zwischen -1 und +1 annehmen. Bei einem Wert von +1 bzw. -1 besteht ein vollständig positiver (bzw. negativer) linearer Zusammenhang zwischen den betrachteten Merkmalen. Wenn der Korrelationskoeffizient den Wert 0 aufweist, hängen die beiden Merkmale überhaupt nicht linear voneinander ab.

Wert (rs)Interpretation
– 1Vollständig negativer Zusammenhang
[-0,7] – [-1]Stark negativer Zusammenhang
[-0,3] – [-0,7]Mittlerer negativer Zusammenhang
0 – [-0,3]Schwacher negativer Zusammenhang
0Kein Zusammenhang
0 – 0,3Schwach positiver Zusammenhang
0,3 – 0,7Mittlerer positiver Zusammenhang
0,7 – 1Starker positiver Zusammenhang
1Vollständig positiver Zusammenhang

Der Korrelationskoeffizient, ist eine Zusammenhangsmaßkennzahl für den Grad des linearen Zusammenhangs zwischen zwei mindestens metrisch-skalierten Merkmalen.

Die Korrelation errechnet sich aus der Kovarianz beider Variablen. Berechnung in Excel erfolgt über die Excel-Formel „=KORREL“ bzw. „=PEARSON“. Alternativ kann auch eine Korrelationsmatrix erstellt werden über die Datenanalysefunktion in Excel. Hierzu alle Daten mit Überschrift selektieren. Interpretation für den Pearson’schen Korrelationskoeffizienten:
Wert (rxy)Interpretation
– 1Vollständig negativer Zusammenhang
[-0,7] – [-1]Stark negativer Zusammenhang
[-0,3] – [-0,7]Mittlerer negativer Zusammenhang
0 – [-0,3]Schwacher negativer Zusammenhang
0Kein Zusammenhang
0 – 0,3Schwach positiver Zusammenhang
0,3 – 0,7Mittlerer positiver Zusammenhang
0,7 – 1Starker positiver Zusammenhang
1Vollständig positiver Zusammenhang

Er kann Werte zwischen -1 und +1 annehmen. Bei einem Wert von +1 bzw. -1 besteht
ein vollständig positiver (bzw. negativer) linearer Zusammenhang zwischen den
betrachteten Merkmalen. Wenn der Korrelationskoeffizient den Wert 0 aufweist, hängen
die beiden Merkmale überhaupt nicht linear voneinander ab.