Gepaarter Wilcoxon-Vorzeichen-Rang-Test Rechner
Berechnen Sie den Teststatistik und p-Wert für gepaarte Daten. Wählen Sie als Eingabemethode entweder manuelle Dateneingabe oder CSV/Excel Upload. Die Daten sollten in zwei Spalten (Datenreihe 1 und Datenreihe 2) vorliegen.
Hinweis: Die Werte können durch Komma, Semikolon, Leerzeichen oder Zeilenumbruch getrennt werden.
Hier findest du eine ausführliche Anleitung und Interpretationshilfe zum Gepaarter Wilcoxon-Vorzeichen-Rang-Test Rechner. Der Wilcoxon-Test wird hier als nicht-parametrische Alternative zum gepaarten t-Test verwendet, wenn die Normalverteilungsannahme für die Differenzen zwischen gepaarten Messwerten nicht (oder nur unsicher) erfüllt ist.
1. Grundidee des Wilcoxon-Vorzeichen-Rang-Tests (gepaart)
- Fragestellung: Unterscheiden sich die Werte von zwei gepaarten Messungen (z. B. vorher/nachher, zwei Messmethoden am gleichen Objekt, linker/rechter Arm etc.) systematisch in ihrer zentralen Tendenz?
- Gepaarte Daten bedeuten, dass jede Beobachtung im Datensatz 1 einem eindeutigen Gegenstück im Datensatz 2 entspricht.
Null- und Alternativhypothese
- Nullhypothese (H₀): Die Verteilung der gepaarten Differenzen ist symmetrisch um 0; mit anderen Worten, es gibt keinen systematischen Unterschied zwischen beiden Messreihen.
- Alternativhypothese (H₁): Es liegt ein systematischer Unterschied vor (je nach Testausrichtung „≠“, „<“ oder „>“ 0).
Warum ein Wilcoxon-Vorzeichen-Rang-Test?
- Nicht-parametrisch: Der Test macht keine Annahme über die Verteilung (z. B. Normalverteilung) der gepaarten Differenzen.
- Ordnung statt Mittelwerte: Er betrachtet die Ränge der absoluten Differenzen und deren Vorzeichen.
2. Aufbau des Rechners
Du kannst zwischen zwei Eingabemethoden wählen, um deine gepaarten Daten einzugeben:
- Manuelle Dateneingabe:
- Zwei Textfelder, je eines für Datenreihe 1 und Datenreihe 2.
- Werte können durch Komma, Semikolon, Leerzeichen oder Zeilenumbruch getrennt sein.
- CSV/Excel Upload:
- Datei mit mindestens zwei Spalten hochladen.
- Erste Spalte = Datenreihe 1, zweite Spalte = Datenreihe 2.
- Der Rechner liest alle Zahlenpaare ein und ordnet sie automatisch der ersten bzw. zweiten Datenreihe zu.
Zusätzlich legst du das Signifikanzniveau (α) und die Testart (zweiseitig, einseitig links/rechts) fest.
3. Schritt-für-Schritt-Anleitung
3.1. Eingabemethode auswählen
- Unter „Eingabemethode“:
- Manuelle Dateneingabe (Standard): Du kopierst/fügst die Daten in zwei Textfelder ein.
- CSV/Excel Upload: Du wählst eine Datei aus, die mindestens zwei Spalten mit Zahlen enthält.
3.2. Daten eingeben
- Bei manueller Eingabe:
- Fülle das Textfeld „Datenreihe 1“ und das Textfeld „Datenreihe 2“ aus.
- Achte darauf, dass beide Reihen gleich viele Werte enthalten.
- Bei CSV/Excel Upload:
- Lade eine Datei hoch, in der mindestens zwei Spalten enthalten sind.
- Im Skript werden nur die erste und zweite Spalte berücksichtigt.
- Nach dem Upload liest der Rechner die Datenpaare automatisch ein.
3.3. Signifikanzniveau und Testart einstellen
- Gib dein gewünschtes Signifikanzniveau (α) ein (z. B. 0,05).
- Wähle unter „Testart“:
- Zweiseitig (≠): Du prüfst, ob sich die zentralen Tendenzen der beiden gepaarten Messungen in irgendeiner Richtung unterscheiden.
- Einseitig links (<): Du prüfst, ob Datenreihe 1 im Median kleiner ist als Datenreihe 2.
- Einseitig rechts (>): Du prüfst, ob Datenreihe 1 im Median größer ist als Datenreihe 2.
(Tipp: In der Praxis wird meistens der zweiseitige Test verwendet, um allgemein eine Abweichung festzustellen.)
3.4. Berechnung starten
- Klicke auf Berechnen.
- Der Rechner ermittelt automatisch:
- Die Differenzen (di=x1i−x2i)(d_i = x_{1i} – x_{2i}) zwischen den Paaren (bzw. je nach Skriptkonvention)
- Schließt alle Paare mit Differenz = 0 aus.
- Sortiert die absoluten Differenzen und weist Ränge zu.
- Summiert die Ränge für positive und negative Differenzen. (Ergebnis: W+W^+ und W−W^-)
- Verwendet eine Normalapproximation für größere Stichproben (inkl. Kontinuitätskorrektur).
- Gibt den berechneten z-Wert, den p-Wert, sowie den kritischen Wert und den Rejektionsbereich aus.
4. Interpretation der Ergebnisse
Nach Klick auf Berechnen erhältst du unter anderem:
- z-Wert
- Der Testverlauf nutzt eine Normalapproximation auf Basis der Wilcoxon-Verteilung (für größere Stichproben).
- Bei sehr kleinen Stichproben sollte man ggf. Tabellenwerte benutzen oder eine exakte Berechnung vornehmen. Der Rechner wendet standardmäßig die Approximation an.
- p-Wert
- Die Wahrscheinlichkeit, unter Annahme von H₀, mindestens so extreme Rangunterschiede zu beobachten.
- p < α → Statistisch signifikantes Ergebnis (H₀ ablehnen).
- p ≥ α → Keine ausreichende Evidenz, um H₀ abzulehnen.
- W⁺ (Summe der positiven Ränge) und W⁻ (Summe der negativen Ränge)
- Diese Summen verdeutlichen, ob und wie stark sich Datenreihe 1 von Datenreihe 2 unterscheidet.
- Bei einem zweiseitigen Test ist insbesondere die kleinere der beiden Summen relevant als Teststatistik. Im Rechner wird über W+W^+ (oder W−W^-) in eine z-Wert-Berechnung überführt.
- Anzahl der berücksichtigten Paare (n)
- Falls einige Differenzen = 0 waren, kann nn geringer sein als die ursprüngliche Stichprobengröße.
- Kritischer Wert und Rejektionsbereich
- Grenzt ab, ob der z-Wert (bzw. die Wilcoxon-Statistik) in den Bereich fällt, in dem du H₀ ablehnst.
- Entscheidung
- „Ablehnung der Nullhypothese (H₀)“: Bedeutet, die Daten sprechen dafür, dass ein systematischer Unterschied (zweiseitig) bzw. eine einseitige Abweichung existiert.
- „Keine ausreichenden Beweise, um H₀ abzulehnen“: Die Daten liefern keine ausreichende Evidenz für einen Unterschied, was nicht automatisch heißt, dass kein Unterschied existiert – nur, dass er statistisch nicht signifikant nachgewiesen werden kann.
5. Beispiele
Beispiel 1: Zweiseitiger Test
- Datenreihe 1 (Vorher): 5, 7, 6, 8
- Datenreihe 2 (Nachher): 4, 6, 5, 7
- α = 0,05
- Ziel: Gibt es einen zweiseitigen Unterschied zwischen Vorher- und Nachherwerten?
Mögliche Ergebnisse (fiktives Beispiel):
- W+=10.0W^+ = 10.0, W−=0.0W^- = 0.0
- z-Wert: 2.04
- p-Wert: 0.041 (zweiseitig)
- Entscheidung: p (0.041) < α (0.05) ⇒ Ablehnung von H₀
- Interpretation: Die Nachher-Werte sind im Median niedriger als die Vorher-Werte (positiver Rang für Vorher – Nachher).
Beispiel 2: Einseitiger Rechts-Test
- Datenreihe 1: 50, 52, 55, 60
- Datenreihe 2: 48, 49, 54, 58
- α = 0,05
- Ziel: Prüfen, ob Datenreihe 1 größer ist als Datenreihe 2 (einseitig rechts).
Mögliche Ergebnisse (fiktives Beispiel):
- W+=8.0W^+ = 8.0, W−=2.0W^- = 2.0
- z-Wert: 1.85
- p-Wert: 0.032 (einseitig)
- Entscheidung: p (0.032) < α (0.05) ⇒ Ablehnung von H₀
- Interpretation: Die Daten stützen die Vermutung, dass Datenreihe 1 im Median höher liegt als Datenreihe 2.
6. Praktische Hinweise
- Gültigkeit: Der gepaarte Wilcoxon-Test ist ein Rangtest, der keine Normalverteilung der Differenzen voraussetzt. Trotzdem sollten gewisse Voraussetzungen erfüllt sein:
- Paardesign: Jede Beobachtung in Reihe 1 passt eindeutig zu einer Beobachtung in Reihe 2.
- Unterschiede sind unabhängig voneinander.
- Stichprobengröße:
- Für sehr kleine n kann die Normalapproximation ungenau sein. Dann sind exakte Methoden besser.
- Für n > 20 ist die Normalapproximation meist vernünftig.
- Ausreißer:
- Da es sich um einen Rangtest handelt, ist er robuster gegen Ausreißer als ein t-Test, allerdings können große Ausreißer immer noch Einfluss haben.
- Einseitig vs. Zweiseitig:
- Einseitig links: Du erwartest, dass Datenreihe 1 kleiner ist als Datenreihe 2.
- Einseitig rechts: Du erwartest, dass Datenreihe 1 größer ist als Datenreihe 2.
- Zweiseitig: Du weißt nicht in welche Richtung die Abweichung geht (oder bist an beiden Richtungen interessiert).
7. Zusammenfassung
- Eingabe: Wähle, ob du deine Daten manuell oder via CSV/Excel eingibst. Achte auf gleiche Anzahl an Werten in beiden Reihen.
- Berechnung: Der Rechner erstellt Ränge der absoluten Differenzen, summiert positive und negative Ränge und nähert die Wilcoxon-Verteilung über die Normalverteilung an.
- Ergebnis: Du bekommst einen z-Wert, p-Wert, sowie kritische Werte und eine Aussage, ob H₀ abgelehnt oder nicht abgelehnt wird.
- Interpretation:
- p < α → statistisch signifikanter Unterschied (H₀ ablehnen).
- p ≥ α → keine ausreichende Evidenz gegen H₀.
Somit hast du eine nicht-parametrische Methode, um gepaarte Daten auf systematische Unterschiede zu prüfen, ohne dich ausschließlich auf die Normalverteilungsannahme verlassen zu müssen.