Wilcoxon-Test Rechner
Online Berechnung des Vorzeichenrangtests für gepaarte Stichproben
Geben Sie Ihre gepaarten Messwerte in die beiden Textfelder ein und klicken Sie auf Berechnen. Der Wilcoxon-Test prüft, ob sich die Mediane zweier abhängiger Stichproben signifikant unterscheiden, ohne Normalverteilungsannahmen zu erfordern. Er ist ideal für Vorher-Nachher-Vergleiche und ordinale Daten.
💡 Wilcoxon-Test Definition
\(W = \min(W^+, W^-)\) | Summe der positiven bzw. negativen Ränge der Differenzen
Wilcoxon-Test und nichtparametrische Statistik verstehen
Der Wilcoxon-Test (auch Vorzeichenrangtest oder signed-rank test genannt) ist ein nichtparametrischer Test für gepaarte Stichproben, der als Alternative zum gepaarten t-Test verwendet wird, wenn die Normalverteilungsannahme verletzt ist. Er prüft, ob sich die zentralen Tendenzen (Mediane) zweier abhängiger Gruppen signifikant unterscheiden und ist besonders robust gegenüber Ausreißern und bei ordinalen Daten anwendbar.
📊 Grundprinzip
Rangbasierte Teststatistik:
📈 Voraussetzungen
- • Gepaarte Beobachtungen
- • Mindestens ordinales Skalenniveau
- • Symmetrische Differenzenverteilung
- • Keine Normalverteilungsannahme
🎯 Anwendungen
- • Vorher-Nachher-Vergleiche
- • Therapiestudien
- • Qualitätsprüfung
- • Trainingseffekte
⚙️ Vorteile
- • Robust gegen Ausreißer
- • Keine Verteilungsannahmen
- • Für ordinale Daten geeignet
- • Hohe statistische Power
Mathematische Grundlagen
📊 Testverfahren Schritt für Schritt
Systematische Durchführung des Wilcoxon-Tests:
\[\text{Schritt 1: Differenzen berechnen}\] \[d_i = x_i - y_i \quad \text{für } i = 1, 2, ..., n\] \[\text{Schritt 2: Nulldifferenzen ausschließen}\] \[\text{Entferne alle } d_i = 0 \text{ aus der Analyse}\] \[\text{Schritt 3: Ränge der Absolutbeträge vergeben}\] \[R_i = \text{Rang}(|d_i|) \text{ mit Durchschnittsrängen bei Bindungen}\] \[\text{Schritt 4: Vorzeichenbehaftete Rangsummen}\] \[W^+ = \sum_{d_i > 0} R_i, \quad W^- = \sum_{d_i < 0} R_i\] \[\text{Schritt 5: Teststatistik}\] \[W = \min(W^+, W^-)\]
🔄 Hypothesen und p-Wert Berechnung
Statistische Hypothesen und Signifikanztest:
\[\text{Nullhypothese: } H_0: \text{Median}(d) = 0\] \[\text{Alternativhypothese (zweiseitig): } H_1: \text{Median}(d) \neq 0\] \[\text{Für kleine Stichproben (n ≤ 25):}\] \[\text{Exakte Verteilung der Teststatistik W}\] \[\text{Für große Stichproben (n > 25):}\] \[\text{Normalapproximation: } Z = \frac{W - \mu_W}{\sigma_W}\] \[\text{wobei } \mu_W = \frac{n(n+1)}{4}, \quad \sigma_W = \sqrt{\frac{n(n+1)(2n+1)}{24}}\] \[\text{p-Wert: } p = 2 \cdot P(Z \leq z_{obs}) \text{ (zweiseitig)}\]
📊 Behandlung von Bindungen (Ties)
Umgang mit gleichen Absolutbeträgen:
\[\text{Bei Bindungen: Durchschnittsränge vergeben}\] \[\text{Beispiel: } |d| = [1, 2, 2, 3] \rightarrow \text{Ränge} = [1, 2.5, 2.5, 4]\] \[\text{Korrektur für Normalapproximation:}\] \[\sigma_W^2 = \frac{n(n+1)(2n+1)}{24} - \frac{1}{48}\sum_{j=1}^g t_j(t_j^2-1)\] \[\text{wobei } t_j \text{ die Anzahl der Bindungen in Gruppe j ist}\] \[\text{Kontinuitätskorrektur bei Normalapproximation:}\] \[Z = \frac{W \pm 0.5 - \mu_W}{\sigma_W}\]
Praktische Berechnungsbeispiele
📝 Beispiel 1: Standard-Berechnung
Aufgabe: Therapieeffekt bei 5 Patienten
Daten: Vorher: [8, 7, 9, 6, 8], Nachher: [6, 5, 7, 5, 6]
Berechnung:
\[\text{Schritt 1: Differenzen}\] \[d = [8-6, 7-5, 9-7, 6-5, 8-6] = [2, 2, 2, 1, 2]\] \[\text{Schritt 2: Keine Nulldifferenzen vorhanden}\] \[\text{Schritt 3: Absolutbeträge und Ränge}\] \[|d| = [2, 2, 2, 1, 2] \rightarrow \text{Ränge} = [3, 3, 3, 1, 3]\] \[\text{(Durchschnittsränge: Rang 1 für |d|=1, Ränge 2,3,4,5 für |d|=2 → Ø=3.5, gerundet 3)}\] \[\text{Schritt 4: Alle Differenzen positiv}\] \[W^+ = 3+3+3+1+3 = 13, \quad W^- = 0\] \[\text{Schritt 5: Teststatistik}\] \[W = \min(13, 0) = 0\] \[\text{Schritt 6: p-Wert (exakt für n=5)}\] \[p \approx 0.0625 \text{ (nicht signifikant bei α=0.05)}\]
Interpretation: Kein signifikanter Unterschied zwischen Vorher und Nachher
📝 Beispiel 2: Größere Stichprobe mit Normalapproximation
Aufgabe: Trainingsprogramm mit 12 Teilnehmern
Daten: Signifikante Verbesserungen bei den meisten Teilnehmern
Berechnung:
\[\text{Angenommen: n = 12, W = 15 (beobachtet)}\] \[\text{Erwartungswert: } \mu_W = \frac{12 \cdot 13}{4} = 39\] \[\text{Standardabweichung: } \sigma_W = \sqrt{\frac{12 \cdot 13 \cdot 25}{24}} = \sqrt{162.5} \approx 12.75\] \[\text{Z-Statistik: } Z = \frac{15 + 0.5 - 39}{12.75} = \frac{-23.5}{12.75} \approx -1.84\] \[\text{p-Wert (zweiseitig): } p = 2 \cdot P(Z \leq -1.84) \approx 2 \cdot 0.033 = 0.066\]
Ergebnis: Grenzwertig signifikant (p=0.066 > 0.05, aber < 0.10)
📝 Beispiel 3: Umgang mit Bindungen
Aufgabe: Daten mit gleichen Differenzen
Daten: Differenzen: [-2, -1, 0, 1, 1, 2, 2, 3]
Berechnung:
\[\text{Schritt 1: Nulldifferenzen entfernen}\] \[d = [-2, -1, 1, 1, 2, 2, 3] \quad (n = 7)\] \[\text{Schritt 2: Absolutbeträge}\] \[|d| = [2, 1, 1, 1, 2, 2, 3]\] \[\text{Schritt 3: Ränge mit Bindungen}\] \[\text{Rang 1: nicht vergeben, Ränge 2,3,4 für |d|=1 → Ø=3}\] \[\text{Ränge 5,6,7 für |d|=2 → Ø=6, Rang 8 für |d|=3}\] \[\text{Ränge: } [6, 3, 3, 3, 6, 6, 8]\] \[\text{Schritt 4: Vorzeichenbehaftete Rangsummen}\] \[W^+ = 3+3+6+6+8 = 26, \quad W^- = 6+3 = 9\] \[W = \min(26, 9) = 9\]
Wichtig: Bindungen reduzieren die statistische Power des Tests
Anwendungen in verschiedenen Bereichen
🏥 Medizin & Gesundheit
- • Therapiestudien (Vorher-Nachher)
- • Medikamentenwirkung
- • Schmerzskala-Bewertungen
- • Rehabilitationseffekte
🎓 Bildung & Training
- • Lernfortschritte
- • Trainingseffekte
- • Kompetenztests
- • Skill-Development
🏭 Qualitätskontrolle
- • Prozessverbesserungen
- • Vor-/Nach-Implementierung
- • Produktqualität
- • Methodenvergleiche
🧠 Psychologie & Sozialwissenschaften
- • Interventionsstudien
- • Verhaltensmessungen
- • Likert-Skalen
- • Einstellungsänderungen
Erweiterte Konzepte und Alternativen
📊 Effektstärke und praktische Bedeutsamkeit
Berechnung der Effektstärke für den Wilcoxon-Test:
\[\text{Rangkorrelation als Effektstärke:}\] \[r = \frac{Z}{\sqrt{n}} \quad \text{(bei Normalapproximation)}\] \[\text{Interpretation nach Cohen:}\] \[|r| = 0.1 \text{ (kleiner Effekt)}, \quad |r| = 0.3 \text{ (mittlerer Effekt)}, \quad |r| = 0.5 \text{ (großer Effekt)}\] \[\text{Pseudo-Median als Lageparameter:}\] \[\text{Hodges-Lehmann Schätzer: Median aller paarweisen Mittelwerte}\] \[\tilde{\Delta} = \text{median}\left\{\frac{d_i + d_j}{2} : i \leq j\right\}\]
🎯 Verwandte Tests und Alternativen
Andere nichtparametrische Tests für gepaarte Daten:
\[\text{Vorzeichentest (Sign Test):}\] \[\text{Einfacher, aber weniger mächtig als Wilcoxon-Test}\] \[\text{Nur Vorzeichen der Differenzen, keine Ränge}\] \[\text{McNemar-Test:}\] \[\text{Für kategoriale Daten (2×2 Kontingenztafeln)}\] \[\text{Gepaarter t-Test:}\] \[\text{Parametrische Alternative bei normalverteilten Differenzen}\] \[\text{Bootstrap-Verfahren:}\] \[\text{Moderne computerintensive Alternative}\]
📈 Power und Stichprobenumfang
Planung der Stichprobengröße für den Wilcoxon-Test:
\[\text{Asymptotische relative Effizienz (ARE):}\] \[\text{ARE}_{Wilcoxon,t-Test} = \frac{3}{\pi} \approx 0.955 \text{ (bei Normalverteilung)}\] \[\text{Für andere Verteilungen oft höhere Effizienz}\] \[\text{Faustregeln für Mindeststichprobengröße:}\] \[n \geq 6 \text{ für exakte Tests}\] \[n \geq 25 \text{ für Normalapproximation}\] \[\text{Power-Berechnung schwieriger als bei parametrischen Tests}\]
Computational Aspects
💻 Software-Implementierungen
Wilcoxon-Test in verschiedenen Statistikprogrammen:
R:
wilcox.test(x, y, paired = TRUE) # Gepaarter Test
wilcox.test(x, y, paired = TRUE, exact = TRUE) # Exakter Test
coin::wilcoxsign_test(y ~ x | block) # Moderne Implementierung
Python (SciPy):
from scipy import stats
stats.wilcoxon(x, y, alternative='two-sided') # Gepaarter Test
stats.wilcoxon(differences) # Direkt mit Differenzen
SPSS: NPAR TESTS WILCOXON
SAS: PROC NPAR1WAY WILCOXON
💡 Praktische Tipps und Fallstricke
Wichtige Hinweise für die korrekte Anwendung:
\[\text{1. Prüfung der Voraussetzungen:}\] \[\text{Gepaartheit der Daten, ordinales Skalenniveau}\] \[\text{2. Umgang mit Nulldifferenzen:}\] \[\text{Standardmäßig ausschließen, alternative Ansätze verfügbar}\] \[\text{3. Interpretation der Effektrichtung:}\] \[\text{Zusätzlich zu p-Wert: Vorzeichen der Mediansdifferenz}\] \[\text{4. Bei vielen Bindungen:}\] \[\text{Exakter Test oder robuste Alternativen erwägen}\] \[\text{5. Konfidenzintervalle:}\] \[\text{Hodges-Lehmann Schätzer für Mediansdifferenz}\]
💡 Wichtige Eigenschaften des Wilcoxon-Tests:
- Robustheit: Unempfindlich gegen Ausreißer und schiefe Verteilungen
- Verteilungsfrei: Keine Normalverteilungsannahme erforderlich
- Hohe Power: Effizient bei nicht-normalverteilten Daten
- Flexibilität: Anwendbar auf ordinale und metrische Daten
📊 Wann Wilcoxon-Test verwenden:
- Gepaarte Daten: Vorher-Nachher-Messungen oder matched pairs
- Ordinale Daten: Rangdaten oder Likert-Skalen
- Nicht-normale Verteilung: Alternative zum gepaarten t-Test
- Kleine Stichproben: Robust auch bei wenigen Beobachtungen
Arithmetisches-Mittel, DurchschnittStreuungsmaße
Geometrisches Mittel
Harmonisches Mittel
Kontraharmonisches Mittel
Log-Geometrisches Mittel
Median
Modus
Minimum und Maximum
Perzentile
Oberes Quartil
Unteres Quartil
Quantile
KurtosisKorrelation & Zusammenhang
Skewness (Statistische Schiefe)
Standardabweichung
Gepoolte Standardabweichungl
Varianz
Gepoolte Varianz
Spannweite
Interquartilsabstand (IQR)
KovarianzVerteilungsfunktionen
Korrelationskoeffizient (Pearson, Spearman)
Rangkorrelation
Empirische inverse Verteilungsfunktion CDFTest & Schätzungen
Empirische Verteilungsfunktion CDF
Five-Number Summary
T-Test (einfach)Spezielle Verteilungen:
Chi-Quadrat-Test
Wilcoxon-Test
NormalverteilungRisiko & Wahrscheinlichkeit
Binomialverteilung
Poisson-Verteilung
Exponentialverteilung
Geburtstagsparadoxon
Satz von Bayes