Wilcoxon-Test Rechner

Online Berechnung des Vorzeichenrangtests für gepaarte Stichproben

📊 Wilcoxon-Test (Vorzeichenrangtest)

Nichtparametrischer Test für gepaarte Stichproben

📈 Vorher-Werte 💡 Erste Messreihe der gepaarten Stichprobe

📉 Nachher-Werte 💡 Zweite Messreihe der gepaarten Stichprobe

🎯 Dezimalstellen

📝 Beispieldaten

📁 Datei hochladen (optional)

Unterstützte Dateiformate: .txt, .csv (eine Zahl pro Zeile oder kommagetrennt)

📊

Wilcoxon-Test: Prüft, ob sich die Mediane zweier gepaarter Messungen signifikant unterscheiden. Erfordert keine Normalverteilungsannahme.

📊 W-Wert

Teststatistik

📈 p-Wert

Zweiseitig

📏 Anzahl Paare

Gültige Paare

📊 Testergebnis-Interpretation

Geben Sie Ihre gepaarten Messwerte in die beiden Textfelder ein und klicken Sie auf Berechnen. Der Wilcoxon-Test prüft, ob sich die Mediane zweier abhängiger Stichproben signifikant unterscheiden, ohne Normalverteilungsannahmen zu erfordern. Er ist ideal für Vorher-Nachher-Vergleiche und ordinale Daten.

💡 Wilcoxon-Test Definition

\(W = \min(W^+, W^-)\) | Summe der positiven bzw. negativen Ränge der Differenzen

Wilcoxon-Test und nichtparametrische Statistik verstehen

Der Wilcoxon-Test (auch Vorzeichenrangtest oder signed-rank test genannt) ist ein nichtparametrischer Test für gepaarte Stichproben, der als Alternative zum gepaarten t-Test verwendet wird, wenn die Normalverteilungsannahme verletzt ist. Er prüft, ob sich die zentralen Tendenzen (Mediane) zweier abhängiger Gruppen signifikant unterscheiden und ist besonders robust gegenüber Ausreißern und bei ordinalen Daten anwendbar.

📊 Grundprinzip

Rangbasierte Teststatistik:

W = min(W⁺, W⁻)

Minimum der positiven und negativen Rangsummen

📈 Voraussetzungen

• Gepaarte Beobachtungen
• Mindestens ordinales Skalenniveau
• Symmetrische Differenzenverteilung
• Keine Normalverteilungsannahme

🎯 Anwendungen

• Vorher-Nachher-Vergleiche
• Therapiestudien
• Qualitätsprüfung
• Trainingseffekte

⚙️ Vorteile

• Robust gegen Ausreißer
• Keine Verteilungsannahmen
• Für ordinale Daten geeignet
• Hohe statistische Power

Mathematische Grundlagen

📊 Testverfahren Schritt für Schritt

Systematische Durchführung des Wilcoxon-Tests:

\[\text{Schritt 1: Differenzen berechnen}\] \[d_i = x_i - y_i \quad \text{für } i = 1, 2, ..., n\] \[\text{Schritt 2: Nulldifferenzen ausschließen}\] \[\text{Entferne alle } d_i = 0 \text{ aus der Analyse}\] \[\text{Schritt 3: Ränge der Absolutbeträge vergeben}\] \[R_i = \text{Rang}(|d_i|) \text{ mit Durchschnittsrängen bei Bindungen}\] \[\text{Schritt 4: Vorzeichenbehaftete Rangsummen}\] \[W^+ = \sum_{d_i > 0} R_i, \quad W^- = \sum_{d_i < 0} R_i\] \[\text{Schritt 5: Teststatistik}\] \[W = \min(W^+, W^-)\]

🔄 Hypothesen und p-Wert Berechnung

Statistische Hypothesen und Signifikanztest:

\[\text{Nullhypothese: } H_0: \text{Median}(d) = 0\] \[\text{Alternativhypothese (zweiseitig): } H_1: \text{Median}(d) \neq 0\] \[\text{Für kleine Stichproben (n ≤ 25):}\] \[\text{Exakte Verteilung der Teststatistik W}\] \[\text{Für große Stichproben (n > 25):}\] \[\text{Normalapproximation: } Z = \frac{W - \mu_W}{\sigma_W}\] \[\text{wobei } \mu_W = \frac{n(n+1)}{4}, \quad \sigma_W = \sqrt{\frac{n(n+1)(2n+1)}{24}}\] \[\text{p-Wert: } p = 2 \cdot P(Z \leq z_{obs}) \text{ (zweiseitig)}\]

📊 Behandlung von Bindungen (Ties)

Umgang mit gleichen Absolutbeträgen:

\[\text{Bei Bindungen: Durchschnittsränge vergeben}\] \[\text{Beispiel: } |d| = [1, 2, 2, 3] \rightarrow \text{Ränge} = [1, 2.5, 2.5, 4]\] \[\text{Korrektur für Normalapproximation:}\] \[\sigma_W^2 = \frac{n(n+1)(2n+1)}{24} - \frac{1}{48}\sum_{j=1}^g t_j(t_j^2-1)\] \[\text{wobei } t_j \text{ die Anzahl der Bindungen in Gruppe j ist}\] \[\text{Kontinuitätskorrektur bei Normalapproximation:}\] \[Z = \frac{W \pm 0.5 - \mu_W}{\sigma_W}\]

Praktische Berechnungsbeispiele

📝 Beispiel 1: Standard-Berechnung

Aufgabe: Therapieeffekt bei 5 Patienten
Daten: Vorher: [8, 7, 9, 6, 8], Nachher: [6, 5, 7, 5, 6]
Berechnung:

\[\text{Schritt 1: Differenzen}\] \[d = [8-6, 7-5, 9-7, 6-5, 8-6] = [2, 2, 2, 1, 2]\] \[\text{Schritt 2: Keine Nulldifferenzen vorhanden}\] \[\text{Schritt 3: Absolutbeträge und Ränge}\] \[|d| = [2, 2, 2, 1, 2] \rightarrow \text{Ränge} = [3, 3, 3, 1, 3]\] \[\text{(Durchschnittsränge: Rang 1 für |d|=1, Ränge 2,3,4,5 für |d|=2 → Ø=3.5, gerundet 3)}\] \[\text{Schritt 4: Alle Differenzen positiv}\] \[W^+ = 3+3+3+1+3 = 13, \quad W^- = 0\] \[\text{Schritt 5: Teststatistik}\] \[W = \min(13, 0) = 0\] \[\text{Schritt 6: p-Wert (exakt für n=5)}\] \[p \approx 0.0625 \text{ (nicht signifikant bei α=0.05)}\]

Interpretation: Kein signifikanter Unterschied zwischen Vorher und Nachher

📝 Beispiel 2: Größere Stichprobe mit Normalapproximation

Aufgabe: Trainingsprogramm mit 12 Teilnehmern
Daten: Signifikante Verbesserungen bei den meisten Teilnehmern
Berechnung:

\[\text{Angenommen: n = 12, W = 15 (beobachtet)}\] \[\text{Erwartungswert: } \mu_W = \frac{12 \cdot 13}{4} = 39\] \[\text{Standardabweichung: } \sigma_W = \sqrt{\frac{12 \cdot 13 \cdot 25}{24}} = \sqrt{162.5} \approx 12.75\] \[\text{Z-Statistik: } Z = \frac{15 + 0.5 - 39}{12.75} = \frac{-23.5}{12.75} \approx -1.84\] \[\text{p-Wert (zweiseitig): } p = 2 \cdot P(Z \leq -1.84) \approx 2 \cdot 0.033 = 0.066\]

Ergebnis: Grenzwertig signifikant (p=0.066 > 0.05, aber < 0.10)

📝 Beispiel 3: Umgang mit Bindungen

Aufgabe: Daten mit gleichen Differenzen
Daten: Differenzen: [-2, -1, 0, 1, 1, 2, 2, 3]
Berechnung:

\[\text{Schritt 1: Nulldifferenzen entfernen}\] \[d = [-2, -1, 1, 1, 2, 2, 3] \quad (n = 7)\] \[\text{Schritt 2: Absolutbeträge}\] \[|d| = [2, 1, 1, 1, 2, 2, 3]\] \[\text{Schritt 3: Ränge mit Bindungen}\] \[\text{Rang 1: nicht vergeben, Ränge 2,3,4 für |d|=1 → Ø=3}\] \[\text{Ränge 5,6,7 für |d|=2 → Ø=6, Rang 8 für |d|=3}\] \[\text{Ränge: } [6, 3, 3, 3, 6, 6, 8]\] \[\text{Schritt 4: Vorzeichenbehaftete Rangsummen}\] \[W^+ = 3+3+6+6+8 = 26, \quad W^- = 6+3 = 9\] \[W = \min(26, 9) = 9\]

Wichtig: Bindungen reduzieren die statistische Power des Tests

Anwendungen in verschiedenen Bereichen

🏥 Medizin & Gesundheit

• Therapiestudien (Vorher-Nachher)
• Medikamentenwirkung
• Schmerzskala-Bewertungen
• Rehabilitationseffekte

🎓 Bildung & Training

• Lernfortschritte
• Trainingseffekte
• Kompetenztests
• Skill-Development

🏭 Qualitätskontrolle

• Prozessverbesserungen
• Vor-/Nach-Implementierung
• Produktqualität
• Methodenvergleiche

🧠 Psychologie & Sozialwissenschaften

• Interventionsstudien
• Verhaltensmessungen
• Likert-Skalen
• Einstellungsänderungen

Erweiterte Konzepte und Alternativen

📊 Effektstärke und praktische Bedeutsamkeit

Berechnung der Effektstärke für den Wilcoxon-Test:

\[\text{Rangkorrelation als Effektstärke:}\] \[r = \frac{Z}{\sqrt{n}} \quad \text{(bei Normalapproximation)}\] \[\text{Interpretation nach Cohen:}\] \[|r| = 0.1 \text{ (kleiner Effekt)}, \quad |r| = 0.3 \text{ (mittlerer Effekt)}, \quad |r| = 0.5 \text{ (großer Effekt)}\] \[\text{Pseudo-Median als Lageparameter:}\] \[\text{Hodges-Lehmann Schätzer: Median aller paarweisen Mittelwerte}\] \[\tilde{\Delta} = \text{median}\left\{\frac{d_i + d_j}{2} : i \leq j\right\}\]

🎯 Verwandte Tests und Alternativen

Andere nichtparametrische Tests für gepaarte Daten:

\[\text{Vorzeichentest (Sign Test):}\] \[\text{Einfacher, aber weniger mächtig als Wilcoxon-Test}\] \[\text{Nur Vorzeichen der Differenzen, keine Ränge}\] \[\text{McNemar-Test:}\] \[\text{Für kategoriale Daten (2×2 Kontingenztafeln)}\] \[\text{Gepaarter t-Test:}\] \[\text{Parametrische Alternative bei normalverteilten Differenzen}\] \[\text{Bootstrap-Verfahren:}\] \[\text{Moderne computerintensive Alternative}\]

📈 Power und Stichprobenumfang

Planung der Stichprobengröße für den Wilcoxon-Test:

\[\text{Asymptotische relative Effizienz (ARE):}\] \[\text{ARE}_{Wilcoxon,t-Test} = \frac{3}{\pi} \approx 0.955 \text{ (bei Normalverteilung)}\] \[\text{Für andere Verteilungen oft höhere Effizienz}\] \[\text{Faustregeln für Mindeststichprobengröße:}\] \[n \geq 6 \text{ für exakte Tests}\] \[n \geq 25 \text{ für Normalapproximation}\] \[\text{Power-Berechnung schwieriger als bei parametrischen Tests}\]

Computational Aspects

💻 Software-Implementierungen

Wilcoxon-Test in verschiedenen Statistikprogrammen:

R:
wilcox.test(x, y, paired = TRUE) # Gepaarter Test
wilcox.test(x, y, paired = TRUE, exact = TRUE) # Exakter Test
coin::wilcoxsign_test(y ~ x | block) # Moderne Implementierung

Python (SciPy):
from scipy import stats
stats.wilcoxon(x, y, alternative='two-sided') # Gepaarter Test
stats.wilcoxon(differences) # Direkt mit Differenzen

SPSS: NPAR TESTS WILCOXON
SAS: PROC NPAR1WAY WILCOXON

💡 Praktische Tipps und Fallstricke

Wichtige Hinweise für die korrekte Anwendung:

\[\text{1. Prüfung der Voraussetzungen:}\] \[\text{Gepaartheit der Daten, ordinales Skalenniveau}\] \[\text{2. Umgang mit Nulldifferenzen:}\] \[\text{Standardmäßig ausschließen, alternative Ansätze verfügbar}\] \[\text{3. Interpretation der Effektrichtung:}\] \[\text{Zusätzlich zu p-Wert: Vorzeichen der Mediansdifferenz}\] \[\text{4. Bei vielen Bindungen:}\] \[\text{Exakter Test oder robuste Alternativen erwägen}\] \[\text{5. Konfidenzintervalle:}\] \[\text{Hodges-Lehmann Schätzer für Mediansdifferenz}\]

💡 Wichtige Eigenschaften des Wilcoxon-Tests:

Robustheit: Unempfindlich gegen Ausreißer und schiefe Verteilungen
Verteilungsfrei: Keine Normalverteilungsannahme erforderlich
Hohe Power: Effizient bei nicht-normalverteilten Daten
Flexibilität: Anwendbar auf ordinale und metrische Daten

📊 Wann Wilcoxon-Test verwenden:

Gepaarte Daten: Vorher-Nachher-Messungen oder matched pairs
Ordinale Daten: Rangdaten oder Likert-Skalen
Nicht-normale Verteilung: Alternative zum gepaarten t-Test
Kleine Stichproben: Robust auch bei wenigen Beobachtungen

Lageparameter

Arithmetisches-Mittel, Durchschnitt
Geometrisches Mittel
Harmonisches Mittel
Kontraharmonisches Mittel
Log-Geometrisches Mittel
Median
Modus
Minimum und Maximum
Perzentile
Oberes Quartil
Unteres Quartil
Quantile

Streuungsmaße

Kurtosis
Skewness (Statistische Schiefe)
Standardabweichung
Gepoolte Standardabweichungl
Varianz
Gepoolte Varianz
Spannweite
Interquartilsabstand (IQR)

Korrelation & Zusammenhang

Kovarianz
Korrelationskoeffizient (Pearson, Spearman)
Rangkorrelation

Verteilungsfunktionen

Empirische inverse Verteilungsfunktion CDF
Empirische Verteilungsfunktion CDF
Five-Number Summary

Test & Schätzungen

T-Test (einfach)
Chi-Quadrat-Test
Wilcoxon-Test

Spezielle Verteilungen:

Normalverteilung
Binomialverteilung
Poisson-Verteilung
Exponentialverteilung

Risiko & Wahrscheinlichkeit

Geburtstagsparadoxon
Satz von Bayes