Chi-Quadrat-Test Rechner

Online Berechnung für Goodness-of-Fit und Unabhängigkeitstests


📊 Chi-Quadrat-Test (χ²)

Goodness-of-Fit Test für Häufigkeitsverteilungen

💡 Empirisch gemessene Häufigkeiten
💡 Theoretisch erwartete Häufigkeiten
📊
Chi-Quadrat-Test: Prüft, ob beobachtete Häufigkeiten signifikant von erwarteten Häufigkeiten abweichen. Beide Datenreihen müssen gleich lang sein.
⚠️ Fehler:

Geben Sie Ihre beobachteten und erwarteten Häufigkeiten in die entsprechenden Textfelder ein und klicken Sie auf Test berechnen. Der Chi-Quadrat-Test prüft, ob die beobachteten Häufigkeiten signifikant von den erwarteten abweichen. Dies ist ein fundamentaler Test in der inferenziellen Statistik für kategoriale Daten.


💡 Chi-Quadrat Teststatistik

\(\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}\)  |  Test auf Übereinstimmung von Häufigkeiten


Chi-Quadrat-Test verstehen

Der Chi-Quadrat-Test (χ²-Test) ist einer der wichtigsten Tests in der Statistik für kategoriale Daten. Er wird verwendet, um zu testen, ob beobachtete Häufigkeiten signifikant von erwarteten Häufigkeiten abweichen (Goodness-of-Fit Test) oder ob zwei kategoriale Variablen unabhängig voneinander sind (Unabhängigkeitstest). Der Test basiert auf der Chi-Quadrat-Verteilung und ist fundamental für viele statistische Anwendungen.

📊 Grundprinzip

Vergleich von Häufigkeiten:

χ² = Σ(O-E)²/E
Quadrierte standardisierte Abweichungen
📈 Testtypen
  • • Goodness-of-Fit Test
  • • Unabhängigkeitstest
  • • Homogenitätstest
  • • Anpassungstest
🎯 Anwendungen
  • • Würfel- und Münztests
  • • Marktforschung
  • • Genetik (Hardy-Weinberg)
  • • Qualitätskontrolle
⚙️ Voraussetzungen
  • • Erwartete Häufigkeit ≥ 5
  • • Unabhängige Beobachtungen
  • • Kategoriale Daten
  • • Ausreichende Stichprobengröße

Mathematische Grundlagen

📊 Chi-Quadrat Teststatistik

Für k Kategorien mit beobachteten (O) und erwarteten (E) Häufigkeiten:

\[\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}\] \[\text{wobei:}\] \[O_i = \text{beobachtete Häufigkeit in Kategorie i}\] \[E_i = \text{erwartete Häufigkeit in Kategorie i}\] \[\text{Freiheitsgrade: } df = k - 1 - p\] \[\text{(p = Anzahl geschätzter Parameter)}\]

🔄 Chi-Quadrat Verteilung

Eigenschaften der χ²-Verteilung:

\[\text{Dichtefunktion: } f(x) = \frac{1}{2^{k/2}\Gamma(k/2)} x^{k/2-1} e^{-x/2}\] \[\text{für } x > 0 \text{ und } k \text{ Freiheitsgrade}\] \[\text{Erwartungswert: } E[\chi^2] = k\] \[\text{Varianz: } \text{Var}[\chi^2] = 2k\] \[\text{Rechtsschiefe Verteilung, nähert sich Normalverteilung für große k}\]

📊 Hypothesentestverfahren

Strukturierte Testdurchführung:

\[\text{1. Hypothesen formulieren:}\] \[H_0: \text{Die beobachteten Häufigkeiten entsprechen den erwarteten}\] \[H_1: \text{Mindestens eine Häufigkeit weicht ab}\] \[\text{2. Signifikanzniveau wählen: } \alpha \text{ (meist 0.05)}\] \[\text{3. Teststatistik berechnen: } \chi^2_{obs}\] \[\text{4. Kritischen Wert bestimmen: } \chi^2_{krit} = \chi^2_{\alpha, df}\] \[\text{5. Entscheidung: } \chi^2_{obs} > \chi^2_{krit} \Rightarrow H_0 \text{ ablehnen}\]

Praktische Berechnungsbeispiele

📝 Beispiel 1: Würfel-Fairness-Test

Aufgabe: Test, ob ein Würfel fair ist
Daten: 100 Würfe mit Ergebnissen 12, 18, 22, 15, 13, 20
Berechnung:

\[\text{Erwartete Häufigkeiten: } E_i = \frac{100}{6} = 16.67 \text{ für alle i}\] \[\text{Chi-Quadrat Berechnung:}\] \[\chi^2 = \frac{(12-16.67)^2}{16.67} + \frac{(18-16.67)^2}{16.67} + ... + \frac{(20-16.67)^2}{16.67}\] \[= 1.31 + 0.11 + 1.70 + 0.17 + 0.81 + 0.67 = 4.77\] \[\text{Freiheitsgrade: } df = 6-1 = 5\] \[\text{p-Wert: } p \approx 0.444\]

Interpretation: p > 0.05 → Würfel ist fair (H₀ nicht ablehnen)

📝 Beispiel 2: Münzwurf-Test

Aufgabe: Test auf faire Münze
Daten: 100 Würfe: 45 Kopf, 55 Zahl
Berechnung:

\[\text{Erwartete Häufigkeiten: } E_{Kopf} = E_{Zahl} = 50\] \[\text{Beobachtete Häufigkeiten: } O_{Kopf} = 45, O_{Zahl} = 55\] \[\chi^2 = \frac{(45-50)^2}{50} + \frac{(55-50)^2}{50} = \frac{25}{50} + \frac{25}{50} = 1.0\] \[\text{Freiheitsgrade: } df = 2-1 = 1\] \[\text{p-Wert: } p \approx 0.317\]

Interpretation: p > 0.05 → Münze ist fair

📝 Beispiel 3: Genetischer Test (Hardy-Weinberg)

Aufgabe: Test auf Hardy-Weinberg-Gleichgewicht
Daten: Genotypen AA: 16, Aa: 48, aa: 36 (n=100)
Analyse:

\[\text{Geschätzte Allelfrequenz: } p = \frac{2 \cdot 16 + 48}{2 \cdot 100} = 0.4\] \[\text{Erwartete Häufigkeiten unter H-W:}\] \[E_{AA} = np^2 = 100 \cdot 0.4^2 = 16\] \[E_{Aa} = 2np(1-p) = 100 \cdot 2 \cdot 0.4 \cdot 0.6 = 48\] \[E_{aa} = n(1-p)^2 = 100 \cdot 0.6^2 = 36\] \[\chi^2 = 0 \text{ (perfekte Übereinstimmung!)}\]

Interpretation: Population ist im Hardy-Weinberg-Gleichgewicht

Verschiedene Chi-Quadrat Tests

📈 Goodness-of-Fit Test
  • • Test gegen theoretische Verteilung
  • • Normalverteilungstest
  • • Gleichverteilungstest
  • • Modellvalidierung
📊 Unabhängigkeitstest
  • • Kontingenztabellen
  • • Assoziationstest
  • • Marktforschung
  • • Medizinische Studien
🎯 Homogenitätstest
  • • Vergleich mehrerer Populationen
  • • Gruppenvergleiche
  • • A/B Testing
  • • Behandlungsvergleiche
📈 McNemar Test
  • • Gepaarte binäre Daten
  • • Vorher-Nachher Vergleiche
  • • Matched-Pairs Design
  • • 2×2 Kontingenztabellen

Erweiterte Konzepte

📊 Effektgrößen

Maße für die praktische Bedeutsamkeit:

\[\text{Cramér's V: } V = \sqrt{\frac{\chi^2}{n \cdot \min(r-1, c-1)}}\] \[\text{Phi-Koeffizient (2×2 Tabellen): } \phi = \sqrt{\frac{\chi^2}{n}}\] \[\text{Kontingenzkoeffizient: } C = \sqrt{\frac{\chi^2}{\chi^2 + n}}\] \[\text{Interpretation: } 0.1 \text{ (klein)}, 0.3 \text{ (mittel)}, 0.5 \text{ (groß)}\]

🎯 Kontinuitätskorrektur

Yates' Korrektur für 2×2 Tabellen:

\[\text{Yates' korrigierter Chi-Quadrat:}\] \[\chi^2_{Yates} = \sum_{i=1}^{k} \frac{(|O_i - E_i| - 0.5)^2}{E_i}\] \[\text{Anwendung bei kleinen erwarteten Häufigkeiten}\] \[\text{Konservativer Test (kleinere Teststatistik)}\] \[\text{Empfohlen bei } E_i < 5 \text{ in 2×2 Tabellen}\]

📈 Likelihood-Ratio Test

Alternative zum Pearson Chi-Quadrat:

\[\text{G-Test (Log-Likelihood-Ratio):}\] \[G = 2 \sum_{i=1}^{k} O_i \ln\left(\frac{O_i}{E_i}\right)\] \[\text{Asymptotisch äquivalent zu Pearson χ²}\] \[\text{Bessere Eigenschaften bei kleinen Stichproben}\] \[\text{Verwendet in loglinearen Modellen}\]

Praktische Anwendungen

🏥 Medizin & Epidemiologie
  • • Risikofaktor-Analyse
  • • Therapievergleiche
  • • Ausbruchsuntersuchungen
  • • Diagnostische Tests
📊 Marktforschung
  • • Kundenpräferenzen
  • • Segmentierung
  • • Produktakzeptanz
  • • Demografische Analyse

💡 Praktische Tipps

Hinweise für die korrekte Anwendung:

\[\text{1. Erwartete Häufigkeiten: } E_i \geq 5 \text{ für alle Kategorien}\] \[\text{2. Bei Verletzung: Kategorien zusammenfassen oder exakte Tests}\] \[\text{3. Unabhängigkeit der Beobachtungen sicherstellen}\] \[\text{4. Bei 2×2 Tabellen: Fisher's exakter Test als Alternative}\] \[\text{5. Effektgröße zusätzlich zur Signifikanz berichten}\]
💡 Wichtige Eigenschaften des Chi-Quadrat-Tests:
  • Vielseitigkeit: Anwendbar auf verschiedene kategoriale Datenprobleme
  • Robustheit: Relativ unempfindlich gegenüber Verteilungsannahmen
  • Einfachheit: Leicht zu berechnen und zu interpretieren
  • Asymptotische Eigenschaften: Basiert auf der Chi-Quadrat-Verteilung
📊 Wann Chi-Quadrat-Test verwenden:
  • Goodness-of-Fit: Test gegen theoretische Verteilungen
  • Unabhängigkeit: Zusammenhang zwischen kategorialen Variablen
  • Homogenität: Vergleich von Verteilungen zwischen Gruppen
  • Qualitätskontrolle: Abweichungen von Sollwerten erkennen