Chi-Quadrat-Test Rechner
Online Berechnung für Goodness-of-Fit und Unabhängigkeitstests
Geben Sie Ihre beobachteten und erwarteten Häufigkeiten in die entsprechenden Textfelder ein und klicken Sie auf Test berechnen. Der Chi-Quadrat-Test prüft, ob die beobachteten Häufigkeiten signifikant von den erwarteten abweichen. Dies ist ein fundamentaler Test in der inferenziellen Statistik für kategoriale Daten.
💡 Chi-Quadrat Teststatistik
\(\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}\) | Test auf Übereinstimmung von Häufigkeiten
Chi-Quadrat-Test verstehen
Der Chi-Quadrat-Test (χ²-Test) ist einer der wichtigsten Tests in der Statistik für kategoriale Daten. Er wird verwendet, um zu testen, ob beobachtete Häufigkeiten signifikant von erwarteten Häufigkeiten abweichen (Goodness-of-Fit Test) oder ob zwei kategoriale Variablen unabhängig voneinander sind (Unabhängigkeitstest). Der Test basiert auf der Chi-Quadrat-Verteilung und ist fundamental für viele statistische Anwendungen.
📊 Grundprinzip
Vergleich von Häufigkeiten:
📈 Testtypen
- • Goodness-of-Fit Test
- • Unabhängigkeitstest
- • Homogenitätstest
- • Anpassungstest
🎯 Anwendungen
- • Würfel- und Münztests
- • Marktforschung
- • Genetik (Hardy-Weinberg)
- • Qualitätskontrolle
⚙️ Voraussetzungen
- • Erwartete Häufigkeit ≥ 5
- • Unabhängige Beobachtungen
- • Kategoriale Daten
- • Ausreichende Stichprobengröße
Mathematische Grundlagen
📊 Chi-Quadrat Teststatistik
Für k Kategorien mit beobachteten (O) und erwarteten (E) Häufigkeiten:
\[\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}\] \[\text{wobei:}\] \[O_i = \text{beobachtete Häufigkeit in Kategorie i}\] \[E_i = \text{erwartete Häufigkeit in Kategorie i}\] \[\text{Freiheitsgrade: } df = k - 1 - p\] \[\text{(p = Anzahl geschätzter Parameter)}\]
🔄 Chi-Quadrat Verteilung
Eigenschaften der χ²-Verteilung:
\[\text{Dichtefunktion: } f(x) = \frac{1}{2^{k/2}\Gamma(k/2)} x^{k/2-1} e^{-x/2}\] \[\text{für } x > 0 \text{ und } k \text{ Freiheitsgrade}\] \[\text{Erwartungswert: } E[\chi^2] = k\] \[\text{Varianz: } \text{Var}[\chi^2] = 2k\] \[\text{Rechtsschiefe Verteilung, nähert sich Normalverteilung für große k}\]
📊 Hypothesentestverfahren
Strukturierte Testdurchführung:
\[\text{1. Hypothesen formulieren:}\] \[H_0: \text{Die beobachteten Häufigkeiten entsprechen den erwarteten}\] \[H_1: \text{Mindestens eine Häufigkeit weicht ab}\] \[\text{2. Signifikanzniveau wählen: } \alpha \text{ (meist 0.05)}\] \[\text{3. Teststatistik berechnen: } \chi^2_{obs}\] \[\text{4. Kritischen Wert bestimmen: } \chi^2_{krit} = \chi^2_{\alpha, df}\] \[\text{5. Entscheidung: } \chi^2_{obs} > \chi^2_{krit} \Rightarrow H_0 \text{ ablehnen}\]
Praktische Berechnungsbeispiele
📝 Beispiel 1: Würfel-Fairness-Test
Aufgabe: Test, ob ein Würfel fair ist
Daten: 100 Würfe mit Ergebnissen 12, 18, 22, 15, 13, 20
Berechnung:
\[\text{Erwartete Häufigkeiten: } E_i = \frac{100}{6} = 16.67 \text{ für alle i}\] \[\text{Chi-Quadrat Berechnung:}\] \[\chi^2 = \frac{(12-16.67)^2}{16.67} + \frac{(18-16.67)^2}{16.67} + ... + \frac{(20-16.67)^2}{16.67}\] \[= 1.31 + 0.11 + 1.70 + 0.17 + 0.81 + 0.67 = 4.77\] \[\text{Freiheitsgrade: } df = 6-1 = 5\] \[\text{p-Wert: } p \approx 0.444\]
Interpretation: p > 0.05 → Würfel ist fair (H₀ nicht ablehnen)
📝 Beispiel 2: Münzwurf-Test
Aufgabe: Test auf faire Münze
Daten: 100 Würfe: 45 Kopf, 55 Zahl
Berechnung:
\[\text{Erwartete Häufigkeiten: } E_{Kopf} = E_{Zahl} = 50\] \[\text{Beobachtete Häufigkeiten: } O_{Kopf} = 45, O_{Zahl} = 55\] \[\chi^2 = \frac{(45-50)^2}{50} + \frac{(55-50)^2}{50} = \frac{25}{50} + \frac{25}{50} = 1.0\] \[\text{Freiheitsgrade: } df = 2-1 = 1\] \[\text{p-Wert: } p \approx 0.317\]
Interpretation: p > 0.05 → Münze ist fair
📝 Beispiel 3: Genetischer Test (Hardy-Weinberg)
Aufgabe: Test auf Hardy-Weinberg-Gleichgewicht
Daten: Genotypen AA: 16, Aa: 48, aa: 36 (n=100)
Analyse:
\[\text{Geschätzte Allelfrequenz: } p = \frac{2 \cdot 16 + 48}{2 \cdot 100} = 0.4\] \[\text{Erwartete Häufigkeiten unter H-W:}\] \[E_{AA} = np^2 = 100 \cdot 0.4^2 = 16\] \[E_{Aa} = 2np(1-p) = 100 \cdot 2 \cdot 0.4 \cdot 0.6 = 48\] \[E_{aa} = n(1-p)^2 = 100 \cdot 0.6^2 = 36\] \[\chi^2 = 0 \text{ (perfekte Übereinstimmung!)}\]
Interpretation: Population ist im Hardy-Weinberg-Gleichgewicht
Verschiedene Chi-Quadrat Tests
📈 Goodness-of-Fit Test
- • Test gegen theoretische Verteilung
- • Normalverteilungstest
- • Gleichverteilungstest
- • Modellvalidierung
📊 Unabhängigkeitstest
- • Kontingenztabellen
- • Assoziationstest
- • Marktforschung
- • Medizinische Studien
🎯 Homogenitätstest
- • Vergleich mehrerer Populationen
- • Gruppenvergleiche
- • A/B Testing
- • Behandlungsvergleiche
📈 McNemar Test
- • Gepaarte binäre Daten
- • Vorher-Nachher Vergleiche
- • Matched-Pairs Design
- • 2×2 Kontingenztabellen
Erweiterte Konzepte
📊 Effektgrößen
Maße für die praktische Bedeutsamkeit:
\[\text{Cramér's V: } V = \sqrt{\frac{\chi^2}{n \cdot \min(r-1, c-1)}}\] \[\text{Phi-Koeffizient (2×2 Tabellen): } \phi = \sqrt{\frac{\chi^2}{n}}\] \[\text{Kontingenzkoeffizient: } C = \sqrt{\frac{\chi^2}{\chi^2 + n}}\] \[\text{Interpretation: } 0.1 \text{ (klein)}, 0.3 \text{ (mittel)}, 0.5 \text{ (groß)}\]
🎯 Kontinuitätskorrektur
Yates' Korrektur für 2×2 Tabellen:
\[\text{Yates' korrigierter Chi-Quadrat:}\] \[\chi^2_{Yates} = \sum_{i=1}^{k} \frac{(|O_i - E_i| - 0.5)^2}{E_i}\] \[\text{Anwendung bei kleinen erwarteten Häufigkeiten}\] \[\text{Konservativer Test (kleinere Teststatistik)}\] \[\text{Empfohlen bei } E_i < 5 \text{ in 2×2 Tabellen}\]
📈 Likelihood-Ratio Test
Alternative zum Pearson Chi-Quadrat:
\[\text{G-Test (Log-Likelihood-Ratio):}\] \[G = 2 \sum_{i=1}^{k} O_i \ln\left(\frac{O_i}{E_i}\right)\] \[\text{Asymptotisch äquivalent zu Pearson χ²}\] \[\text{Bessere Eigenschaften bei kleinen Stichproben}\] \[\text{Verwendet in loglinearen Modellen}\]
Praktische Anwendungen
🏥 Medizin & Epidemiologie
- • Risikofaktor-Analyse
- • Therapievergleiche
- • Ausbruchsuntersuchungen
- • Diagnostische Tests
📊 Marktforschung
- • Kundenpräferenzen
- • Segmentierung
- • Produktakzeptanz
- • Demografische Analyse
💡 Praktische Tipps
Hinweise für die korrekte Anwendung:
\[\text{1. Erwartete Häufigkeiten: } E_i \geq 5 \text{ für alle Kategorien}\] \[\text{2. Bei Verletzung: Kategorien zusammenfassen oder exakte Tests}\] \[\text{3. Unabhängigkeit der Beobachtungen sicherstellen}\] \[\text{4. Bei 2×2 Tabellen: Fisher's exakter Test als Alternative}\] \[\text{5. Effektgröße zusätzlich zur Signifikanz berichten}\]
💡 Wichtige Eigenschaften des Chi-Quadrat-Tests:
- Vielseitigkeit: Anwendbar auf verschiedene kategoriale Datenprobleme
- Robustheit: Relativ unempfindlich gegenüber Verteilungsannahmen
- Einfachheit: Leicht zu berechnen und zu interpretieren
- Asymptotische Eigenschaften: Basiert auf der Chi-Quadrat-Verteilung
📊 Wann Chi-Quadrat-Test verwenden:
- Goodness-of-Fit: Test gegen theoretische Verteilungen
- Unabhängigkeit: Zusammenhang zwischen kategorialen Variablen
- Homogenität: Vergleich von Verteilungen zwischen Gruppen
- Qualitätskontrolle: Abweichungen von Sollwerten erkennen
Arithmetisches-Mittel, DurchschnittStreuungsmaße
Geometrisches Mittel
Harmonisches Mittel
Kontraharmonisches Mittel
Log-Geometrisches Mittel
Median
Modus
Minimum und Maximum
Perzentile
Oberes Quartil
Unteres Quartil
Quantile
KurtosisKorrelation & Zusammenhang
Skewness (Statistische Schiefe)
Standardabweichung
Gepoolte Standardabweichungl
Varianz
Gepoolte Varianz
Spannweite
Interquartilsabstand (IQR)
KovarianzVerteilungsfunktionen
Korrelationskoeffizient (Pearson, Spearman)
Rangkorrelation
Empirische inverse Verteilungsfunktion CDFTest & Schätzungen
Empirische Verteilungsfunktion CDF
Five-Number Summary
T-Test (einfach)Spezielle Verteilungen:
Chi-Quadrat-Test
Wilcoxon-Test
NormalverteilungRisiko & Wahrscheinlichkeit
Binomialverteilung
Poisson-Verteilung
Exponentialverteilung
Geburtstagsparadoxon
Satz von Bayes