Interquartilsabstand Rechner
Online Berechnung des IQR - robustes Streuungsmaß
Geben Sie Ihre Datenreihe in das Textfeld ein und klicken Sie auf Berechnen. Der Interquartilsabstand ist ein robustes Streuungsmaß, das die mittleren 50% Ihrer Daten erfasst und unempfindlich gegenüber Ausreißern ist.
💡 IQR Definition
\(\text{IQR} = Q_3 - Q_1\) | Differenz zwischen 75. und 25. Perzentil
Interquartilsabstand und robuste Streuung verstehen
Der Interquartilsabstand (IQR) ist ein robustes Streuungsmaß, das die Spannweite der mittleren 50% der Daten angibt. Er wird berechnet als Differenz zwischen dem dritten Quartil (Q₃, 75. Perzentil) und dem ersten Quartil (Q₁, 25. Perzentil). Im Gegensatz zur Spannweite ist der IQR unempfindlich gegenüber Ausreißern und eignet sich besonders für schiefe Verteilungen und Daten mit extremen Werten.
📊 Grunddefinition
Robuste Berechnung:
📈 Eigenschaften
- • Immer ≥ 0
- • Gleiche Einheit wie Daten
- • Ausreißer-resistent
- • 50% Breakdown Point
🎯 Anwendungen
- • Boxplot-Konstruktion
- • Ausreißererkennung
- • Robuste Datenanalyse
- • Schiefe Verteilungen
⚙️ Vorteile
- • Robust gegen Ausreißer
- • Einfach zu interpretieren
- • Quartil-basiert
- • Boxplot-kompatibel
Mathematische Grundlagen
📊 Formale Definition des IQR
Für eine sortierte Datenreihe x₍₁₎ ≤ x₍₂₎ ≤ ... ≤ x₍ₙ₎:
\[\text{Interquartilsabstand: } IQR = Q_3 - Q_1\] \[\text{Erstes Quartil: } Q_1 = \text{Perzentil}(25\%)\] \[\text{Drittes Quartil: } Q_3 = \text{Perzentil}(75\%)\] \[\text{Quartil-Koeffizient: } QD = \frac{Q_3 - Q_1}{Q_3 + Q_1}\]
🔄 Quartil-Berechnungsmethoden
Verschiedene Ansätze für Quartil-Berechnung:
\[\text{Type 1: } Q_k = x_{[np_k]} \text{ (Inverted CDF)}\] \[\text{Type 7: } Q_k = x_{[1]} + (x_{[2]} - x_{[1]}) \times h \text{ (R default)}\] \[\text{Type 8: } Q_k = x_{[1]} + (x_{[2]} - x_{[1]}) \times h' \text{ (Maple)}\] \[\text{wobei } h = (n-1)p_k + 1 - [np_k] \text{ und } p_k = k/4\] \[\text{Verschiedene Methoden können unterschiedliche Ergebnisse liefern}\]
📊 Boxplot und Ausreißererkennung
IQR in der explorativen Datenanalyse:
\[\text{Untere Whisker: } \max(\text{Min}, Q_1 - 1.5 \times IQR)\] \[\text{Obere Whisker: } \min(\text{Max}, Q_3 + 1.5 \times IQR)\] \[\text{Mild Outliers: } Q_1 - 1.5 \times IQR < x < Q_1 - 3 \times IQR\] \[\text{Extreme Outliers: } x < Q_1 - 3 \times IQR \text{ oder } x > Q_3 + 3 \times IQR\] \[\text{Tukey's Fences: Standard-Ausreißerdefinition}\]
Praktische Berechnungsbeispiele
📝 Beispiel 1: Grundberechnung
Aufgabe: Berechne IQR von 7, 9, 12, 1, 3, 2, 14
Methode: Quartile identifizieren und subtrahieren
Berechnung:
\[\text{Schritt 1: Daten sortieren}\] \[\text{Sortiert: } 1, 2, 3, 7, 9, 12, 14 \text{ (n = 7)}\] \[\text{Schritt 2: Quartile berechnen (Type 7)}\] \[\text{Position Q1: } (7-1) \times 0.25 + 1 = 2.5 \Rightarrow Q_1 = 2.5\] \[\text{Position Q3: } (7-1) \times 0.75 + 1 = 5.5 \Rightarrow Q_3 = 10.5\] \[\text{Schritt 3: IQR berechnen}\] \[IQR = 10.5 - 2.5 = 8.0\]
Interpretation: Die mittleren 50% der Daten erstrecken sich über 8 Einheiten
📝 Beispiel 2: Ausreißerresistenz
Aufgabe: Vergleiche IQR mit und ohne Ausreißer
Daten: Normal: 5, 6, 7, 8, 9, 10, 11 | Mit Ausreißer: 5, 6, 7, 8, 9, 10, 100
Analyse:
\[\text{Normale Daten: } Q_1 = 6, Q_3 = 10 \Rightarrow IQR_1 = 4\] \[\text{Mit Ausreißer: } Q_1 = 6, Q_3 = 10 \Rightarrow IQR_2 = 4\] \[\text{Relative Änderung: } \frac{IQR_2 - IQR_1}{IQR_1} = 0\%\] \[\text{Zum Vergleich - Spannweite:}\] \[\text{Range}_1 = 11 - 5 = 6, \quad \text{Range}_2 = 100 - 5 = 95\] \[\text{Relative Änderung Range: } \frac{95 - 6}{6} = 1483\%\]
Fazit: IQR bleibt stabil, während Range drastisch verändert wird
📝 Beispiel 3: Boxplot-Konstruktion
Aufgabe: Erstelle Boxplot für Gehaltsdaten
Daten: 35k, 38k, 42k, 45k, 48k, 52k, 55k, 58k, 61k, 65k, 120k €
Analyse:
\[\text{Five-Number Summary:}\] \[\text{Min = 35k, } Q_1 = 42k, \text{ Median = 52k, } Q_3 = 61k, \text{ Max = 120k}\] \[IQR = 61k - 42k = 19k\] \[\text{Whisker-Grenzen:}\] \[\text{Untere: } \max(35k, 42k - 1.5 \times 19k) = \max(35k, 13.5k) = 35k\] \[\text{Obere: } \min(120k, 61k + 1.5 \times 19k) = \min(120k, 89.5k) = 89.5k\] \[\text{Ausreißer: } 120k > 89.5k \Rightarrow \text{Ja, 120k ist Ausreißer}\]
Interpretation: 120k Gehalt identifiziert als statistischer Ausreißer
Anwendungen in verschiedenen Bereichen
📈 Finanz- & Wirtschaft
- • Gehaltsanalysen
- • Risikobewertung
- • Performance-Messung
- • Marktverteilungen
📊 Qualitätskontrolle
- • Prozessmonitoring
- • Robuste Kontrollkarten
- • Ausreißererkennung
- • Toleranzanalyse
🏥 Medizin & Biologie
- • Referenzintervalle
- • Labornormalwerte
- • Epidemiologie
- • Biomarker-Analyse
🎓 Bildung & Soziales
- • Leistungsverteilungen
- • Einkommensanalysen
- • Umfrageauswertung
- • Demographic Studies
Erweiterte Konzepte
📊 Robustheit und Breakdown Point
Warum IQR robuster als andere Streuungsmaße ist:
\[\text{Breakdown Point IQR: } 50\% \text{ der Daten}\] \[\text{Breakdown Point Range: } 0\% \text{ (ein Ausreißer reicht)}\] \[\text{Breakdown Point Standardabweichung: } 0\%\] \[\text{Influence Function: IQR weniger empfindlich}\] \[\text{Robustheit: Widerstand gegen Datenveränderungen}\]
🎯 Trimmed und Winsorized Alternativen
Verwandte robuste Statistiken:
\[\text{Trimmed Mean: } \bar{x}_{trim} = \frac{1}{n-2k}\sum_{i=k+1}^{n-k} x_{(i)}\] \[\text{Trimmed Range: } R_{trim} = x_{(n-k)} - x_{(k+1)}\] \[\text{MAD (Median Absolute Deviation): } 1.4826 \times \text{median}(|x_i - \text{median}(x)|)\] \[\text{Shamos-Bickel Estimator: Robuste Skalenschätzung}\]
📈 IQR in verschiedenen Verteilungen
IQR-Eigenschaften bei bekannten Verteilungen:
\[\text{Normalverteilung: } IQR \approx 1.349 \times \sigma\] \[\text{Exponentialverteilung: } IQR = \lambda^{-1} \ln(4/3)\] \[\text{Uniform(a,b): } IQR = 0.5 \times (b-a)\] \[\text{Effizienz vs. Standardabweichung: } \text{ARE} \approx 37\%\] \[\text{Bei schweren Verteilungsenden: IQR oft besser}\]
Computational Aspects
💻 Algorithmen und Implementierung
Effiziente Berechnung des IQR:
Python (NumPy):
import numpy as np
# Einfache IQR-Berechnung:
q75, q25 = np.percentile(data, [75, 25])
iqr = q75 - q25
# Oder mit scipy:
from scipy import stats
iqr = stats.iqr(data)
# Ausreißererkennung:
lower_bound = q25 - 1.5 * iqr
upper_bound = q75 + 1.5 * iqr
R:
# IQR berechnen
iqr_val <- IQR(data)
# Quartile einzeln
q1 <- quantile(data, 0.25)
q3 <- quantile(data, 0.75)
# Boxplot erstellen
boxplot(data)
💡 Praktische Tipps
Hinweise für die korrekte Anwendung:
\[\text{1. Bei schiefen Verteilungen: IQR bevorzugen}\] \[\text{2. Verschiedene Quartil-Methoden testen}\] \[\text{3. IQR für Boxplot-Erstellung nutzen}\] \[\text{4. Bei Ausreißern: robust bleiben}\] \[\text{5. Mit Median kombinieren für bessere Beschreibung}\]
💡 Vorteile des Interquartilsabstands:
- Robustheit: Unempfindlich gegenüber Ausreißern (50% Breakdown Point)
- Interpretierbarkeit: Beschreibt die mittleren 50% der Daten
- Quartil-basiert: Nutzt Ordnungsstatistiken statt Mittelwerte
- Boxplot-kompatibel: Grundlage für graphische Darstellung
📊 Wann IQR verwenden:
- Schiefe Verteilungen: Wenn Daten nicht symmetrisch verteilt sind
- Ausreißer vorhanden: Robuste Alternative zu Standardabweichung
- Explorative Analyse: Für erste Datenuntersuchung und Boxplots
- Ordinale Daten: Wenn nur Rangordnung, nicht Abstände wichtig sind
Arithmetisches-Mittel, DurchschnittStreuungsmaße
Geometrisches Mittel
Harmonisches Mittel
Kontraharmonisches Mittel
Log-Geometrisches Mittel
Median
Modus
Minimum und Maximum
Perzentile
Oberes Quartil
Unteres Quartil
Quantile
KurtosisKorrelation & Zusammenhang
Skewness (Statistische Schiefe)
Standardabweichung
Gepoolte Standardabweichungl
Varianz
Gepoolte Varianz
Spannweite
Interquartilsabstand (IQR)
KovarianzVerteilungsfunktionen
Korrelationskoeffizient (Pearson, Spearman)
Rangkorrelation
Empirische inverse Verteilungsfunktion CDFTest & Schätzungen
Empirische Verteilungsfunktion CDF
Five-Number Summary
T-Test (einfach)Spezielle Verteilungen:
Chi-Quadrat-Test
Wilcoxon-Test
NormalverteilungRisiko & Wahrscheinlichkeit
Binomialverteilung
Poisson-Verteilung
Exponentialverteilung
Geburtstagsparadoxon
Satz von Bayes