Interquartilsabstand Rechner

Online Berechnung des IQR - robustes Streuungsmaß


📊 Interquartilsabstand (IQR)

Robustes Streuungsmaß - Q3 minus Q1

💡 Alle reellen Zahlen erlaubt. Berechnet Q3 - Q1
💡 Verschiedene Methoden können leicht unterschiedliche Ergebnisse liefern
Unterstützte Dateiformate: .txt, .csv (eine Zahl pro Zeile oder kommagetrennt)
📊
Interquartilsabstand: Robustes Streuungsmaß, das die mittleren 50% der Daten erfasst. Unempfindlich gegenüber Ausreißern.
⚠️ Fehler:

Geben Sie Ihre Datenreihe in das Textfeld ein und klicken Sie auf Berechnen. Der Interquartilsabstand ist ein robustes Streuungsmaß, das die mittleren 50% Ihrer Daten erfasst und unempfindlich gegenüber Ausreißern ist.


💡 IQR Definition

\(\text{IQR} = Q_3 - Q_1\)  |  Differenz zwischen 75. und 25. Perzentil


Interquartilsabstand und robuste Streuung verstehen

Der Interquartilsabstand (IQR) ist ein robustes Streuungsmaß, das die Spannweite der mittleren 50% der Daten angibt. Er wird berechnet als Differenz zwischen dem dritten Quartil (Q₃, 75. Perzentil) und dem ersten Quartil (Q₁, 25. Perzentil). Im Gegensatz zur Spannweite ist der IQR unempfindlich gegenüber Ausreißern und eignet sich besonders für schiefe Verteilungen und Daten mit extremen Werten.

📊 Grunddefinition

Robuste Berechnung:

IQR = Q₃ - Q₁
Mittlere 50% der Datenverteilung
📈 Eigenschaften
  • • Immer ≥ 0
  • • Gleiche Einheit wie Daten
  • • Ausreißer-resistent
  • • 50% Breakdown Point
🎯 Anwendungen
  • • Boxplot-Konstruktion
  • • Ausreißererkennung
  • • Robuste Datenanalyse
  • • Schiefe Verteilungen
⚙️ Vorteile
  • • Robust gegen Ausreißer
  • • Einfach zu interpretieren
  • • Quartil-basiert
  • • Boxplot-kompatibel

Mathematische Grundlagen

📊 Formale Definition des IQR

Für eine sortierte Datenreihe x₍₁₎ ≤ x₍₂₎ ≤ ... ≤ x₍ₙ₎:

\[\text{Interquartilsabstand: } IQR = Q_3 - Q_1\] \[\text{Erstes Quartil: } Q_1 = \text{Perzentil}(25\%)\] \[\text{Drittes Quartil: } Q_3 = \text{Perzentil}(75\%)\] \[\text{Quartil-Koeffizient: } QD = \frac{Q_3 - Q_1}{Q_3 + Q_1}\]

🔄 Quartil-Berechnungsmethoden

Verschiedene Ansätze für Quartil-Berechnung:

\[\text{Type 1: } Q_k = x_{[np_k]} \text{ (Inverted CDF)}\] \[\text{Type 7: } Q_k = x_{[1]} + (x_{[2]} - x_{[1]}) \times h \text{ (R default)}\] \[\text{Type 8: } Q_k = x_{[1]} + (x_{[2]} - x_{[1]}) \times h' \text{ (Maple)}\] \[\text{wobei } h = (n-1)p_k + 1 - [np_k] \text{ und } p_k = k/4\] \[\text{Verschiedene Methoden können unterschiedliche Ergebnisse liefern}\]

📊 Boxplot und Ausreißererkennung

IQR in der explorativen Datenanalyse:

\[\text{Untere Whisker: } \max(\text{Min}, Q_1 - 1.5 \times IQR)\] \[\text{Obere Whisker: } \min(\text{Max}, Q_3 + 1.5 \times IQR)\] \[\text{Mild Outliers: } Q_1 - 1.5 \times IQR < x < Q_1 - 3 \times IQR\] \[\text{Extreme Outliers: } x < Q_1 - 3 \times IQR \text{ oder } x > Q_3 + 3 \times IQR\] \[\text{Tukey's Fences: Standard-Ausreißerdefinition}\]

Praktische Berechnungsbeispiele

📝 Beispiel 1: Grundberechnung

Aufgabe: Berechne IQR von 7, 9, 12, 1, 3, 2, 14
Methode: Quartile identifizieren und subtrahieren
Berechnung:

\[\text{Schritt 1: Daten sortieren}\] \[\text{Sortiert: } 1, 2, 3, 7, 9, 12, 14 \text{ (n = 7)}\] \[\text{Schritt 2: Quartile berechnen (Type 7)}\] \[\text{Position Q1: } (7-1) \times 0.25 + 1 = 2.5 \Rightarrow Q_1 = 2.5\] \[\text{Position Q3: } (7-1) \times 0.75 + 1 = 5.5 \Rightarrow Q_3 = 10.5\] \[\text{Schritt 3: IQR berechnen}\] \[IQR = 10.5 - 2.5 = 8.0\]

Interpretation: Die mittleren 50% der Daten erstrecken sich über 8 Einheiten

📝 Beispiel 2: Ausreißerresistenz

Aufgabe: Vergleiche IQR mit und ohne Ausreißer
Daten: Normal: 5, 6, 7, 8, 9, 10, 11 | Mit Ausreißer: 5, 6, 7, 8, 9, 10, 100
Analyse:

\[\text{Normale Daten: } Q_1 = 6, Q_3 = 10 \Rightarrow IQR_1 = 4\] \[\text{Mit Ausreißer: } Q_1 = 6, Q_3 = 10 \Rightarrow IQR_2 = 4\] \[\text{Relative Änderung: } \frac{IQR_2 - IQR_1}{IQR_1} = 0\%\] \[\text{Zum Vergleich - Spannweite:}\] \[\text{Range}_1 = 11 - 5 = 6, \quad \text{Range}_2 = 100 - 5 = 95\] \[\text{Relative Änderung Range: } \frac{95 - 6}{6} = 1483\%\]

Fazit: IQR bleibt stabil, während Range drastisch verändert wird

📝 Beispiel 3: Boxplot-Konstruktion

Aufgabe: Erstelle Boxplot für Gehaltsdaten
Daten: 35k, 38k, 42k, 45k, 48k, 52k, 55k, 58k, 61k, 65k, 120k €
Analyse:

\[\text{Five-Number Summary:}\] \[\text{Min = 35k, } Q_1 = 42k, \text{ Median = 52k, } Q_3 = 61k, \text{ Max = 120k}\] \[IQR = 61k - 42k = 19k\] \[\text{Whisker-Grenzen:}\] \[\text{Untere: } \max(35k, 42k - 1.5 \times 19k) = \max(35k, 13.5k) = 35k\] \[\text{Obere: } \min(120k, 61k + 1.5 \times 19k) = \min(120k, 89.5k) = 89.5k\] \[\text{Ausreißer: } 120k > 89.5k \Rightarrow \text{Ja, 120k ist Ausreißer}\]

Interpretation: 120k Gehalt identifiziert als statistischer Ausreißer

Anwendungen in verschiedenen Bereichen

📈 Finanz- & Wirtschaft
  • • Gehaltsanalysen
  • • Risikobewertung
  • • Performance-Messung
  • • Marktverteilungen
📊 Qualitätskontrolle
  • • Prozessmonitoring
  • • Robuste Kontrollkarten
  • • Ausreißererkennung
  • • Toleranzanalyse
🏥 Medizin & Biologie
  • • Referenzintervalle
  • • Labornormalwerte
  • • Epidemiologie
  • • Biomarker-Analyse
🎓 Bildung & Soziales
  • • Leistungsverteilungen
  • • Einkommensanalysen
  • • Umfrageauswertung
  • • Demographic Studies

Erweiterte Konzepte

📊 Robustheit und Breakdown Point

Warum IQR robuster als andere Streuungsmaße ist:

\[\text{Breakdown Point IQR: } 50\% \text{ der Daten}\] \[\text{Breakdown Point Range: } 0\% \text{ (ein Ausreißer reicht)}\] \[\text{Breakdown Point Standardabweichung: } 0\%\] \[\text{Influence Function: IQR weniger empfindlich}\] \[\text{Robustheit: Widerstand gegen Datenveränderungen}\]

🎯 Trimmed und Winsorized Alternativen

Verwandte robuste Statistiken:

\[\text{Trimmed Mean: } \bar{x}_{trim} = \frac{1}{n-2k}\sum_{i=k+1}^{n-k} x_{(i)}\] \[\text{Trimmed Range: } R_{trim} = x_{(n-k)} - x_{(k+1)}\] \[\text{MAD (Median Absolute Deviation): } 1.4826 \times \text{median}(|x_i - \text{median}(x)|)\] \[\text{Shamos-Bickel Estimator: Robuste Skalenschätzung}\]

📈 IQR in verschiedenen Verteilungen

IQR-Eigenschaften bei bekannten Verteilungen:

\[\text{Normalverteilung: } IQR \approx 1.349 \times \sigma\] \[\text{Exponentialverteilung: } IQR = \lambda^{-1} \ln(4/3)\] \[\text{Uniform(a,b): } IQR = 0.5 \times (b-a)\] \[\text{Effizienz vs. Standardabweichung: } \text{ARE} \approx 37\%\] \[\text{Bei schweren Verteilungsenden: IQR oft besser}\]

Computational Aspects

💻 Algorithmen und Implementierung

Effiziente Berechnung des IQR:

Python (NumPy):
import numpy as np
# Einfache IQR-Berechnung:
q75, q25 = np.percentile(data, [75, 25])
iqr = q75 - q25
# Oder mit scipy:
from scipy import stats
iqr = stats.iqr(data)
# Ausreißererkennung:
lower_bound = q25 - 1.5 * iqr
upper_bound = q75 + 1.5 * iqr

R:
# IQR berechnen
iqr_val <- IQR(data)
# Quartile einzeln
q1 <- quantile(data, 0.25)
q3 <- quantile(data, 0.75)
# Boxplot erstellen
boxplot(data)

💡 Praktische Tipps

Hinweise für die korrekte Anwendung:

\[\text{1. Bei schiefen Verteilungen: IQR bevorzugen}\] \[\text{2. Verschiedene Quartil-Methoden testen}\] \[\text{3. IQR für Boxplot-Erstellung nutzen}\] \[\text{4. Bei Ausreißern: robust bleiben}\] \[\text{5. Mit Median kombinieren für bessere Beschreibung}\]
💡 Vorteile des Interquartilsabstands:
  • Robustheit: Unempfindlich gegenüber Ausreißern (50% Breakdown Point)
  • Interpretierbarkeit: Beschreibt die mittleren 50% der Daten
  • Quartil-basiert: Nutzt Ordnungsstatistiken statt Mittelwerte
  • Boxplot-kompatibel: Grundlage für graphische Darstellung
📊 Wann IQR verwenden:
  • Schiefe Verteilungen: Wenn Daten nicht symmetrisch verteilt sind
  • Ausreißer vorhanden: Robuste Alternative zu Standardabweichung
  • Explorative Analyse: Für erste Datenuntersuchung und Boxplots
  • Ordinale Daten: Wenn nur Rangordnung, nicht Abstände wichtig sind