Quantile Rechner

Online Berechnung beliebiger p-Quantile einer Datenreihe


📊 Quantile & p-Quantile

Beliebige Quantile mit verschiedenen Interpolationsmethoden

💡 Alle reellen Zahlen erlaubt. Berechnet beliebige p-Quantile
Q
0.0-1.0 (z.B. 0.5 = Median)
Verschiedene Standardmethoden
Unterstützte Dateiformate: .txt, .csv (eine Zahl pro Zeile oder kommagetrennt)
📊
p-Quantile: Das p-Quantil ist der Wert, unter dem der Anteil p der Daten liegt. Grundlage für Quartile, Perzentile und Ordnungsstatistiken.
⚠️ Fehler:

Geben Sie Ihre Datenreihe in das Textfeld ein, wählen Sie das gewünschte p-Quantil (0.0 bis 1.0) und die Interpolationsmethode, und klicken Sie auf Berechnen. Quantile sind fundamentale Ordnungsstatistiken, die die Verteilung Ihrer Daten charakterisieren.


💡 Quantile Definition

\(Q_p = F^{-1}(p)\)  |  Das p-Quantil: p·100% der Werte sind ≤ \(Q_p\)


Quantile und Quantilsfunktion verstehen

Quantile sind fundamentale Konzepte der deskriptiven Statistik und Ordnungsstatistiken. Das p-Quantil ist der Wert, unter dem genau der Anteil p (als Dezimalzahl zwischen 0 und 1) der Daten liegt. Die Quantilsfunktion \(Q(p) = F^{-1}(p)\) ist die Umkehrfunktion der Verteilungsfunktion und bildet die mathematische Grundlage für Perzentile, Quartile und andere Ordnungsstatistiken.

📊 Grunddefinition

p-Quantil:

p·100% ≤ Q_p
Umkehrfunktion der CDF
📈 Eigenschaften
  • • Monoton steigend
  • • Q₀ = Minimum, Q₁ = Maximum
  • • Q₀.₅ = Median
  • • Robust gegen Ausreißer
🎯 Anwendungen
  • • Perzentile & Quartile
  • • Boxplot-Konstruktion
  • • Value at Risk (VaR)
  • • Ausreißer-Erkennung
⚙️ Berechnungsmethoden
  • • 9 verschiedene Algorithmen
  • • R, SAS, Excel-Kompatibilität
  • • Lineare Interpolation
  • • Verschiedene Randbehandlungen

Mathematische Grundlagen

📊 Formale Definition der Quantilsfunktion

Für eine sortierte Datenreihe x₍₁₎ ≤ x₍₂₎ ≤ ... ≤ x₍ₙ₎:

\[\text{Das p-Quantil } Q_p \text{ ist definiert als:}\] \[Q_p = F^{-1}(p) = \inf\{x : F(x) \geq p\}\] \[\text{Empirische Quantilsfunktion:}\] \[Q_p = x_{(k)} + (k_{\text{frac}}) \cdot (x_{(k+1)} - x_{(k)})\] \[\text{wobei die Position } k \text{ von der Interpolationsmethode abhängt}\]

🔄 Beziehung zu Perzentilen und Quartilen

Quantile als Grundlage für andere Ordnungsstatistiken:

\[\text{Beziehung zu Perzentilen:}\] \[P_k = Q_{k/100} \quad \text{(k-tes Perzentil)}\] \[\text{Quartile als spezielle Quantile:}\] \[Q_1 = Q_{0.25}, \quad Q_2 = Q_{0.5} = \text{Median}, \quad Q_3 = Q_{0.75}\] \[\text{Dezile und andere Teilungen:}\] \[D_k = Q_{k/10} \quad \text{(k-tes Dezil)}\]

📊 Empirische Verteilungsfunktion

Zusammenhang zwischen empirischer CDF und Quantilen:

\[\text{Empirische CDF: } F_n(x) = \frac{1}{n} \sum_{i=1}^n \mathbb{I}(X_i \leq x)\] \[\text{Quantilsfunktion: } Q_n(p) = F_n^{-1}(p)\] \[\text{Glivenko-Cantelli Theorem:}\] \[\sup_x |F_n(x) - F(x)| \xrightarrow{a.s.} 0 \text{ as } n \to \infty\] \[\text{Konsequenz: } Q_n(p) \xrightarrow{P} Q(p)\]

Praktische Berechnungsbeispiele

📝 Beispiel 1: Standard-Quantil berechnen

Aufgabe: Berechne Q₀.₂₅ von 2, 5, 4, 8, 3, 7, 9, 3, 1, 6
Methode: Standard (Type 6) mit linearer Interpolation
Berechnung:

\[\text{Schritt 1: Sortieren}\] \[\text{Sortiert: } 1, 2, 3, 3, 4, 5, 6, 7, 8, 9 \quad (n = 10)\] \[\text{Schritt 2: Position berechnen}\] \[\text{Position } h = p \cdot (n + 1) = 0{,}25 \cdot 11 = 2{,}75\] \[\text{Schritt 3: Interpolation}\] \[Q_{0.25} = x_{(2)} + 0{,}75 \cdot (x_{(3)} - x_{(2)}) = 2 + 0{,}75 \cdot 1 = 2{,}75\]

Interpretation: 25% der Werte sind ≤ 2,75

📝 Beispiel 2: Methodenvergleich

Aufgabe: Vergleiche verschiedene Methoden für Q₀.₅ (Median)
Daten: 1, 2, 3, 4, 5, 6 (n=6, gerade Anzahl)
Vergleich:

\[\text{Type 6 (Standard): } h = 0{,}5 \cdot 7 = 3{,}5\] \[Q_{0.5} = x_{(3)} + 0{,}5 \cdot (x_{(4)} - x_{(3)}) = 3 + 0{,}5 \cdot 1 = 3{,}5\] \[\text{Type 7 (R): } h = 0{,}5 \cdot 5 + 1 = 3{,}5\] \[Q_{0.5} = x_{(3)} + 0{,}5 \cdot (x_{(4)} - x_{(3)}) = 3{,}5\] \[\text{Type 4: } h = 0{,}5 \cdot 6 = 3{,}0\] \[Q_{0.5} = x_{(3)} = 3{,}0\]

Fazit: Verschiedene Methoden können unterschiedliche Ergebnisse liefern

📝 Beispiel 3: Asymmetrische Verteilung

Aufgabe: Analyse einer rechtsschiefen Verteilung
Daten: 1, 2, 3, 4, 5, 10, 15, 20 (mit Ausreißern)
Berechnung:

\[\text{Sortiert: } 1, 2, 3, 4, 5, 10, 15, 20 \quad (n = 8)\] \[\text{Standard-Methode (Type 6):}\] \[Q_{0.25} = 2{,}25, \quad Q_{0.5} = 4{,}5, \quad Q_{0.75} = 12{,}5\] \[\text{Schiefe erkennbar:}\] \[Q_{0.75} - Q_{0.5} = 8{,}0 > Q_{0.5} - Q_{0.25} = 2{,}25\] \[\text{Rechtsschief: oberer IQR > unterer IQR}\]

Interpretation: Quantile zeigen Asymmetrie der Verteilung

Anwendungen in verschiedenen Bereichen

📈 Finanz- & Risikomanagement
  • • Value at Risk (VaR)
  • • Expected Shortfall
  • • Stress-Testing
  • • Portfolio-Optimierung
🏥 Medizin & Gesundheit
  • • Referenzbereiche
  • • Wachstumspercentile
  • • Laborwerte-Interpretation
  • • Biostatistik
📊 Qualitätskontrolle
  • • Prozessüberwachung
  • • Spezifikationsgrenzen
  • • Six Sigma Methodik
  • • Statistische Prozesskontrolle
🎓 Bildung & Psychologie
  • • Testnormierung
  • • Leistungsbeurteilung
  • • Perzentilränge
  • • Standardisierung

Erweiterte Konzepte

📊 Quantil-Quantil-Plots (Q-Q-Plots)

Visualisierung von Quantilen für Verteilungsvergleiche:

\[\text{Q-Q-Plot: Vergleich zweier Verteilungen}\] \[\text{Theoretische vs. empirische Quantile:}\] \[(Q_{\text{theoretisch}}(p_i), Q_{\text{empirisch}}(p_i))\] \[\text{wobei } p_i = \frac{i}{n+1} \text{ für } i = 1, 2, \ldots, n\] \[\text{Lineare Anordnung ⟹ gleiche Verteilungsform}\]

🎯 Quantile Regression

Verwendung von Quantilen in der Regressionsanalyse:

\[\text{Quantile Regression für das τ-Quantil:}\] \[\min_\beta \sum_{i=1}^n \rho_\tau(y_i - x_i'\beta)\] \[\text{wobei } \rho_\tau(u) = u(\tau - \mathbb{I}(u < 0))\] \[\text{Verschiedene Quantile → verschiedene Regressionslinien}\] \[\text{Robuster gegen Ausreißer als OLS}\]

📈 Asymptotische Eigenschaften

Verhalten von Stichproben-Quantilen:

\[\text{Asymptotische Normalität der Quantile:}\] \[\sqrt{n}(\hat{Q}_p - Q_p) \xrightarrow{d} N\left(0, \frac{p(1-p)}{f(Q_p)^2}\right)\] \[\text{wobei } f \text{ die Dichtefunktion an } Q_p \text{ ist}\] \[\text{Konfidenzintervall für Quantile:}\] \[\hat{Q}_p \pm z_{\alpha/2} \sqrt{\frac{p(1-p)}{n \cdot f(\hat{Q}_p)^2}}\]

Computational Aspects

💻 Algorithmen und Implementierung

Effiziente Berechnung von Quantilen:

Python (NumPy/SciPy):
import numpy as np
# Verschiedene Methoden:
np.quantile(data, p, method='linear') # Type 7 (R)
np.quantile(data, p, method='lower') # Type 1
np.quantile(data, p, method='higher') # Type 3
np.percentile(data, p*100) # Alias

R:
quantile(data, probs=p, type=7) # Default
quantile(data, probs=p, type=6) # Excel-like

Komplexität: O(n log n) mit Sortierung
Online-Algorithmus: P²-Algorithmus für streaming data

💡 Praktische Tipps

Hinweise für die korrekte Anwendung:

\[\text{1. Methode konsistent in einem Projekt verwenden}\] \[\text{2. Bei kleinen Stichproben: Große Unsicherheit beachten}\] \[\text{3. Visualisierung: Q-Q-Plots für Verteilungsprüfung}\] \[\text{4. Quantile für robuste Statistik nutzen}\] \[\text{5. Extremquantile (p ≈ 0 oder p ≈ 1) mit Vorsicht interpretieren}\]
💡 Wichtige Eigenschaften von Quantilen:
  • Ordnungsstatistiken: Basieren nur auf der Rangordnung der Daten
  • Robust: Weniger empfindlich gegen Ausreißer als Mittelwert
  • Interpretierbar: Direkte Aussage über Anteilswerte
  • Universell: Grundlage für Perzentile, Quartile und andere Maße
📊 Wann Quantile verwenden:
  • Verteilungsanalyse: Charakterisierung von Datenverteilungen
  • Risikomanagement: Definition von Schwellenwerten (VaR)
  • Vergleiche: Einordnung von Werten in Referenzpopulationen
  • Robuste Statistik: Alternative zu mittelwertbasierten Maßen