Inverse Empirische Verteilungsfunktion Rechner
Online Berechnung von Quantilen und Perzentilen aus Datenreihen
Geben Sie Ihre Datenreihe in das Textfeld ein, wählen Sie das gewünschte Quantil/Perzentil und klicken Sie auf Berechnen. Die inverse empirische Verteilungsfunktion bestimmt zu einem gegebenen Wahrscheinlichkeitswert den entsprechenden Datenwert und ist fundamental für die Berechnung von Quantilen, Perzentilen und Quartilen.
💡 Inverse Empirische Verteilungsfunktion
\(F^{-1}(p) = x_{(\lceil np \rceil)}\) | Quantilfunktion für empirische Daten
Inverse Verteilungsfunktion und Quantile verstehen
Die inverse empirische Verteilungsfunktion (auch empirische Quantilfunktion genannt) ist die Umkehrfunktion der empirischen Verteilungsfunktion. Sie ordnet einem Wahrscheinlichkeitswert p (mit 0 ≤ p ≤ 1) denjenigen Datenwert zu, bei dem genau ein Anteil p der Beobachtungen kleiner oder gleich diesem Wert ist. Diese Funktion ist fundamental für die Bestimmung von Quantilen, Perzentilen und Quartilen und spielt eine zentrale Rolle in der deskriptiven Statistik und Datenanalyse.
📊 Grunddefinition
Quantilfunktion:
📈 Eigenschaften
- • Monoton nichtfallend
- • Wertebereich: [min(x), max(x)]
- • Rechtsseitig stetig
- • Basis für Quantile
🎯 Anwendungen
- • Quantilberechnung
- • Perzentilbestimmung
- • Boxplot-Konstruktion
- • Risikobewertung
⚙️ Wichtige Quantile
- • Q1 (25%): 1. Quartil
- • Q2 (50%): Median
- • Q3 (75%): 3. Quartil
- • P90, P95: Risikoquantile
Mathematische Grundlagen
📊 Formale Definition
Für eine sortierte Stichprobe x(1) ≤ x(2) ≤ ... ≤ x(n):
\[\text{Inverse empirische Verteilungsfunktion: } F_n^{-1}(p) = x_{(k)}\] \[\text{wobei } k = \lceil n \cdot p \rceil \text{ (aufrunden auf nächste ganze Zahl)}\] \[\text{Alternative: } k = \lfloor n \cdot p \rfloor + 1\] \[\text{Eigenschaften: } 0 \leq p \leq 1, \quad F_n^{-1}(p) \in \{x_{(1)}, ..., x_{(n)}\}\]
🔄 Beziehung zur Verteilungsfunktion
Zusammenhang zwischen F und F⁻¹:
\[\text{Empirische Verteilungsfunktion: } F_n(x) = \frac{1}{n}\sum_{i=1}^n \mathbf{1}_{x_i \leq x}\] \[\text{Inverse Beziehung: } F_n(F_n^{-1}(p)) \geq p\] \[\text{und } F_n^{-1}(F_n(x)) \leq x\] \[\text{Für p-Quantil: } x_p = F_n^{-1}(p)\] \[\text{Interpretation: Mindestens } 100p\% \text{ der Daten sind } \leq x_p\]
📊 Verschiedene Quantildefinitionen
Alternative Berechnungsmethoden für Quantile:
\[\text{Methode 1 (Inverted CDF): } Q(p) = x_{(\lceil np \rceil)}\] \[\text{Methode 2 (Averaging): } Q(p) = \frac{x_{(k)} + x_{(k+1)}}{2}\] \[\text{wobei } k = \lfloor np \rfloor \text{ und } k+1 = \lceil np \rceil\] \[\text{Methode 3 (Linear Interpolation):}\] \[Q(p) = x_{(k)} + (np - k)(x_{(k+1)} - x_{(k)})\] \[\text{R-Quantile: 9 verschiedene Methoden implementiert}\]
Praktische Berechnungsbeispiele
📝 Beispiel 1: Quartilberechnung
Aufgabe: Bestimme Quartile für die Datenreihe: 2, 6, 4, 8, 3, 1
Schritt 1: Sortierung
Schritt 2: Quartilberechnung
\[\text{Sortierte Daten: } 1, 2, 3, 4, 6, 8 \quad (n = 6)\] \[\text{Q1 (p = 0.25): } k = \lceil 6 \cdot 0.25 \rceil = 2 \Rightarrow Q1 = x_{(2)} = 2\] \[\text{Q2 (p = 0.50): } k = \lceil 6 \cdot 0.50 \rceil = 3 \Rightarrow Q2 = x_{(3)} = 3\] \[\text{Q3 (p = 0.75): } k = \lceil 6 \cdot 0.75 \rceil = 5 \Rightarrow Q3 = x_{(5)} = 6\]
Interpretation: 25% ≤ 2, 50% ≤ 3, 75% ≤ 6
📝 Beispiel 2: Perzentilberechnung
Aufgabe: 90. Perzentil für Testergebnisse: 72, 85, 90, 78, 92, 88, 76, 95, 82, 89
Anwendung: Bestimmung von Leistungsgrenzen
Berechnung:
\[\text{Sortierte Daten: } 72, 76, 78, 82, 85, 88, 89, 90, 92, 95 \quad (n = 10)\] \[\text{P90 (p = 0.90): } k = \lceil 10 \cdot 0.90 \rceil = 9\] \[\text{P90 = } x_{(9)} = 92\] \[\text{Interpretation: } 90\% \text{ der Kandidaten haben } \leq 92 \text{ Punkte}\]
Anwendung: Nur 10% erreichen mehr als 92 Punkte (Auszeichnung)
📝 Beispiel 3: Risikomanagement
Aufgabe: Value at Risk (VaR) aus Renditedaten
Daten: Tägliche Renditen (%) eines Portfolios
VaR-Berechnung:
\[\text{Renditen: } -2.1, 1.5, -0.8, 2.3, -1.2, 0.9, -3.1, 1.8, -0.5, 2.7\] \[\text{Sortiert: } -3.1, -2.1, -1.2, -0.8, -0.5, 0.9, 1.5, 1.8, 2.3, 2.7\] \[\text{VaR}_{95\%} \text{ (p = 0.05): } k = \lceil 10 \cdot 0.05 \rceil = 1\] \[\text{VaR}_{95\%} = x_{(1)} = -3.1\%\] \[\text{Interpretation: Mit 95\% Wahrscheinlichkeit Verlust } \leq 3.1\%\]
Risikomanagement: Maximaler erwarteter Tagesverlust: 3.1%
Anwendungen in verschiedenen Bereichen
📈 Finanz- & Risikomanagement
- • Value at Risk (VaR)
- • Expected Shortfall
- • Stress Testing
- • Portfolio-Optimierung
📊 Qualitätskontrolle
- • Prozess-Quantile
- • Toleranzgrenzen
- • Ausschussraten
- • Six Sigma Analyse
🏥 Medizin & Gesundheit
- • Referenzbereiche
- • Wachstumsperzentile
- • Laborwerte-Interpretation
- • Epidemiologische Studien
🎓 Bildung & Psychologie
- • Testnormierung
- • Percentile Ranks
- • Leistungsbewertung
- • Standardisierte Tests
Computational Aspects
💻 Algorithmen und Implementierung
Effiziente Berechnung von Quantilen:
Python (NumPy):
import numpy as np
# Verschiedene Quantilmethoden:
np.quantile(data, 0.5) # Median
np.percentile(data, 75) # 75. Perzentil
np.quantile(data, [0.25, 0.5, 0.75]) # Quartile
R:
quantile(data, 0.5) # Standard-Methode
quantile(data, 0.5, type=7) # R-Standard
# 9 verschiedene Typen verfügbar
Manual Implementation:
def empirical_quantile(data, p):
sorted_data = sorted(data)
n = len(sorted_data)
index = int(np.ceil(n * p)) - 1
return sorted_data[max(0, index)]
💡 Praktische Tipps
Hinweise für die korrekte Anwendung:
\[\text{1. Stichprobengröße beachten: Kleine n → unsichere Quantile}\] \[\text{2. Verschiedene Definitionen können unterschiedliche Ergebnisse liefern}\] \[\text{3. Bei Bindungen: Eindeutigkeit kann verloren gehen}\] \[\text{4. Interpolation vs. Diskrete Werte}\] \[\text{5. Extreme Quantile (p nahe 0 oder 1) sind weniger robust}\]
💡 Wichtige Eigenschaften der inversen Verteilungsfunktion:
- Eindeutigkeit: Jeder Wahrscheinlichkeit p wird genau ein Quantilwert zugeordnet
- Monotonie: F⁻¹ ist monoton nichtfallend
- Robustheit: Quantile sind robust gegen Ausreißer
- Interpretierbarkeit: Direkte Aussage über Datenverteilung
📊 Wann inverse Verteilungsfunktion verwenden:
- Quantilanalyse: Bestimmung charakteristischer Datenwerte
- Risikobewertung: VaR, Expected Shortfall, Stress Tests
- Qualitätskontrolle: Toleranzgrenzen und Prozessüberwachung
- Deskriptive Statistik: Five-Number Summary, Boxplots
Arithmetisches-Mittel, DurchschnittStreuungsmaße
Geometrisches Mittel
Harmonisches Mittel
Kontraharmonisches Mittel
Log-Geometrisches Mittel
Median
Modus
Minimum und Maximum
Perzentile
Oberes Quartil
Unteres Quartil
Quantile
KurtosisKorrelation & Zusammenhang
Skewness (Statistische Schiefe)
Standardabweichung
Gepoolte Standardabweichungl
Varianz
Gepoolte Varianz
Spannweite
Interquartilsabstand (IQR)
KovarianzVerteilungsfunktionen
Korrelationskoeffizient (Pearson, Spearman)
Rangkorrelation
Empirische inverse Verteilungsfunktion CDFTest & Schätzungen
Empirische Verteilungsfunktion CDF
Five-Number Summary
T-Test (einfach)Spezielle Verteilungen:
Chi-Quadrat-Test
Wilcoxon-Test
NormalverteilungRisiko & Wahrscheinlichkeit
Binomialverteilung
Poisson-Verteilung
Exponentialverteilung
Geburtstagsparadoxon
Satz von Bayes