Inverse Empirische Verteilungsfunktion Rechner

Online Berechnung von Quantilen und Perzentilen aus Datenreihen


📊 Inverse Empirische Verteilungsfunktion (F⁻¹)

Quantilfunktion zur Bestimmung von Perzentilen und Quantilen

💡 Alle reellen Zahlen erlaubt. Automatische Sortierung erfolgt intern
F⁻¹( )
Wahrscheinlichkeitswert zwischen 0 und 1 (z.B. 0.5 für Median)
Methode für Quantilberechnung
Unterstützte Dateiformate: .txt, .csv (eine Zahl pro Zeile oder kommagetrennt)
📊
Inverse Verteilungsfunktion: Bestimmt zu einem gegebenen Wahrscheinlichkeitswert p den entsprechenden Datenwert (Quantil).
⚠️ Fehler:

Geben Sie Ihre Datenreihe in das Textfeld ein, wählen Sie das gewünschte Quantil/Perzentil und klicken Sie auf Berechnen. Die inverse empirische Verteilungsfunktion bestimmt zu einem gegebenen Wahrscheinlichkeitswert den entsprechenden Datenwert und ist fundamental für die Berechnung von Quantilen, Perzentilen und Quartilen.


💡 Inverse Empirische Verteilungsfunktion

\(F^{-1}(p) = x_{(\lceil np \rceil)}\)  |  Quantilfunktion für empirische Daten


Inverse Verteilungsfunktion und Quantile verstehen

Die inverse empirische Verteilungsfunktion (auch empirische Quantilfunktion genannt) ist die Umkehrfunktion der empirischen Verteilungsfunktion. Sie ordnet einem Wahrscheinlichkeitswert p (mit 0 ≤ p ≤ 1) denjenigen Datenwert zu, bei dem genau ein Anteil p der Beobachtungen kleiner oder gleich diesem Wert ist. Diese Funktion ist fundamental für die Bestimmung von Quantilen, Perzentilen und Quartilen und spielt eine zentrale Rolle in der deskriptiven Statistik und Datenanalyse.

📊 Grunddefinition

Quantilfunktion:

F⁻¹(p) = x(k), k = ⌈np⌉
Umkehrung der empirischen Verteilungsfunktion
📈 Eigenschaften
  • • Monoton nichtfallend
  • • Wertebereich: [min(x), max(x)]
  • • Rechtsseitig stetig
  • • Basis für Quantile
🎯 Anwendungen
  • • Quantilberechnung
  • • Perzentilbestimmung
  • • Boxplot-Konstruktion
  • • Risikobewertung
⚙️ Wichtige Quantile
  • • Q1 (25%): 1. Quartil
  • • Q2 (50%): Median
  • • Q3 (75%): 3. Quartil
  • • P90, P95: Risikoquantile

Mathematische Grundlagen

📊 Formale Definition

Für eine sortierte Stichprobe x(1) ≤ x(2) ≤ ... ≤ x(n):

\[\text{Inverse empirische Verteilungsfunktion: } F_n^{-1}(p) = x_{(k)}\] \[\text{wobei } k = \lceil n \cdot p \rceil \text{ (aufrunden auf nächste ganze Zahl)}\] \[\text{Alternative: } k = \lfloor n \cdot p \rfloor + 1\] \[\text{Eigenschaften: } 0 \leq p \leq 1, \quad F_n^{-1}(p) \in \{x_{(1)}, ..., x_{(n)}\}\]

🔄 Beziehung zur Verteilungsfunktion

Zusammenhang zwischen F und F⁻¹:

\[\text{Empirische Verteilungsfunktion: } F_n(x) = \frac{1}{n}\sum_{i=1}^n \mathbf{1}_{x_i \leq x}\] \[\text{Inverse Beziehung: } F_n(F_n^{-1}(p)) \geq p\] \[\text{und } F_n^{-1}(F_n(x)) \leq x\] \[\text{Für p-Quantil: } x_p = F_n^{-1}(p)\] \[\text{Interpretation: Mindestens } 100p\% \text{ der Daten sind } \leq x_p\]

📊 Verschiedene Quantildefinitionen

Alternative Berechnungsmethoden für Quantile:

\[\text{Methode 1 (Inverted CDF): } Q(p) = x_{(\lceil np \rceil)}\] \[\text{Methode 2 (Averaging): } Q(p) = \frac{x_{(k)} + x_{(k+1)}}{2}\] \[\text{wobei } k = \lfloor np \rfloor \text{ und } k+1 = \lceil np \rceil\] \[\text{Methode 3 (Linear Interpolation):}\] \[Q(p) = x_{(k)} + (np - k)(x_{(k+1)} - x_{(k)})\] \[\text{R-Quantile: 9 verschiedene Methoden implementiert}\]

Praktische Berechnungsbeispiele

📝 Beispiel 1: Quartilberechnung

Aufgabe: Bestimme Quartile für die Datenreihe: 2, 6, 4, 8, 3, 1
Schritt 1: Sortierung
Schritt 2: Quartilberechnung

\[\text{Sortierte Daten: } 1, 2, 3, 4, 6, 8 \quad (n = 6)\] \[\text{Q1 (p = 0.25): } k = \lceil 6 \cdot 0.25 \rceil = 2 \Rightarrow Q1 = x_{(2)} = 2\] \[\text{Q2 (p = 0.50): } k = \lceil 6 \cdot 0.50 \rceil = 3 \Rightarrow Q2 = x_{(3)} = 3\] \[\text{Q3 (p = 0.75): } k = \lceil 6 \cdot 0.75 \rceil = 5 \Rightarrow Q3 = x_{(5)} = 6\]

Interpretation: 25% ≤ 2, 50% ≤ 3, 75% ≤ 6

📝 Beispiel 2: Perzentilberechnung

Aufgabe: 90. Perzentil für Testergebnisse: 72, 85, 90, 78, 92, 88, 76, 95, 82, 89
Anwendung: Bestimmung von Leistungsgrenzen
Berechnung:

\[\text{Sortierte Daten: } 72, 76, 78, 82, 85, 88, 89, 90, 92, 95 \quad (n = 10)\] \[\text{P90 (p = 0.90): } k = \lceil 10 \cdot 0.90 \rceil = 9\] \[\text{P90 = } x_{(9)} = 92\] \[\text{Interpretation: } 90\% \text{ der Kandidaten haben } \leq 92 \text{ Punkte}\]

Anwendung: Nur 10% erreichen mehr als 92 Punkte (Auszeichnung)

📝 Beispiel 3: Risikomanagement

Aufgabe: Value at Risk (VaR) aus Renditedaten
Daten: Tägliche Renditen (%) eines Portfolios
VaR-Berechnung:

\[\text{Renditen: } -2.1, 1.5, -0.8, 2.3, -1.2, 0.9, -3.1, 1.8, -0.5, 2.7\] \[\text{Sortiert: } -3.1, -2.1, -1.2, -0.8, -0.5, 0.9, 1.5, 1.8, 2.3, 2.7\] \[\text{VaR}_{95\%} \text{ (p = 0.05): } k = \lceil 10 \cdot 0.05 \rceil = 1\] \[\text{VaR}_{95\%} = x_{(1)} = -3.1\%\] \[\text{Interpretation: Mit 95\% Wahrscheinlichkeit Verlust } \leq 3.1\%\]

Risikomanagement: Maximaler erwarteter Tagesverlust: 3.1%

Anwendungen in verschiedenen Bereichen

📈 Finanz- & Risikomanagement
  • • Value at Risk (VaR)
  • • Expected Shortfall
  • • Stress Testing
  • • Portfolio-Optimierung
📊 Qualitätskontrolle
  • • Prozess-Quantile
  • • Toleranzgrenzen
  • • Ausschussraten
  • • Six Sigma Analyse
🏥 Medizin & Gesundheit
  • • Referenzbereiche
  • • Wachstumsperzentile
  • • Laborwerte-Interpretation
  • • Epidemiologische Studien
🎓 Bildung & Psychologie
  • • Testnormierung
  • • Percentile Ranks
  • • Leistungsbewertung
  • • Standardisierte Tests

Computational Aspects

💻 Algorithmen und Implementierung

Effiziente Berechnung von Quantilen:

Python (NumPy):
import numpy as np
# Verschiedene Quantilmethoden:
np.quantile(data, 0.5) # Median
np.percentile(data, 75) # 75. Perzentil
np.quantile(data, [0.25, 0.5, 0.75]) # Quartile

R:
quantile(data, 0.5) # Standard-Methode
quantile(data, 0.5, type=7) # R-Standard
# 9 verschiedene Typen verfügbar

Manual Implementation:
def empirical_quantile(data, p):
  sorted_data = sorted(data)
  n = len(sorted_data)
  index = int(np.ceil(n * p)) - 1
  return sorted_data[max(0, index)]

💡 Praktische Tipps

Hinweise für die korrekte Anwendung:

\[\text{1. Stichprobengröße beachten: Kleine n → unsichere Quantile}\] \[\text{2. Verschiedene Definitionen können unterschiedliche Ergebnisse liefern}\] \[\text{3. Bei Bindungen: Eindeutigkeit kann verloren gehen}\] \[\text{4. Interpolation vs. Diskrete Werte}\] \[\text{5. Extreme Quantile (p nahe 0 oder 1) sind weniger robust}\]
💡 Wichtige Eigenschaften der inversen Verteilungsfunktion:
  • Eindeutigkeit: Jeder Wahrscheinlichkeit p wird genau ein Quantilwert zugeordnet
  • Monotonie: F⁻¹ ist monoton nichtfallend
  • Robustheit: Quantile sind robust gegen Ausreißer
  • Interpretierbarkeit: Direkte Aussage über Datenverteilung
📊 Wann inverse Verteilungsfunktion verwenden:
  • Quantilanalyse: Bestimmung charakteristischer Datenwerte
  • Risikobewertung: VaR, Expected Shortfall, Stress Tests
  • Qualitätskontrolle: Toleranzgrenzen und Prozessüberwachung
  • Deskriptive Statistik: Five-Number Summary, Boxplots