Five-Number Summary Rechner
Online Berechnung der Fünf-Punkte-Zusammenfassung für deskriptive Statistik
Geben Sie Ihre Datenreihe in das Textfeld ein und klicken Sie auf Berechnen. Die Five-Number Summary liefert eine kompakte Übersicht über die Verteilung Ihrer Daten und ist die Grundlage für Boxplot-Darstellungen und Ausreißer-Identifikation.
💡 Five-Number Summary
\(\{x_{(1)}, Q_1, \text{Median}, Q_3, x_{(n)}\}\) | Vollständige Charakterisierung der Datenverteilung
Five-Number Summary und Boxplot-Analyse verstehen
Die Five-Number Summary (Fünf-Punkte-Zusammenfassung) ist ein fundamentales Konzept der deskriptiven Statistik, das eine vollständige Charakterisierung einer Datenverteilung durch fünf Kennwerte ermöglicht. Diese kompakte Darstellung bildet die Grundlage für Boxplot-Diagramme, Ausreißer-Identifikation und explorative Datenanalyse. Sie ist besonders wertvoll für den schnellen Überblick über Lage, Streuung und Form von Datenverteilungen.
📊 Die fünf Kennwerte
- • Minimum: Kleinster Wert
- • Q1: Unteres Quartil (25%)
- • Median: Mittlerer Wert (50%)
- • Q3: Oberes Quartil (75%)
- • Maximum: Größter Wert
📈 Eigenschaften
- • Robust gegen Ausreißer
- • Quartile teilen Daten in Viertel
- • Grundlage für Boxplots
- • Keine Normalverteilung nötig
🎯 Anwendungen
- • Explorative Datenanalyse
- • Boxplot-Konstruktion
- • Ausreißer-Identifikation
- • Verteilungsvergleich
⚙️ Abgeleitete Maße
- • IQR = Q3 - Q1
- • Spannweite = Max - Min
- • Ausreißer-Grenzen
- • Quartilskoeffizient
Mathematische Grundlagen
📊 Formale Definition
Für eine sortierte Stichprobe x₍₁₎ ≤ x₍₂₎ ≤ ... ≤ x₍ₙ₎:
\[\text{Five-Number Summary} = \{x_{(1)}, Q_1, Q_2, Q_3, x_{(n)}\}\] \[\text{wobei:}\] \[\text{Minimum: } x_{(1)} \text{ (kleinster Wert)}\] \[\text{Erstes Quartil: } Q_1 = P_{25} \text{ (25. Perzentil)}\] \[\text{Median: } Q_2 = P_{50} \text{ (50. Perzentil)}\] \[\text{Drittes Quartil: } Q_3 = P_{75} \text{ (75. Perzentil)}\] \[\text{Maximum: } x_{(n)} \text{ (größter Wert)}\]
🔄 Quartilberechnung
Verschiedene Methoden zur Quartilbestimmung:
\[\text{Methode 1 (Inklusiv): } Q_k = x_{(\lceil kn/4 \rceil)}\] \[\text{Methode 2 (Exklusiv): } Q_k = x_{(k(n+1)/4)}\] \[\text{Methode 3 (Interpolation): }\] \[Q_k = x_{(j)} + (h)(x_{(j+1)} - x_{(j)})\] \[\text{wobei } j = \lfloor kn/4 \rfloor \text{ und } h = kn/4 - j\] \[\text{R-Standard: 9 verschiedene Typen verfügbar}\]
📊 Ausreißer-Identifikation
Tukey's Box-and-Whisker Plot Regel:
\[\text{Interquartilsabstand: } \text{IQR} = Q_3 - Q_1\] \[\text{Untere Ausreißer-Grenze: } Q_1 - 1.5 \times \text{IQR}\] \[\text{Obere Ausreißer-Grenze: } Q_3 + 1.5 \times \text{IQR}\] \[\text{Milde Ausreißer: außerhalb } [Q_1 - 1.5 \times \text{IQR}, Q_3 + 1.5 \times \text{IQR}]\] \[\text{Extreme Ausreißer: außerhalb } [Q_1 - 3 \times \text{IQR}, Q_3 + 3 \times \text{IQR}]\]
Praktische Berechnungsbeispiele
📝 Beispiel 1: Standard-Berechnung
Aufgabe: Five-Number Summary für Datenreihe: 2, 7, 4, 9, 3, 6, 8, 5, 1
Schritt 1: Sortierung
Schritt 2: Quartilberechnung
\[\text{Sortierte Daten: } 1, 2, 3, 4, 5, 6, 7, 8, 9 \quad (n = 9)\] \[\text{Minimum: } x_{(1)} = 1\] \[\text{Q1: Position } 0.25 \times (9+1) = 2.5 \Rightarrow Q_1 = 2.5\] \[\text{Median: } x_{(5)} = 5\] \[\text{Q3: Position } 0.75 \times (9+1) = 7.5 \Rightarrow Q_3 = 7.5\] \[\text{Maximum: } x_{(9)} = 9\] \[\text{Five-Number Summary: } \{1, 2.5, 5, 7.5, 9\}\]
Interpretation: Symmetrische Verteilung ohne Ausreißer
📝 Beispiel 2: Mit Ausreißern
Aufgabe: Datenreihe mit extremen Werten: 5, 5, 6, 6, 6, 7, 7, 8, 25
Ausreißer-Analyse: Identifikation extremer Werte
Berechnung:
\[\text{Sortierte Daten: } 5, 5, 6, 6, 6, 7, 7, 8, 25 \quad (n = 9)\] \[\text{Five-Number Summary: } \{5, 6, 6, 7, 25\}\] \[\text{IQR} = 7 - 6 = 1\] \[\text{Untere Grenze: } 6 - 1.5 \times 1 = 4.5\] \[\text{Obere Grenze: } 7 + 1.5 \times 1 = 8.5\] \[\text{Ausreißer: } 25 > 8.5 \Rightarrow \text{Extremer Wert}\]
Ergebnis: 25 ist ein extremer Ausreißer, der die Verteilung verzerrt
📝 Beispiel 3: Schiefe Verteilungen
Aufgabe: Rechtsschiefe Verteilung analysieren
Daten: 1, 1, 2, 2, 3, 4, 7, 10, 15
Schiefe-Interpretation:
\[\text{Five-Number Summary: } \{1, 2, 3, 7, 15\}\] \[\text{Untere Hälfte: } Q_2 - \text{Min} = 3 - 1 = 2\] \[\text{Obere Hälfte: } \text{Max} - Q_2 = 15 - 3 = 12\] \[\text{Asymmetrie: Obere Hälfte deutlich größer}\] \[\text{Quartilskoeffizient: } \frac{Q_3 + Q_1 - 2 \cdot Q_2}{Q_3 - Q_1} = \frac{7 + 2 - 6}{5} = 0.6\]
Diagnose: Stark rechtsschiefe (positive) Verteilung
Anwendungen in verschiedenen Bereichen
📈 Explorative Datenanalyse
- • Erste Datenübersicht
- • Verteilungsform erkennen
- • Ausreißer identifizieren
- • Datensätze vergleichen
📊 Qualitätskontrolle
- • Prozessüberwachung
- • Toleranzgrenzen
- • Produktqualität
- • Ausschussraten
🏥 Medizin & Gesundheit
- • Referenzbereiche
- • Wachstumsperzentile
- • Laborwerte-Interpretation
- • Therapie-Monitoring
🎓 Bildung & Bewertung
- • Leistungsverteilungen
- • Notenspiegel
- • Testergebnisse
- • Benchmarking
Boxplot-Konstruktion und -Interpretation
📦 Boxplot-Komponenten
Aufbau und Bedeutung der Boxplot-Elemente:
\[\text{Box: Enthält die mittleren 50\% der Daten (IQR)}\] \[\text{Untere Box-Grenze: } Q_1\] \[\text{Median-Linie: } Q_2 \text{ (in der Box)}\] \[\text{Obere Box-Grenze: } Q_3\] \[\text{Whiskers: Linien zu Min/Max (ohne Ausreißer)}\] \[\text{Unterer Whisker: Min bis } Q_1\] \[\text{Oberer Whisker: } Q_3 \text{ bis Max}\] \[\text{Ausreißer: Einzelne Punkte außerhalb der Whiskers}\]
📊 Computational Aspects
Implementierung in verschiedenen Software-Systemen:
R:
# Five-Number Summary
fivenum(data) # Tukey's version
summary(data) # mit Mittelwert
quantile(data, c(0, 0.25, 0.5, 0.75, 1))
boxplot(data) # Visualisierung
Python (NumPy/Pandas):
import numpy as np
import pandas as pd
# Five-Number Summary
np.percentile(data, [0, 25, 50, 75, 100])
pd.Series(data).describe() # erweitert
plt.boxplot(data) # mit Matplotlib
Excel:
=MIN(A:A), =QUARTILE(A:A,1), =MEDIAN(A:A)
=QUARTILE(A:A,3), =MAX(A:A)
💡 Wichtige Eigenschaften der Five-Number Summary:
- Robustheit: Unempfindlich gegen Ausreißer und extreme Werte
- Vollständigkeit: Charakterisiert Lage, Streuung und Schiefe
- Vergleichbarkeit: Standardisierte Darstellung verschiedener Datensätze
- Visualisierbarkeit: Direkte Übertragung in Boxplot-Diagramme
📊 Wann Five-Number Summary verwenden:
- Erste Datenexploration: Schneller Überblick über Datenverteilung
- Robuste Statistik: Bei Daten mit Ausreißern oder schiefen Verteilungen
- Vergleichende Analyse: Mehrere Gruppen oder Zeitreihen vergleichen
- Qualitätskontrolle: Prozessüberwachung und Toleranzgrenzen
Arithmetisches-Mittel, DurchschnittStreuungsmaße
Geometrisches Mittel
Harmonisches Mittel
Kontraharmonisches Mittel
Log-Geometrisches Mittel
Median
Modus
Minimum und Maximum
Perzentile
Oberes Quartil
Unteres Quartil
Quantile
KurtosisKorrelation & Zusammenhang
Skewness (Statistische Schiefe)
Standardabweichung
Gepoolte Standardabweichungl
Varianz
Gepoolte Varianz
Spannweite
Interquartilsabstand (IQR)
KovarianzVerteilungsfunktionen
Korrelationskoeffizient (Pearson, Spearman)
Rangkorrelation
Empirische inverse Verteilungsfunktion CDFTest & Schätzungen
Empirische Verteilungsfunktion CDF
Five-Number Summary
T-Test (einfach)Spezielle Verteilungen:
Chi-Quadrat-Test
Wilcoxon-Test
NormalverteilungRisiko & Wahrscheinlichkeit
Binomialverteilung
Poisson-Verteilung
Exponentialverteilung
Geburtstagsparadoxon
Satz von Bayes