Five-Number Summary Rechner

Online Berechnung der Fünf-Punkte-Zusammenfassung für deskriptive Statistik


📊 Five-Number Summary

Kompakte Charakterisierung von Datenverteilungen

💡 Alle reellen Zahlen erlaubt. Automatische Sortierung für Quartilberechnung
Verschiedene Standards für Quartilberechnung
Unterstützte Dateiformate: .txt, .csv (eine Zahl pro Zeile oder kommagetrennt)
📊
Five-Number Summary: Kompakte Beschreibung einer Datenverteilung durch fünf Kennwerte: Min, Q1, Median, Q3, Max.
⚠️ Fehler:

Geben Sie Ihre Datenreihe in das Textfeld ein und klicken Sie auf Berechnen. Die Five-Number Summary liefert eine kompakte Übersicht über die Verteilung Ihrer Daten und ist die Grundlage für Boxplot-Darstellungen und Ausreißer-Identifikation.


💡 Five-Number Summary

\(\{x_{(1)}, Q_1, \text{Median}, Q_3, x_{(n)}\}\)  |  Vollständige Charakterisierung der Datenverteilung


Five-Number Summary und Boxplot-Analyse verstehen

Die Five-Number Summary (Fünf-Punkte-Zusammenfassung) ist ein fundamentales Konzept der deskriptiven Statistik, das eine vollständige Charakterisierung einer Datenverteilung durch fünf Kennwerte ermöglicht. Diese kompakte Darstellung bildet die Grundlage für Boxplot-Diagramme, Ausreißer-Identifikation und explorative Datenanalyse. Sie ist besonders wertvoll für den schnellen Überblick über Lage, Streuung und Form von Datenverteilungen.

📊 Die fünf Kennwerte
  • Minimum: Kleinster Wert
  • Q1: Unteres Quartil (25%)
  • Median: Mittlerer Wert (50%)
  • Q3: Oberes Quartil (75%)
  • Maximum: Größter Wert
📈 Eigenschaften
  • • Robust gegen Ausreißer
  • • Quartile teilen Daten in Viertel
  • • Grundlage für Boxplots
  • • Keine Normalverteilung nötig
🎯 Anwendungen
  • • Explorative Datenanalyse
  • • Boxplot-Konstruktion
  • • Ausreißer-Identifikation
  • • Verteilungsvergleich
⚙️ Abgeleitete Maße
  • • IQR = Q3 - Q1
  • • Spannweite = Max - Min
  • • Ausreißer-Grenzen
  • • Quartilskoeffizient

Mathematische Grundlagen

📊 Formale Definition

Für eine sortierte Stichprobe x₍₁₎ ≤ x₍₂₎ ≤ ... ≤ x₍ₙ₎:

\[\text{Five-Number Summary} = \{x_{(1)}, Q_1, Q_2, Q_3, x_{(n)}\}\] \[\text{wobei:}\] \[\text{Minimum: } x_{(1)} \text{ (kleinster Wert)}\] \[\text{Erstes Quartil: } Q_1 = P_{25} \text{ (25. Perzentil)}\] \[\text{Median: } Q_2 = P_{50} \text{ (50. Perzentil)}\] \[\text{Drittes Quartil: } Q_3 = P_{75} \text{ (75. Perzentil)}\] \[\text{Maximum: } x_{(n)} \text{ (größter Wert)}\]

🔄 Quartilberechnung

Verschiedene Methoden zur Quartilbestimmung:

\[\text{Methode 1 (Inklusiv): } Q_k = x_{(\lceil kn/4 \rceil)}\] \[\text{Methode 2 (Exklusiv): } Q_k = x_{(k(n+1)/4)}\] \[\text{Methode 3 (Interpolation): }\] \[Q_k = x_{(j)} + (h)(x_{(j+1)} - x_{(j)})\] \[\text{wobei } j = \lfloor kn/4 \rfloor \text{ und } h = kn/4 - j\] \[\text{R-Standard: 9 verschiedene Typen verfügbar}\]

📊 Ausreißer-Identifikation

Tukey's Box-and-Whisker Plot Regel:

\[\text{Interquartilsabstand: } \text{IQR} = Q_3 - Q_1\] \[\text{Untere Ausreißer-Grenze: } Q_1 - 1.5 \times \text{IQR}\] \[\text{Obere Ausreißer-Grenze: } Q_3 + 1.5 \times \text{IQR}\] \[\text{Milde Ausreißer: außerhalb } [Q_1 - 1.5 \times \text{IQR}, Q_3 + 1.5 \times \text{IQR}]\] \[\text{Extreme Ausreißer: außerhalb } [Q_1 - 3 \times \text{IQR}, Q_3 + 3 \times \text{IQR}]\]

Praktische Berechnungsbeispiele

📝 Beispiel 1: Standard-Berechnung

Aufgabe: Five-Number Summary für Datenreihe: 2, 7, 4, 9, 3, 6, 8, 5, 1
Schritt 1: Sortierung
Schritt 2: Quartilberechnung

\[\text{Sortierte Daten: } 1, 2, 3, 4, 5, 6, 7, 8, 9 \quad (n = 9)\] \[\text{Minimum: } x_{(1)} = 1\] \[\text{Q1: Position } 0.25 \times (9+1) = 2.5 \Rightarrow Q_1 = 2.5\] \[\text{Median: } x_{(5)} = 5\] \[\text{Q3: Position } 0.75 \times (9+1) = 7.5 \Rightarrow Q_3 = 7.5\] \[\text{Maximum: } x_{(9)} = 9\] \[\text{Five-Number Summary: } \{1, 2.5, 5, 7.5, 9\}\]

Interpretation: Symmetrische Verteilung ohne Ausreißer

📝 Beispiel 2: Mit Ausreißern

Aufgabe: Datenreihe mit extremen Werten: 5, 5, 6, 6, 6, 7, 7, 8, 25
Ausreißer-Analyse: Identifikation extremer Werte
Berechnung:

\[\text{Sortierte Daten: } 5, 5, 6, 6, 6, 7, 7, 8, 25 \quad (n = 9)\] \[\text{Five-Number Summary: } \{5, 6, 6, 7, 25\}\] \[\text{IQR} = 7 - 6 = 1\] \[\text{Untere Grenze: } 6 - 1.5 \times 1 = 4.5\] \[\text{Obere Grenze: } 7 + 1.5 \times 1 = 8.5\] \[\text{Ausreißer: } 25 > 8.5 \Rightarrow \text{Extremer Wert}\]

Ergebnis: 25 ist ein extremer Ausreißer, der die Verteilung verzerrt

📝 Beispiel 3: Schiefe Verteilungen

Aufgabe: Rechtsschiefe Verteilung analysieren
Daten: 1, 1, 2, 2, 3, 4, 7, 10, 15
Schiefe-Interpretation:

\[\text{Five-Number Summary: } \{1, 2, 3, 7, 15\}\] \[\text{Untere Hälfte: } Q_2 - \text{Min} = 3 - 1 = 2\] \[\text{Obere Hälfte: } \text{Max} - Q_2 = 15 - 3 = 12\] \[\text{Asymmetrie: Obere Hälfte deutlich größer}\] \[\text{Quartilskoeffizient: } \frac{Q_3 + Q_1 - 2 \cdot Q_2}{Q_3 - Q_1} = \frac{7 + 2 - 6}{5} = 0.6\]

Diagnose: Stark rechtsschiefe (positive) Verteilung

Anwendungen in verschiedenen Bereichen

📈 Explorative Datenanalyse
  • • Erste Datenübersicht
  • • Verteilungsform erkennen
  • • Ausreißer identifizieren
  • • Datensätze vergleichen
📊 Qualitätskontrolle
  • • Prozessüberwachung
  • • Toleranzgrenzen
  • • Produktqualität
  • • Ausschussraten
🏥 Medizin & Gesundheit
  • • Referenzbereiche
  • • Wachstumsperzentile
  • • Laborwerte-Interpretation
  • • Therapie-Monitoring
🎓 Bildung & Bewertung
  • • Leistungsverteilungen
  • • Notenspiegel
  • • Testergebnisse
  • • Benchmarking

Boxplot-Konstruktion und -Interpretation

📦 Boxplot-Komponenten

Aufbau und Bedeutung der Boxplot-Elemente:

\[\text{Box: Enthält die mittleren 50\% der Daten (IQR)}\] \[\text{Untere Box-Grenze: } Q_1\] \[\text{Median-Linie: } Q_2 \text{ (in der Box)}\] \[\text{Obere Box-Grenze: } Q_3\] \[\text{Whiskers: Linien zu Min/Max (ohne Ausreißer)}\] \[\text{Unterer Whisker: Min bis } Q_1\] \[\text{Oberer Whisker: } Q_3 \text{ bis Max}\] \[\text{Ausreißer: Einzelne Punkte außerhalb der Whiskers}\]

📊 Computational Aspects

Implementierung in verschiedenen Software-Systemen:

R:
# Five-Number Summary
fivenum(data) # Tukey's version
summary(data) # mit Mittelwert
quantile(data, c(0, 0.25, 0.5, 0.75, 1))
boxplot(data) # Visualisierung

Python (NumPy/Pandas):
import numpy as np
import pandas as pd
# Five-Number Summary
np.percentile(data, [0, 25, 50, 75, 100])
pd.Series(data).describe() # erweitert
plt.boxplot(data) # mit Matplotlib

Excel:
=MIN(A:A), =QUARTILE(A:A,1), =MEDIAN(A:A)
=QUARTILE(A:A,3), =MAX(A:A)
💡 Wichtige Eigenschaften der Five-Number Summary:
  • Robustheit: Unempfindlich gegen Ausreißer und extreme Werte
  • Vollständigkeit: Charakterisiert Lage, Streuung und Schiefe
  • Vergleichbarkeit: Standardisierte Darstellung verschiedener Datensätze
  • Visualisierbarkeit: Direkte Übertragung in Boxplot-Diagramme
📊 Wann Five-Number Summary verwenden:
  • Erste Datenexploration: Schneller Überblick über Datenverteilung
  • Robuste Statistik: Bei Daten mit Ausreißern oder schiefen Verteilungen
  • Vergleichende Analyse: Mehrere Gruppen oder Zeitreihen vergleichen
  • Qualitätskontrolle: Prozessüberwachung und Toleranzgrenzen