Median Rechner

Online Berechnung des robusten Zentralwerts einer Datenreihe


📊 Median (Zentralwert)

Der robuste Mittelwert gegen Ausreißer und schiefe Verteilungen

💡 Alle reellen Zahlen erlaubt. Robuster gegen Ausreißer als das arithmetische Mittel
Unterstützte Dateiformate: .txt, .csv (eine Zahl pro Zeile oder kommagetrennt)
📊
Median: Der mittlere Wert nach Sortierung. Teilt die Daten in zwei gleiche Hälften und ist robust gegen Ausreißer.
⚠️ Fehler:

Geben Sie Ihre Datenreihe in das Textfeld ein und klicken Sie auf Berechnen um den Median zu ermitteln. Der Median ist der robuste Zentralwert, der die Daten in zwei gleiche Hälften teilt und besonders geeignet ist bei schiefen Verteilungen oder Ausreißern.


💡 Median Berechnung

Ungerade Anzahl: \(\text{Median} = x_{(n+1)/2}\)  |  Gerade Anzahl: \(\text{Median} = \frac{x_{n/2} + x_{(n/2)+1}}{2}\)


Den Median verstehen

Der Median (auch Zentralwert oder 50. Perzentil genannt) ist ein robustes Lagemaß, das den mittleren Wert einer sortierten Datenreihe angibt. Er teilt die Daten so, dass genau 50% der Werte kleiner oder gleich und 50% größer oder gleich dem Median sind. Im Gegensatz zum arithmetischen Mittel ist der Median unempfindlich gegen Ausreißer und daher besonders wertvoll bei schiefen Verteilungen.

📊 Grunddefinition

Sortierung ist entscheidend:

x₍₁₎ ≤ x₍₂₎ ≤ ... ≤ x₍ₙ₎
50% der Werte darunter, 50% darüber
📈 Eigenschaften
  • • Robust gegen Ausreißer
  • • 50. Perzentil
  • • Teilt Daten in zwei Hälften
  • • Ordinal skaliert interpretierbar
🎯 Vorteile
  • • Unempfindlich gegen Extremwerte
  • • Bei schiefen Verteilungen ideal
  • • Einfach zu verstehen
  • • Auch für ordinale Daten geeignet
⚠️ Einschränkungen
  • • Nutzt nicht alle Informationen
  • • Weniger mathematisch handhabbar
  • • Bei symmetrischen Daten suboptimal
  • • Keine einfachen Rechenregeln

Mathematische Grundlagen

📊 Formale Definition

Für eine sortierte Datenreihe x₍₁₎ ≤ x₍₂₎ ≤ ... ≤ x₍ₙ₎:

\[\text{Bei ungerader Anzahl } n = 2k+1: \quad \text{Median} = x_{(k+1)}\] \[\text{Bei gerader Anzahl } n = 2k: \quad \text{Median} = \frac{x_{(k)} + x_{(k+1)}}{2}\] \[\text{Allgemein: } \text{Median} = Q_{0.5} = F^{-1}(0.5)\] \[\text{Wobei } F^{-1} \text{ die Quantilsfunktion ist}\]

🔄 Robustheit-Eigenschaften

Warum der Median robust ist:

\[\text{Breakdown Point: } \epsilon^* = 50\% \quad \text{(höchstmöglich für Lagemaße)}\] \[\text{Einfluss von Ausreißern: } \lim_{x_{\text{max}} \to \infty} \text{Median} = \text{konstant}\] \[\text{Equivariance: } \text{Median}(a + bX) = a + b \cdot \text{Median}(X)\] \[\text{Bis zu } \lfloor n/2 \rfloor \text{ Ausreißer haben keinen Einfluss}\]

📊 Beziehung zu anderen Quantilen

Der Median im Kontext der Quantilsfamilie:

\[\text{Minimum} = Q_0 < Q_{0.25} < \text{Median} = Q_{0.5} < Q_{0.75} < \text{Maximum} = Q_1\] \[\text{Interquartilsabstand: } \text{IQR} = Q_{0.75} - Q_{0.25}\] \[\text{Median Absolute Deviation: } \text{MAD} = \text{Median}(|X_i - \text{Median}(X)|)\] \[\text{Five-Number Summary: } \{Q_0, Q_{0.25}, Q_{0.5}, Q_{0.75}, Q_1\}\]

Praktische Berechnungsbeispiele

📝 Beispiel 1: Ungerade Anzahl

Aufgabe: Berechne den Median von 7, 9, 12, 1, 3, 2, 14
Methode: Sortierung und Auswahl des mittleren Werts
Berechnung:

\[\text{Unsortiert: } 7, 9, 12, 1, 3, 2, 14 \quad (n = 7)\] \[\text{Sortiert: } 1, 2, 3, \boxed{7}, 9, 12, 14\] \[\text{Position des Medians: } \frac{n+1}{2} = \frac{7+1}{2} = 4\] \[\text{Median} = x_{(4)} = 7\]

Antwort: Der Median beträgt 7 (mittlerer Wert der sortierten Liste)

📝 Beispiel 2: Gerade Anzahl

Aufgabe: Berechne den Median von 1, 2, 6, 9
Methode: Mittelwert der beiden mittleren Werte
Berechnung:

\[\text{Sortiert: } 1, \boxed{2, 6}, 9 \quad (n = 4)\] \[\text{Positionen der mittleren Werte: } \frac{n}{2} = 2 \text{ und } \frac{n}{2} + 1 = 3\] \[\text{Median} = \frac{x_{(2)} + x_{(3)}}{2} = \frac{2 + 6}{2} = 4\]

Interpretation: Der Median liegt zwischen den beiden mittleren Werten

📝 Beispiel 3: Robustheit gegen Ausreißer

Aufgabe: Vergleiche Median und arithmetisches Mittel mit Ausreißer
Daten: 1, 2, 3, 4, 1000 (extremer Ausreißer)
Vergleich:

\[\text{Sortiert: } 1, 2, \boxed{3}, 4, 1000 \quad (n = 5)\] \[\text{Median} = x_{(3)} = 3\] \[\text{Arithmetisches Mittel} = \frac{1+2+3+4+1000}{5} = \frac{1010}{5} = 202\] \[\text{Ohne Ausreißer (1,2,3,4): Mittel} = 2{,}5, \text{ Median} = 2{,}5\] \[\text{Einfluss des Ausreißers: Mittel } +7900\%, \text{ Median unverändert!}\]

Fazit: Der Median bleibt robust, das arithmetische Mittel wird stark verzerrt

Anwendungen in verschiedenen Bereichen

💰 Wirtschaft & Soziales
  • • Medianeinkommen
  • • Immobilienpreise
  • • Lebenserwartung
  • • Wartezeiten
🎓 Bildung & Psychologie
  • • Testergebnisse
  • • Reaktionszeiten
  • • Umfrageergebnisse
  • • Leistungsbewertungen
🔬 Medizin & Gesundheit
  • • Überlebenszeiten
  • • Behandlungsdauern
  • • Referenzwerte
  • • Klinische Studien
📊 Qualitätskontrolle
  • • Prozesszeiten
  • • Messwerte
  • • Fehleranalysen
  • • Robuste Statistiken

Wann Median vs. andere Lagemaße?

🎯 Entscheidungshilfe

Wann welches Lagemaß verwenden?

\[\text{Median verwenden bei:}\] \[\text{• Schiefen Verteilungen (nicht symmetrisch)}\] \[\text{• Vorhandenen Ausreißern}\] \[\text{• Ordinalen Daten}\] \[\text{• Robustheit gewünscht}\] \[\text{• "Typischer Wert" gesucht}\]

📊 Vergleich der Lagemaße

Charakteristische Unterschiede:

\[\text{Arithmetisches Mittel: Nutzt alle Werte, empfindlich für Ausreißer}\] \[\text{Median: Nur Position wichtig, robust gegen Ausreißer}\] \[\text{Modus: Häufigster Wert, bei kategorischen Daten}\] \[\text{Getrimmtes Mittel: Kompromiss zwischen Mittel und Median}\] \[\text{Bei symmetrischen Verteilungen: Mittel ≈ Median}\]

Algorithmen und Berechnungsmethoden

💻 Algorithmus zur Median-Berechnung

Effizienter Algorithmus in Pseudocode:

Algorithmus Median(X):
1. Sortiere Array X aufsteigend → X_sorted
2. n = Länge(X_sorted)
3. Falls n ungerade:
   return X_sorted[(n-1)/2]
4. Falls n gerade:
   return (X_sorted[n/2-1] + X_sorted[n/2]) / 2

Komplexität: O(n log n) wegen Sortierung
Quickselect-Alternative: O(n) im Durchschnitt

💡 Praktische Tipps

Hinweise für die korrekte Anwendung:

\[\text{1. Bei kleinen Datensätzen (n < 30): Vollständige Sortierung ok}\] \[\text{2. Bei großen Datensätzen: Quickselect oder approximative Methoden}\] \[\text{3. Bei gruppierten Daten: Interpolation zwischen Gruppen}\] \[\text{4. Bei diskreten Daten: Konvention für gerade Anzahl beachten}\] \[\text{5. Immer auf fehlende Werte prüfen vor der Berechnung}\]

Statistische Eigenschaften und Tests

📈 Asymptotische Eigenschaften

Statistische Eigenschaften des Medians:

\[\text{Asymptotische Normalität: } \sqrt{n}(\hat{m} - m) \xrightarrow{d} N\left(0, \frac{1}{4f(m)^2}\right)\] \[\text{Wobei } f(m) \text{ die Dichtefunktion am Median ist}\] \[\text{Effizienz relativ zum Mittel: } \frac{2}{\pi} \approx 0{,}637 \text{ (bei Normalverteilung)}\] \[\text{Bootstrap-Konfidenzintervall möglich}\]
💡 Wichtige Eigenschaften des Medians:
  • Robustheit: Breakdown Point von 50% - höchstmögliche Robustheit
  • Ordnungsstatistik: Basiert nur auf der Reihenfolge, nicht auf exakten Werten
  • Quantil: Spezialfall der Quantilsfunktion (50. Perzentil)
  • Teilung: Teilt die Daten in zwei gleich große Hälften
📊 Wann den Median verwenden:
  • Ausreißer: Bei extremen Werten, die das arithmetische Mittel verzerren
  • Schiefe Verteilungen: Bei asymmetrischen Datenverteilungen
  • Ordinale Daten: Bei Rangdaten oder Skalen ohne metrische Eigenschaften
  • Robuste Analyse: Wenn Stabilität wichtiger ist als Effizienz