Mittelwertkennzahlen in der Statistik

Mittelwertkennzahlen gelten in der Statistik als statistische Maßzahlen. Die Kategorie „Mittelwertkennzahl“ kann unterteilt werden in die Berechnung der Kennzahlen Modus, Median und arithmetisches bzw. geometrisches Mittel. Entscheidend für die Berechnung einer Kennzahl für ein Merkmal ist die Bestimmung des jeweiligen Skalenniveaus. Die nachfolgende Tabelle illustriert die Klassifizierung der Kennzahlen durch die Skalenniveaus:

SkalenniveauNominalOrdinalMetrisch
KennzahlModusMedianArithm. Mittel / geometr. Mittel

Modus

Der Modus ist ein statistischer Begriff, der die häufigste Wert in einer gegebenen Datenmenge beschreibt. Es gibt einen einzigen Modus, wenn es einen Wert gibt, der häufiger als alle anderen in der Datenmenge vorkommt. Es kann jedoch auch mehrere Modi geben, wenn es mehrere Werte gibt, die gleich häufig in der Datenmenge vorkommen.

Der Modus kann in verschiedenen Arten von Daten verwendet werden, einschließlich nominaler, ordinaler und sogar numerischer Daten. In nominalen Daten, wie zum Beispiel Geschlecht oder Augenfarbe, gibt der Modus an, welcher Wert am häufigsten vorkommt. In ordinalen Daten, wie zum Beispiel Bildungsniveau oder Einkommenskategorie, gibt der Modus den häufigsten Wert an, der eine bestimmte Rangfolge darstellt. In numerischen Daten, wie zum Beispiel Alter oder Gewicht, gibt der Modus den häufigsten Wert an, der in der Datenmenge vorkommt.

Ein wichtiger Punkt bei der Verwendung des Modus ist zu beachten, dass er nicht immer die beste Wahl für die Beschreibung der Verteilung von Daten ist. In Fällen, in denen die Daten keinen klaren Modus aufweisen oder in Fällen, in denen die Verteilung der Daten nicht normal ist, kann der Mittelwert oder die Mediane besser geeignet sein. Es ist auch wichtig zu beachten, dass der Modus nicht für die Berechnung von Varianz oder Standardabweichung verwendet werden kann.

Insgesamt ist der Modus ein nützliches Werkzeug in der statistischen Analyse, das hilft, die häufigste Wert in einer gegebenen Datenmenge zu identifizieren. Es ist jedoch wichtig, die Einschränkungen des Modus zu berücksichtigen und ihn in Verbindung mit anderen statistischen Maßen zu verwenden, um ein vollständigeres Verständnis der Datenverteilung zu erhalten.

Median

Der Median ist die Merkmalsausprägung der Beobachtung, die in der nach der Größe geordneten Beobachtungsreihe in der Mitte steht.

Der Median ist die Merkmalsausprägung der Beobachtung, die in der nach der Größe geordneten Beobachtungsreihe in der Mitte steht.

Berechnung:

Um den Median zu berechnen, muss man die Daten zunächst sortieren. Wenn die Anzahl der Werte in der Datenreihe gerade ist, ist der Median der Durchschnitt der beiden mittleren Werte. Wenn die Anzahl der Werte in der Datenreihe ungerade ist, ist der Median der mittlere Wert.

Hier ist ein Beispiel:

Angenommen, wir haben folgende Datenreihe: [3, 7, 8, 5, 1, 21, 23, 19]

Wir sortieren die Werte aufsteigend: [1, 3, 5, 7, 8, 19, 21, 23]

Die Anzahl der Werte in der Datenreihe ist 8, also ist die Anzahl der Werte ungerade. Der Median ist also der mittlere Wert, der in diesem Fall der Wert 7 ist.

Geometrisches Mittel

Das geometrische Mittel ist ein statistischer Begriff, der die Durchschnittsgröße einer Menge von Werten beschreibt. Im Gegensatz zum arithmetischen Mittel, das die Summe der Werte durch die Anzahl der Werte teilt, berechnet das geometrische Mittel die n-te Wurzel des Produkts aller Werte.

Das geometrische Mittel wird häufig verwendet, wenn die Daten eine breite Streuung aufweisen oder wenn die Daten positiv sind und die Nullwerte nicht in Betracht gezogen werden sollen. Es ist auch nützlich bei der Berechnung von Durchschnittswerten für Verhältnisse oder Quotienten, wie z.B bei der Berechnung des Durchschnittsertrags von Aktien oder der Durchschnittsgeschwindigkeit in einem Wettrennen.

Das geometrische Mittel kann auch verwendet werden, um die relative Veränderung von Werten zu berechnen und kann eine gute Schätzung der durchschnittlichen Wachstumsrate liefern. In diesem Fall wird die relative Veränderung von Werten berechnet und auf eine Prozentbasis umgerechnet.

Es ist jedoch zu beachten, dass das geometrische Mittel empfindlicher auf Ausreißer oder negative Werte reagiert als das arithmetische Mittel, da negative Werte das Ergebnis beeinträchtigen und zu ungültigen Ergebnissen führen können. Daher ist es wichtig, die Daten sorgfältig auf negative Werte oder Ausreißer zu überprüfen, bevor das geometrische Mittel berechnet wird.

Um das geometrische Mittel von n Werten zu berechnen, multiplizieren Sie alle n Werte miteinander und nehmen anschließend die n-te Wurzel dieses Produkts. In der Mathematikformel lautet es:

Geometrisches Mittel = (Wert1 * Wert2 * … * Wertn)^(1/n)

Insgesamt ist das geometrische Mittel ein nützliches Werkzeug in der statistischen Analyse, das hilft, die durchschnittliche Größe einer Menge von Werten zu bestimmen und ist besonders nützlich bei der Berechnung von Verhältnissen oder Quotienten. Es ist jedoch wichtig, die Einschränkungen des geometrischen Mittel zu berücksichtigen und es in Verbindung mit anderen statistischen Maßen zu verwenden, um ein vollständigeres Verständnis der Datenverteilung zu erhalten.

Arithmetisches Mittel

Das arithmetische Mittel, auch als Durchschnitt bezeichnet, ist ein statistischer Begriff, der die Summe aller Werte in einer gegebenen Datenmenge durch die Anzahl der Werte teilt. Es gibt eine einfache Formel zur Berechnung des arithmetischen Mittels:

Arithmetisches Mittel = (Wert1 + Wert2 + … + Wertn) / n

wo Wert1, Wert2, …, Wertn die Werte in der Datenmenge sind und n die Anzahl der Werte in der Datenmenge ist.

Das arithmetische Mittel ist ein sehr häufig verwendeter statistischer Wert, da es eine einfache Möglichkeit bietet, die mittlere Größe einer gegebenen Datenmenge zu bestimmen. Es ist jedoch wichtig zu beachten, dass das arithmetische Mittel empfindlich auf Ausreißer reagieren kann und in Fällen, in denen die Datenverteilung sehr ungleichmäßig ist, nicht immer die beste Schätzung der mittleren Größe liefert. In solchen Fällen kann es besser sein, den Median oder das geometrische Mittel zu verwenden.

Es gibt auch Situationen, in denen das arithmetische Mittel nicht anwendbar ist, wie bei nominalen Daten, die keine ordinalen Eigenschaft haben, oder bei der Verarbeitung von Verhältnissen oder Proportionen.

Insgesamt ist das arithmetische Mittel ein nützliches Werkzeug in der statistischen Analyse, das hilft, die mittlere Größe einer gegebenen Datenmenge zu bestimmen, aber es ist wichtig, seine Einschränkungen zu berücksichtigen und es in Verbindung mit anderen statistischen Maßen zu verwenden, um ein vollständigeres Verständnis der Datenverteilung zu erhalten.

Boxplots

Der Box-Plot ist ein Diagramm, das zur grafischen Darstellung der Verteilung eines mindestens ordinalskalierten Merkmals verwendet wird. Es fasst dabei verschiedene robuste Streuungs- und Lagemaße in einer Darstellung zusammen. Ein Box-Plot soll schnell einen Eindruck darüber vermitteln, in welchem Bereich die Daten liegen und wie sie sich über diesen Bereich verteilen. Vor dem Hintergrund werden alle Werte der sogenannten Fünf-Punkte-Zusammenfassung, also der Median, die zwei Quartile und die beiden Ausreißer, dargestellt. Kurze enge Blöcke eines Boxplots zeigen den Schwerpunkt der Daten an – hohe Dichte. In jedem Block liegen ein Viertel (25%) der Beobachtungswerte. Nachfolgend eine Übersicht zur Einordnung der Bestandteile eines Boxplots:

KenngrößeDefinitionBeschreibung
MinimumKleinster Datenwert des DatensatzesEnde eines Whiskers oder entferntester Ausreißer
Unteres QuartilDie kleinersten 25 % der Datenwerte sind kleiner als dieser oder gleich diesem KennwertBeginn der Box
MedianDie kleinsten 50% der Datenwerte sind kleiner als dieser oder gleich diesem KennwertStrich innerhalb der Box, gängiges Maß für die Lage der Daten. Die eine Hälfte der Beobachtungen ist kleiner oder gleich dem Wert, die andere Hälfte der Beobachtungen ist größer oder gleich dem Wert.
Oberes QuartilDie kleinsten 75% der Datenwerte sind kleiner als dieser oder gleich diesem KennwertEnde der Box
MaximumGrößter Datenwert des DatensatzesEnde eines Whiskers oder entferntester Ausreißer
SpannweiteGesamter Wertebereich des DatensatzesLänge des gesamten Box-Plots
InterquartilsabstandWertebereich, in dem sich die mittleren 50% der Daten befinden.Ausdehnung der Box, gibt den Abstand zwischen dem ersten und dem dritten Quartil (Q3–Q1) an.
AusreißerDatenwerte, die weit entfernt von den anderen Datenwerten liegen.können sich stark auf Ergebnisse auswirken

Mittelwertkennzahlen – Rechner

Daten eingeben (durch Komma getrennt)