Häufigkeitsverteilungen klassierter Daten

Die Datenerhebung ist die Voraussetzung für die Datenanalyse. Nach der Datenerhebung besteht der nächste Schritt darin, die Daten in geordneter und logischer Form darzustellen, um ihre wesentlichen Merkmale hervorzuheben. Die Notwendigkeit einer angemessenen Darstellung der Daten ergibt sich aus der Tatsache, dass die gesammelten Daten in ihrer Rohform oft so umfangreich sind, dass sie nicht leicht zu verstehen und zu analysieren sind. Nach der Datenerhebung ist es daher häufig erforderlich, die Daten zu klassifizieren und so darzustellen, dass Ähnlichkeiten und Unterschiede zwischen den Daten deutlich werden.

Klassifizierung von Daten

Klassifikation ist der Prozess der Einteilung von Daten in verschiedene Gruppen oder Klassen nach bestimmten gemeinsamen Merkmalen. Die Funktionen der Klassifikation lassen sich wie folgt zusammenfassen

  • Sie verdichtet die Daten
  • Sie erleichtert Vergleiche
  • Sie hilft, die Beziehungen zu untersuchen
  •  Sie erleichtert die statistische Behandlung der Daten.

Die Klassifikation der Daten erfolgt in der Regel auf geographischer, chronologischer, qualitativer oder quantitativer Basis gemäß den folgenden Grundsätzen:

a) Bei der geographischen Klassifikation werden die Daten nach Orten, Gebieten oder Regionen geordnet.

b) Bei der zeitlichen Klassifikation werden die Daten nach der Zeit geordnet, d. h. wöchentlich, monatlich, vierteljährlich, halbjährlich, jährlich usw.

c) Bei der qualitativen Klassifikation werden die Daten nach Merkmalen wie Geschlecht, Familienstand, Bildungsniveau, Region, Betrieb, Krankheit usw. geordnet.

d) Bei der quantitativen Klassifikation werden die Daten nach bestimmten Merkmalen, die gemessen wurden, z. B. Größe, Gewicht usw., klassifiziert. Bei dieser Art der Klassifikation werden bestimmte Klassen gebildet, und die Einheiten, die zu diesen Klassen gehören, werden diesen Klassen zugeordnet. Das zu untersuchende quantitative Phänomen wird als Variable bezeichnet, weshalb diese Art der Klassifikation manchmal auch als Variablenklassifikation bezeichnet wird.

Variable: Das zu untersuchende quantitative Phänomen, wie z.B. Löhne, Niederschlagsmengen, Höhen, Gewichte, Alter usw., wird als Variable oder Variable bezeichnet. Mit anderen Worten, eine Größe, die von Individuum zu Individuum variieren kann, wird als Variable bezeichnet. Es werden zwei Arten von Variablen unterschieden

a) Kontinuierliche Variable: Größen, die innerhalb eines bestimmten Bereichs jeden numerischen Wert annehmen können, werden als kontinuierliche Variablen bezeichnet. Zum Beispiel ist die Körpergröße eines Menschen in verschiedenen Altersstufen eine kontinuierliche Variable.

b) Diskrete Variable: Größen, die nicht alle möglichen Werte annehmen können, werden als diskontinuierliche oder diskrete Variablen bezeichnet, z. B. kann die Anzahl der Tiere in einer Herde nur ganzzahlige Werte wie 2, 3, 4 usw. annehmen.

Häufigkeitsverteilung

Die Häufigkeitsverteilung ist eine statistische Tabelle, in der die Werte einer Variablen nebeneinander in der Reihenfolge ihrer Größe entweder einzeln oder in Gruppen zusammen mit den entsprechenden Häufigkeiten dargestellt werden. Daten über ein quantitatives Phänomen können auf vier Arten klassifiziert werden:

  • Die Menge oder Reihe von Einzelbeobachtungen – nicht gruppierte (rohe) oder geordnete (geordnete) Daten
  • Diskrete oder nicht gruppierte Häufigkeitsverteilung.
  • Gruppierte Häufigkeitsverteilung.
  • Kontinuierliche Häufigkeitsverteilung.

Neben anderen deskriptiven Methoden haben wir uns die Häufigkeitsverteilung klassierter Daten in einem umfassenden Fallbeispiel angeschaut: https://martin-grellmann.de/fiktives-fallbeispiel-datenanalyse-i