Datentypen

Daten beschreiben Eigenschaften von Produkten, Prozessen oder Dienstleistungen. Diese Eigenschaften können in qualitative und quantitative Daten unterteilt werden.

Illustration

- 1

Zielsetzung

  • Daten verstehen
  • Verteilungen verstehen
  • Die richtigen Diagramme verwenden
  • Ergebnisse richtig vergleichen

Bestimmen des Merkmals

Bestimmen Sie das Merkmal und die Merkmalsausprägungen. Z.B. Merkmal = Alter; Merkmalsausprägung = 42 Jahre.

Kategorisierung der Merkmalsausprägungen

Die Merkmalsausprägungen müssen in eine Skala gesetzt werden, um den Datentyp zu definieren.

- 3

Nominal: Es lässt sich nur „gleich“ oder „ungleich“ abgrenzen.
Ordinal: Ein Wert ist höher oder niedriger als ein anderer.
Metrisch: Es lassen sich aussagekräftige Rechnungen durchführen.

Auswertung und Interpretation der Daten

Nach der Identifizierung der Daten können diese mit der Statistik ausgewertet werden.

Mit der folgenden Abbildung können die Daten korrekt eingeordnet werden.

- 5

Verteilungen werden in der Statistik üblicherweise durch Funktionen beschrieben. Es existieren Modelle (Formen) für stetige und für diskrete Verteilungen.

- 7

Die Binomialverteilung ist eine diskrete Verteilungen. Mit ihr kann man die Häufigkeit von Merkmalen, in zwei Ausprägungen darstellen. Z.B. Anzahl Fehler in einer Produktion.

- 9

Die Poissonverteilung ist ein spezieller Fall der Binomialverteilung.
Mit ihr werden die Anzahl der Fehler pro Einheit beschrieben, die in einer Einheit vorkommen.

- 11

Die Hypergeometrische Verteilung wird verwendet, wenn die Stichproben aus kleinen Grundgesamtheiten ohne Zurücklegen gezogen werden. Ein Beispiel sind die Lottozahlen.

- 13

Die Normalverteilung ist die wichtigste Verteilungsfunktion für stetige Daten. Die meisten statistischen Verfahren basieren auf normalverteilten Daten.

- 15

Die Lognormalverteilung ist linkssteil und rechtsschief und nimmt keine Werte kleiner als 0 an. Sie wird häufig angewendet, um Prozesszeiten zu beschreiben.

- 17

Die Weibullverteilung ist in ihrem
Verlauf sehr flexibel. Über die Parameterwerte kann die Kurve
an verschiedene Verläufe angepasst werden. Beispiele sind Lebensdaueranalysen.