Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und Streuungsmaßen z-Transformation Anja Fey, M.A.
Beschreibung statistischer Daten Statistische Daten können auf verschiedene Arten beschrieben bzw.charakterisiert werden: (Roh-)Daten können tabellarisch und grafisch in Häufigkeitsverteilungen und Diagrammen dargestellt werden. deskriptive Statistik 2. Wesentliche Verteilungsmerkmale der vorliegenden Daten können durch statistische Kennwerte, z.B. den Mittelwert, Modus, die Standardabweichung, Varianz ausgedrückt werden. Anja Fey, M.A.
Grafische Darstellung von Rohdaten Ausgangsmaterial: Rohwertliste bzw. Urliste a) z. B. Sammeln der Altersdaten dieses Statistikkurses 28, 21, 20, 46, 21, 45, 27, 23, 44, 21, 23, 24, 21, 27, 29, 21, b) Ordnen der Daten 20, 21, 21, 21, 21, 21, 23, 23, 24, 27, 27, 28, 29, 44, 45, 46 Anja Fey, M.A.
Grafische Darstellung von Rohdaten Festlegen der Kategorienbreite und Überführung in eine Häufigkeitsliste 20, 21, 21, 21, 21, 21, 23, 23, 24, 27, 27, 28, 29, 44, 45, 46 20-21 Jahre 23-24 Jahre 22-29 Jahre 44-36 Jahre Anja Fey, M.A.
Grafische Darstellung von Rohdaten Grafische Darstellung der Daten mittels Polygone und Histogrammen fb Anja Fey, M.A.
(1) Grafische Darstellung von Rohdaten Variationsbreite (Spannweite): x max – x min Kategorienbreite: Spannweite Anzahl der Kategorien Anja Fey, M.A.
Probleme bei der Darstellung von Daten Wie viele Kategorien sollen gebildet werden, damit man einen geeigneten Überblick über die Form der Datenverteilung bekommt? Sind die Kategorien zu breit, werden vorhandene Unterschiede verdeckt. Sind die Kategorien zu fein, können kleinere Abweichungen fälschlicherweise zu sehr auffallen. ? Anja Fey, M.A.
Beispiel für „schlecht“ gewählte Kategoriebildung Anja Fey, M.A.
Beispiel für „schlecht“ gewählte Kategoriebildung Anja Fey, M.A.
Orientierungshilfen zur Wahl der Kategorienbreite Mit wachsender Größe der Stichprobe können kleinere Kategorienbreiten gewählt werden. Je größer die Variationsbreite des Merkmals ist, desto breiter dürfen die Kategorien sein. Die Kategorienanzahl sollte der Übersichtlichkeit halber nicht größer 20 sein. Alle Kategorien sollten gleich breit sein. Anja Fey, M.A.
Verteilungskennwerte Zur kurzen und präzisen Darstellung von der Verteilung eines Merkmals verwendet man sog. Kennwerte. Mit Hilfe von Kennzahlen kann man Datenverteilungen aus unterschiedlichen Stichproben miteinander vergleichen Anja Fey, M.A.
Gängigsten Kennwerte Maße der zentralen Tendenz Arithmetische Mittel (x) Median (Md) Modelwerte bzw. Modus (Mo) Geometrische Mittel (GM) Harmonische Mittel (HM) Maße der Streuung (Dispersion) Variationsbreite Standardabweichung (s) Varianz (s2) 4 Quartile (Qi) Anja Fey, M.A.
Maße der zentralen Tendenz Welcher Wert kennzeichnet die Lage des Zentrums einer Verteilung am Besten? Modalwerte = derjenige Messwert, der am häufigsten vorkommt Median (Zentral- oder 50%-Wert) halbiert die Stichprobenverteilung, d.h. 50% aller Werte sind kleiner oder gleich und 50% aller Werte sind größer oder gleich. Anja Fey, M.A.
Maße der zentralen Tendenz Mittelwert (= arithmetische Mittel ) Summe aller beobachteten Merkmalswerte dividiert durch die Anzahl von Beobachtungen. Das arithmetische Mittel darf nur bei intervallskalierten Daten berechnet werden. Anja Fey, M.A.
2 wichtigsten Eigenschaften des arithmetischen Mittels Die Summe aller Abweichungen ist gleich Null. Die Summe der quadrierten Abweichungen der xi vom arithmetischen Mittel ist minimal Anja Fey, M.A.
Maße der Streuung Die Streuungsmaße charakterisieren die Variabilität eines Merkmals. Sie lassen eine Aussage darüber zu, wie homogen eine Stichprobe ist bzw. wie ähnlich sich die Mitglieder hinsichtlich eines zu messenden Merkmals sind. erlauben es, die Güte einer Schätzung bzw. die Zuverlässigkeit einer Prognose zu beurteilen. Anja Fey, M.A.
Maße der Streuung Gebräuchlichsten Streuungsmaße für intervallskalierte Daten: Standardabweichung (s) Varianz (s2) Anja Fey, M.A.
Standardnormalverteilung Anja Fey, M.A.
z-Wert z-Wert dient dazu, zwei Messwerte aus verschiedenen normalverteilten Datenmengen miteinander vergleichen zu können. z-Werte können zwischen -3 und +3 liegen Anja Fey, M.A.