Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
1
Univariate Statistik M. Kresken
2
Graphische Darstellung
Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm M. Kresken
3
Häufigkeit des Geschlechts für n=55 Probanden
M. Kresken
4
Kreisdiagramm M. Kresken
5
Häufigkeit der Geschwisterkinder bei n=55 Probanden
M. Kresken
6
Stabdiagramm M. Kresken
7
Histogramm Zur Darstellung eines stetigen (auf einer metrischen Skala gemessenen) Merkmals Dazu wird die Messskala in Bereiche, die sogenannten Klassen, aufgeteilt. Klassen müssen den gesamten Wertevorrat überdecken (Vollständigkeit). Klassen dürfen sich nicht überschneiden (Disjunktheit). Insbesondere ist festzulegen, zu welcher Klasse die einzelnen Klassengrenzen gehören. M. Kresken
8
Histogramm Wird die untere Klasse zugeordnet linksgeschlossen Darstellung: [a1, a2) zur Klasse gehören alle Werte ab a1 bis unterhalb a2 Wird die obere Klasse zugeordnet rechtsgeschlossen Darstellung: (a1, a2] zur Klasse gehören alle Werte oberhalb von a1 bis einschließlich a2 M. Kresken
9
Häufigkeiten des systolischen Blutdrucks der n=55 Probanden
M. Kresken
10
Histogramm M. Kresken
11
Empirische Verteilungsfunktion
Die Klassenbildung bedeutet eine Zusammenfassung der Messergebnisse und damit eine Reduzierung der Information über den konkreten Daten. Eine graphische Veranschaulichung der Orginal-Messergebnisse eines quantitativen Merkmals ist die empirische Verteilungsfunktion. Dazu werden zu den Messwerten, die auf der Abszisse angegeben sind, die zugehörigen Summenhäufigkeiten auf der Ordinate angetragen. Die entstehenden Punkte werden durch eine Treppenfunktion miteinander verbunden. M. Kresken
12
Empirische Verteilungsfunktion
M. Kresken
13
Kenngrößen M. Kresken
14
Kenngrößen Ziel ist es, typische Eigenschaften einer Messreihe mit wenigen Zahlen zu beschreiben. Dadurch wird bewusst eine radikale Reduktion der in den konkreten Daten enthaltenen Information angestrebt. Zur Beschreibung der Verteilung von Messwerten sollte immer ein Lagemaß und ein Streuungsmaß angegeben werden. M. Kresken
15
Lagemaße Lagemaße Mittelwert Quantile Median Modalwert Streuungsmaße
Spannweite Standardabweichung/ Varianz Quartilsabstand Variationskoeffizient Box-Whisker Plot M. Kresken
16
Lagemaße (Lageparameter)
Beschreiben die zentrale Tendenz der Daten M. Kresken
17
Mittelwert Mittelwerte M. Kresken
18
Arithmetischer Mittelwert
Beschreibt den Schwerpunkt der Messwerte, wobei jeder einzelnen Beobachtung das gleiche Gewicht 1/n zukommt. x = _ x1 + x xn n = 1 j=1 xj Arithmetischer Mittelwert M. Kresken
19
Arithmetischer Mittelwert
Mittelwert der Blutzuckerkonzentrationen von n = 52 Probanden Berechnung des Mittelwertes: x = _ 52 = 92,4 Arithmetischer Mittelwert M. Kresken
20
Mittelwert Geometrischer Mittelwert: Werte: 0,25, 0,5, 1, 2, 4, 8, 16
x log2 x log2 x + 9 0,25 0,25 = 2-2 log2 0,25 = –2 = 7 0,5 0,5 = 2-1 log2 0,5 = –1 = 8 1 1 = 20 log2 1 = 0 0 + 9 = 9 2 2 = 21 log2 2 = 1 1 + 9 = 10 4 4 = 22 log2 4 = 2 2 + 9 = 11 8 8 = 23 log2 8 = 3 3 + 9 = 12 16 16 = 24 log2 16 = 4 4 + 9 = 13 M. Kresken
21
Mittelwert Geometrischer Mittelwert:
Transformierte Werte (log2 x + 9): 7, 8, 9, 10, 11, 12, 13 _ x = = 10 7 Rücktransformation: 10 – 9 = 1 1 = log2 2 21 = 2 Mittelwert: 2 M. Kresken
22
Quantile, Median Ein p-Quantil ist dadurch gekennzeichnet, dass mindestens der Anteil p der Werte kleiner oder gleich diesem Wert ist. x, das 0,5-Quantil, Median genannt Q1, das 0,25-Quantil, unteres Quartil genannt Q3, das 0,75-Quantil, oberes Quartil genannt Die 0,1-, 0, ,9-Quantile heißen Dezile. Die 0,01-, 0, ,09-Quantile heißen Percentile. ~ M. Kresken
23
Quantile, Median Das p-Quantil lässt sich aus der Rangliste von n Messwerten bestimmen. Zunächst wird das Produkt n x p berechnet. Ist n x p keine ganze Zahl, so ist das p-Quantil der k-te Wert x (k) der Rangliste, wobei k die auf n x p folgende ganze Zahl ist. Falls n x p eine ganze Zahl ist, so wird zur Bestimmung des p-Quantils zwischen den Werten x (n x p) und x (n x p + 1) interpoliert. (x (n x p) + x (n x p + 1) ) 1 2 M. Kresken
24
Quantile, Median Median und Quartile der Blutzuckerkonzentrationen von n = 52 Probanden Berechnung des Medians: Position in der Rangliste n x p = 52 x 0,5 = 26 Da 26 eine ganze Zahl ist, errechnet man den Median als den mittleren Messwert zwischen dem 26. und 27. Messwert der Rangliste. Der mediane Blutzuckerwert beträgt ( ) / 2 [mg/100 ml] = 91 [mg/100 ml] M. Kresken
25
Quantile, Median Median und Quartile der Blutzuckerkonzentrationen von n = 52 Probanden Berechnung des unteren Quartils: Position in der Rangliste n x p = 52 x 0,25 = 13 Da 13 eine ganze Zahl ist, errechnet man das untere Quartil als den mittleren Messwert zwischen dem 13. und 14. Messwert der Rangliste. Q1 = ( ) / 2 [mg/100 ml] = 86 [mg/100 ml] Berechnung des oberen Quartils: Q3 = ( ) / 2 [mg/100 ml] = 96 [mg/100 ml] M. Kresken
26
Quantile, Median Median der Körpergröße von n = 53 Probanden
Berechnung des Medians: Position in der Rangliste n x p = 53 x 0,5 = 26,5 Da 26,5 keine ganze Zahl ist, ist der 27. Messwert der Rangliste der Median Der mediane Körpergröße beträgt 172 cm M. Kresken
27
Modalwert Der Modalwert ist der Messwert mit der größten absoluten Häufigkeit. Er ist nur sinnvoll, wenn er eindeutig ist. Modalwert der Blutzuckerkonzentrationen von n = 52 Probanden: Die Werte 84 und 92 wurden jeweils sechs mal bestimmt. Der häufigste Messwert ist nicht eindeutig und der Modalwert damit nicht bestimmbar. M. Kresken
28
Modalwert, Median, Mittelwert
Der Modalwert ist ein sehr einfach bestimmbares Lagemaß. Der Vorteil des Medians gegenüber dem Mittelwert liegt vor allem darin, dass er durch einzelne „Ausreißer“ nicht beeinflusst wird. Insofern ist der Median ein robustes Maß. Ein Vorteil des Mittelwertes besteht darin, dass mit ihm Rechenoperationen durchgeführt werden können. M. Kresken
Ähnliche Präsentationen
© 2025 SlidePlayer.org Inc.
All rights reserved.