Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.

Ähnliche Präsentationen


Präsentation zum Thema: "1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005."—  Präsentation transkript:

1 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

2 2 Inhalt Deskriptive Statistik: Einfache Kennzahlen –Lagemaße –Streuungsmaße –Konzentrationsmaße –Verhältniszahlen –Indexzahlen

3 3 Maßzahlen Parameter, Kollektivmaßzahlen Lageparameter (Mittelwerte) Streuungsparameter (Variabilitätsmaße, Variationsmaße) Schiefe Wölbung

4 4 Lagemaße und Mittelwerte Eigenschaften: –Liegen zwischen Minimum und Maximum der Daten –Wenn alle Daten derselben linearen Transformation unterworfen werden, macht auch das Lagemaß diese Transformation mit

5 5 Lagemaße und Mittelwerte Arithmetisches Mittel Median Modus Geometrisches Mittel Harmonisches Mittel Quantile

6 6 Arithmetisches Mittel Mittelwert, durchschnittlicher Wert. Für metrisch skalierte Merkmale. a 1,...,a n beobachtete Merkmalswerte eines Merkmals X

7 7 Arithmetisches Mittel Bsp. Merkmal X: Körpergröße in cm Merkmalswerte (a 1,...,a n, n = 5): 162, 170, 155, 187, 179 ā = 1/5 · ( ) = 170,6

8 8 Arithmetisches Mittel Eigenschaften (Betrachte Einzelwerte a i, i=1,...,n): Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0 Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert

9 9 Arithmetisches Mittel Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation: Bsp. Körpergröße: a i * = 0,01·a i –Transformierte Werte: 1,62; 1,70; 1,55; 1,87; 1,79 –ā* = 1/5 · (1,62+1,70+1,55+1,87+1,79) = 1,706 –ā* = 0,01 · ā = 0,01 · 170,6 = 1,706

10 10 Arithmetisches Mittel Arithmetische Mittel von zwei oder mehr Teilgesamtheiten: Bsp. Körpergröße: 2 Stpr. mit n 1 =n 2 =5 –Stpr. 1: 162, 170, 155, 187, 179 mit ā 1 = 170,6 –Stpr. 2: 172, 159, 193, 184, 168 mit ā 2 = 175,2 –ā = 1/(5+5) · ( ) = 172,9 = (5·170,6+5·175,2) / (5+5) = 172,9

11 11 Arithmetisches Mittel Gewogenes (gewichtetes) arithmetische Mittel Gewichte w 1,..., w n mit 0 w i 1 und Σ i w i =1 Für w 1 =... = w n = 1/n ergibt sich das gewöhnliche arithmetische Mittel

12 12 Median Median (Zentralwert): mindestens 50% der Beobachtungen a i nehmen eine Wert größer oder gleich bzw. kleiner oder gleich dem Median an. Sind x 1... x n der Größe nach geordnet, ist der Median x̃ 0,5 : x ((n+1)/2) n ungerade x̃ 0,5 = ½(x (n/2) +x (n/2+1) ) n gerade

13 13 Median Häufigkeitsverteilung: Median ist diejenige Merkmalsausprägung, bei der die Summenhäufigkeitsfunktion den Wert 0,5 überschreitet. Klassifizierte Daten: Der Median liegt in der Klasse, in der die Summenhäufigkeitsfunktion den Wert 0,5 erreicht.

14 14 Median Bsp. Körpergröße in cm: n = 10, –Merkmalswerte der Größe nach geordnet: 155, 159, 162, 168, 170, 172, 179, 184, 187, 193 –Median: x̃ 0,5 = ½(x (n/2) +x (n/2+1) ) = ½(x 5 +x 6 ) = ½( ) = 171 Bsp. Körpergröße in cm: n = 9, –Merkmalswerte der Größe nach geordnet: 155, 159, 162, 168, 170, 172, 179, 184, 187 –Median: x̃ 0,5 = x ((n+1)/2) = x 5 = 170

15 15 Quantile Geordnete Beobachtungsreihe x (1)... x (n) α-Quantil x (k) falls n·α keine ganze Zahl (k ist die auf n·α folgende ganze Zahl) x̃ α = 1/2 (x (k) +x (k+1) ) falls n·α ganze Zahl k=n·α Spezielle Quantile: –Median = 0,5-Quantil –Unteres Quartil = 0,25-Quantil –Oberes Quartil = 0,75-Quantil

16 16 Quantile Bsp. Körpergröße in cm: –Merkmalswerte der Größe nach geordnet (n=10): 155, 159, 162, 168, 170, 172, 179, 184, 187, 193 –Unteres Quartil = 0,25-Quantil, n · 0,25 = 2,5 also: x̃ 0,25 = x (k) = x (3) = 162 –Oberes Quartil = 0,75-Quantil, n · 0,75 = 7,5 also: x̃ 0,75 = x (k) = x (8) = 184

17 17 Modalwert Modalwert (Modus, häufigster Wert, dichtester Wert): Gibt die Ausprägung an, die die größte Häufigkeit in der Beobachtungsreihe besitzt. Für nominal skalierte Daten geeignet. Es gilt: h(x mod ) h(x i ) für alle Merkmalsausprägungen x i,...,x k. Klassifizierte Daten: Modalwert ist definiert als Klassenmitte der am dichtesten besetzten Klasse.

18 18 Geometrisches Mittel Voraussetzung: Daten verhältnisskaliert n Einzelwerte a 1,..., a n Merkmalsausprägungen relative Änderungen (z.B. Lohnerhöhung in %) Geometrisches Mittel:

19 19 Geometrisches Mittel Bsp. Produktionssteigerung eines Betriebes pro Jahr 4 Jahre mit Produktionssteigerungen von: 2%, 11%, 4%, 7% Durchschnittliche Steigerung: Durchschnittliche Produktionssteigerung: ~6%

20 20 Geometrisches Mittel Gewogenes (gewichtetes) geometrische Mittel Gewichte w 1,..., w n mit 0 w i 1 und Σ i w i =1 Für w 1 =...= w n =1/n ergibt sich das gewöhnliche geometrische Mittel

21 21 Harmonisches Mittel Nur positive od. negative Beobachtungswerte a 1,...,a n Gewogenes harmonisches Mittel: Gewichte w 1,...,w n mit 0 w i 1 und Σ i w i =1 Für w 1 =...= w n =1/n ergibt sich das gewöhnliche harmonische Mittel

22 22 Harmonisches Mittel Bsp. Hat man etwa die Beziehung U = P · M und gilt u i = x i ·m i und ist u i = U und m i = M, ergibt sich P = U / M P ist das mit w i gewogene harmonische Mittel der x i –U = Gesamtumsatz, u i = Einzelumsatz des i-ten Gutes –P = durchschnittlicher Preis pro Mengeneinheit, –x i = Einzelpreis pro Mengeneinheit des i-ten Gutes –M = Gesamtmenge, m i = umgesetzte Menge des i-ten Gutes

23 23 Mittel Vergleich arithmetische- geometrisches- und harmonisches Mittel: Bei positiven Beobachtungswerten a 1,...,a n gilt stets die Beziehung Bei identischen Beobachtungen a 1 =...=a n sind die Mittel gleich.

24 24 Streuungsmaße Varianz Standardabweichung Variationskoeffizient Mittlere absolute Abweichung Spannweite Quartilsabstand Schiefe Wölbung

25 25 Varianz Beobachtungswerte a 1,...,a n (metrisch skaliert) Streuungsmaß: Arithmetische Mittel der Abweichungsquadrate der Einzelwerte a i von ihrem arithmetischen Mittel Varianz (Mittlere quadratische Abweichung)

26 26 Varianz Bsp. Körpergröße von 5 Personen: 162, 170, 155, 187, 179 Arithmetisches Mittel = 170,6 Varianz (Mittlere quadratische Abweichung) σ² = 1/5 · [( ,6)² + … + ( ,6)² ] σ² = 131,44

27 27 Streuungsmaß Streuungsmaß: Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von a i von ihrem arithm. Mittel, da gilt: Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

28 28 Varianz Verschiebungssatz (Beziehung zw. MQ(M) und Varianz): Das bedeutet: –MQ(M) Varianz –MQ(M) = σ² wenn M = arithm. Mittel –Minimumeigenschaft des arithm. Mittels.

29 29 Varianz Rechenvereinfachung: Liegt eine Häufigkeitsverteilung vor: k Merkmalswerte x 1,...,x k mit abs. Häufigkeiten h i bzw. rel. Häufigkeiten f i (i=1,...,k) Varianz:

30 30 Varianz Varianz einer Grundgesamtheit, die aus 2 Teilgesamtheiten (n 1, n 2 ) besteht: mit

31 31 Varianz Klassifizierte Daten: Häufigkeitsverteilung Varianz näherungsweise berechnen, statt der Merkmalswerte x i werden die Klassenmitten x i ´ verwendet:

32 32 Varianz Bei unimodalen Verteilungen, ist die Varianz, die aus den klassifizierten Daten berechnet wird, größer als die Varianz, die aus den Einzelwerten berechnet wird. Bei konstanten Klasseneinteilungen (Δx): Sheppardsche Korrektur: σ²... die aus den klassifizierten Daten näherungsweise bestimmte Varianz

33 33 Varianz Dimension: Quadrat der Dimension der einzelnen Beobachtungen Eigenschaft: Varianz immer 0 Ist Varianz = 0, liegt keine Streuung vor, alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel.

34 34 Standardabweichung Standardabweichung = Quadratwurzel der Varianz

35 35 Varianz & Standardabweichung Eigenschaften: Lineare Transformation der Einzelwerte a i : a i * = α + βa i (i=1,...,n) Dann: Varianz: σ*² = β²σ² Standardabweichung: σ* = |β| σ Sonderfall: β=1, Transformation a i * = α + a i σ*² = σ² und σ* = σ

36 36 Standardisierung Standardisierung: –Spezielle lineare Transformation –Bildet aus Einzelwerten a i standardisierte Werte z i, indem von jedem a i das arithm. Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird. Arithm. Mittel der z i immer 0, Varianz der z i immer 1.

37 37 Variationskoeffizient Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen Relatives Streuungsmaß (für verhältnis- skalierte Merkmale mit ausschließlich positiven Merkmalswerten), bezieht die Standardabweichung σ (absolutes Streuungsmaß) auf das arithm. Mittel μ.

38 38 MAD Mittlere absolute Abw. Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (z.B. arithm. Mittel oder Median) Minimumeigenschaft des Medians: M beliebiger Wert

39 39 MAD Häufigkeitsverteilung der Daten MAD bezogen auf Mittelwert μ MAD aus Häufigkeitsverteilung von klassifizierte Daten: –Merkmalswerte x i durch Klassenmitten x i ´ ersetzen.

40 40 Spannweite (Range) Abstand zw. dem größten und dem kleinsten Wert Einzelwerte der Größe nach ordnen: a [1],…,a [n] R = a [n] - a [1] Häufigkeitsverteilung von k Merkmalsausprägungen: R = x k - x 1 Häufigkeitsverteilung von klassifizierten Daten: R = x k o - x 1 u Spannweite ist instabil gegenüber Ausreißern

41 41 Quartilsabstand Quartile Q 1, Q 2 (=Median), Q 3 teilen die Gesamtheit in 4 gleich große Teile. α-Quantil: a (k) falls n·α keine ganze Zahl (k die auf n·α folgende ganze Zahl) ã α = 1/2 (a (k) +a (k+1) ) falls n·α ganze Zahl k=n·α Quartilsabstand (Interquartile Range) definiert als Spannweite der 50% mittleren Werte: QA = Q 3 – Q 1 Eigenschaft: stabil gegenüber Ausreißern

42 42 Box-Plot Box-Plot: grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

43 43 Box-Plot Box-Plot für Vergleich von 2 Messreihen:

44 44 Box-Plot –Box: beinhaltet 50% der Daten (Grenzen: 1. und 3. Quartil), Darstellung des Medians. –Whiskers: maximal 1,5-mal die Länge der Box. –Ausreißer: Werte außerhalb der Whiskers. Ausreißer Krasse Ausreißer

45 45 Schiefe Gibt Richtung (rechts- oder linksschief) und Größenordnung der Schiefe einer unimodalen Häufigkeitsverteilung an. < 0 linksschiefe g 1 = 0 symmetrisch > 0 rechtsschiefe Kein direkter Streuungsparameter

46 46 Schiefe Schiefe einer Häufigkeitsverteilung aus gruppierten Daten (k Klassen): Verwendung der Klassenmittel od. der Klassenmitten Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen führen.

47 47 Schiefe Linksschiefe Verteilung: g 1 < 0

48 48 Schiefe Symmetrische Verteilung: g 1 = 0

49 49 Schiefe Rechtschiefe Verteilung: g 1 > 0

50 50 Wölbung Wölbung od. Kurtosis od. Exzeß: Maßzahl für unimodale Häufigkeitsverteilungen Gibt an, ob (bei gleicher Varianz) das absolute Maximum der Häufigkeitsvt. größer als bei der Dichte der Normalvt. ist.

51 51 Wölbung < 0 abs. Max. kleiner als bei N-Vt. g 2 = 0 Normalverteilung > 0 abs. Max. größer als bei N-Vt. Wölbung einer Häufigkeitsverteilung aus gruppierten Daten (k Klassen): Verwendung der Klassenmittel od. der Klassenmitten


Herunterladen ppt "1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005."

Ähnliche Präsentationen


Google-Anzeigen