Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

1 STATISIK LV Nr.: 0028 SS 2005 11.Mai 2005. 2 Streuungsmaße Varianz Standardabweichung Variationskoeffizient Mittlere absolute Abweichung Spannweite.

Ähnliche Präsentationen


Präsentation zum Thema: "1 STATISIK LV Nr.: 0028 SS 2005 11.Mai 2005. 2 Streuungsmaße Varianz Standardabweichung Variationskoeffizient Mittlere absolute Abweichung Spannweite."—  Präsentation transkript:

1 1 STATISIK LV Nr.: 0028 SS Mai 2005

2 2 Streuungsmaße Varianz Standardabweichung Variationskoeffizient Mittlere absolute Abweichung Spannweite Quartilsabstand Schiefe Wölbung

3 3 Varianz Beobachtungswerte a 1,...,a n (metrisch skaliert) Streuungsmaß: Arithmetische Mittel der Abweichungsquadrate der Einzelwerte a i von ihrem arithmetischen Mittel Varianz (Mittlere quadratische Abweichung)

4 4 Varianz Bsp. Körpergröße von 5 Personen: 162, 170, 155, 187, 179 Arithmetisches Mittel = 170,6 Varianz (Mittlere quadratische Abweichung) σ² = 1/5 · [( ,6)² + … + ( ,6)² ] σ² = 131,44

5 5 Varianz Streuungsmaß: quadrierte Summe der Abweichungen - nicht Summe der Abweichungen von a i von ihrem arithm. Mittel, da gilt: Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

6 6 Varianz Verschiebungssatz (Beziehung zw. MQ(M) und Varianz): Das bedeutet: –MQ(M) Varianz –MQ(M) = σ² wenn M = arithm. Mittel –Minimumeigenschaft des arithm. Mittels.

7 7 Varianz Rechenvereinfachung: Liegt eine Häufigkeitsverteilung vor: k Merkmalswerte x 1,...,x k mit abs. Häufigkeiten h i bzw. rel. Häufigkeiten f i (i=1,...,k) Varianz:

8 8 Varianz Klassifizierte Daten: Häufigkeitsverteilung Varianz näherungsweise berechnen, statt der Merkmalswerte x i werden die Klassenmitten x i ´ verwendet:

9 9 Varianz Bei unimodalen Verteilungen, ist die Varianz, die aus den klassifizierten Daten berechnet wird, größer als die Varianz, die aus den Einzelwerten berechnet wird. Bei konstanten Klasseneinteilungen (Δx): Sheppardsche Korrektur: σ²... die aus den klassifizierten Daten näherungsweise bestimmte Varianz

10 10 Varianz Dimension: Quadrat der Dimension der einzelnen Beobachtungen Eigenschaft: Varianz immer 0 Ist Varianz = 0, liegt keine Streuung vor, alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel.

11 11 Standardabweichung Standardabweichung = Quadratwurzel der Varianz

12 12 Varianz & Standardabweichung Eigenschaften: Lineare Transformation der Einzelwerte a i : a i * = α + βa i (i=1,...,n) Dann: Varianz: σ*² = β²σ² Standardabweichung: σ* = |β| σ Sonderfall: β=1, Transformation a i * = α + a i σ*² = σ² und σ* = σ

13 13 Varianz & Standardabweichung Eigenschaften: Varianz einer Grundgesamtheit, die aus 2 Teilgesamtheiten (n 1, n 2 ) besteht: mit

14 14 Standardisierung Standardisierung: –Spezielle lineare Transformation –Bildet aus Einzelwerten a i standardisierte Werte z i, indem von jedem a i das arithm. Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird. Arithm. Mittel der z i immer 0, Varianz der z i immer 1.

15 15 Variationskoeffizient Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen Relatives Streuungsmaß (für verhältnis- skalierte Merkmale mit ausschließlich positiven Merkmalswerten), bezieht die Standardabweichung σ (absolutes Streuungsmaß) auf das arithm. Mittel μ.

16 16 MAD Mittlere absolute Abw. Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (z.B. arithm. Mittel oder Median) Minimumeigenschaft des Medians: M beliebiger Wert

17 17 MAD Häufigkeitsverteilung der Daten MAD bezogen auf Mittelwert μ MAD aus Häufigkeitsverteilung von klassifizierte Daten: –Merkmalswerte x i durch Klassenmitten x i ´ ersetzen.

18 18 Spannweite (Range) Abstand zw. dem größten und dem kleinsten Wert Einzelwerte der Größe nach ordnen: a [1],…,a [n] R = a [n] - a [1] Häufigkeitsverteilung von k Merkmalsausprägungen: R = x k - x 1 Häufigkeitsverteilung von klassifizierten Daten: R = x k o - x 1 u Spannweite ist instabil gegenüber Ausreißern

19 19 Quartilsabstand Quartile Q 1, Q 2 (=Median), Q 3 teilen die Gesamtheit in 4 gleich große Teile. α-Quantil: a (k) falls n·α keine ganze Zahl (k die auf n·α folgende ganze Zahl) ã α = 1/2 (a (k) +a (k+1) ) falls n·α ganze Zahl k=n·α Quartilsabstand (Interquartile Range) definiert als Spannweite der 50% mittleren Werte: QA = Q 3 – Q 1 Eigenschaft: stabil gegenüber Ausreißern

20 20 Deskriptive Analyse: Box-Plot Box-Plot –Box: beinhaltet 50% der Daten (Grenzen: 1. und 3. Quartil), Darstellung des Medians. –Whiskers: maximal 1,5-mal die Länge der Box. –Ausreißer: Werte außerhalb der Whiskers. Ausreißer Krasse Ausreißer

21 21 Deskriptive Analyse: Box-Plot Box-Plot: grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

22 22 Deskriptive Analyse: Box-Plot Box-Plot für Vergleich von 2 Messreihen:

23 23 Schiefe Gibt Richtung (rechts- oder linksschief) und Größenordnung der Schiefe einer eingipfligen Häufigkeitsverteilung an. < 0 linksschiefe g 1 = 0 symmetrisch > 0 rechtsschiefe Kein direkter Streuungsparameter

24 24 Schiefe Schiefe einer Häufigkeitsverteilung aus gruppierten Daten (k Klassen): Verwendung der Klassenmittel od. der Klassenmitten Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen führen.

25 25 Schiefe Linksschiefe Verteilung: g 1 < 0

26 26 Schiefe Symmetrische Verteilung: g 1 = 0

27 27 Schiefe Rechtschiefe Verteilung: g 1 > 0

28 28 Wölbung Wölbung od. Kurtosis od. Exzeß: Maßzahl für eingipflige Häufigkeitsvt. Gibt an, ob (bei gleicher Varianz) das absolute Maximum der Häufigkeitsvt. größer als bei der Dichte der Normalvt. ist.

29 29 Wölbung < 0 abs. Max. kleiner als bei N-Vt. g 2 = 0 Normalverteilung > 0 abs. Max. größer als bei N-Vt. Wölbung einer Häufigkeitsverteilung aus gruppierten Daten (k Klassen): Verwendung der Klassenmittel od. der Klassenmitten

30 30 Konzentrationsmaße Metrisch skaliertes Merkmal X mit nur positiven Ausprägungen Frage: Wie teilt sich die Summe der Merkmalswerte x 1,…,x n in der Beobachtungsreihe auf die Untersuchungs- einheiten auf? Bsp: n landwirtschaftliche Betriebe, Größe der Nutzflächen: x 1,...,x n. Wie teilt sich die gesamte Nutzfläche auf die einzelnen Betriebe auf?

31 31 Konzentrationsmaße n Merkmalswerte werden durch q Merkmalsausprägungen a 1 <...

32 32 Konzentrationsmaße Lorenzkurve: Grafische Darstellung der Konzentration der Merkmalswerte Koordinatenkreuz: –Abszisse: es werden die nach der Größe der Merkmals- ausprägung geordneten relativen Häufigkeiten aufsummiert –Ordinate: Ausprägungen werden der Größe nach aufsummiert und auf Summe aller Ausprägungen bezogen

33 33 Konzentrationsmaße Verbinden der Punkte (k i,l i ) ergibt die Lorenzkurve, wobei immer k 0 =l 0 =0 und k q =l q =1 gilt. kiki lili 0 1 1

34 34 Konzentrationsmaße Interpretation: ein Punkt (k i,l i ) der Lorenz- kurve gibt an, dass auf k i · 100% der Untersuchungseinheiten l i · 100% des Gesamtbetrages aller Merkmalsaus- prägungen entfallen. Bsp. auf k i · 100% der landwirtschaftlichen Betriebe entfallen l i · 100% der gesamten Nutzfläche

35 35 Konzentrationsmaße Bsp. landwirtschaftliche Betriebe –Abszisse: Es wird der Prozentsatz der Betriebe mit der kleinsten Fläche bestimmt, dann wird der Prozentsatz der Betriebe mit der zweit- kleinsten Fläche bestimmt und zum Prozentsatz der Betriebe mit der kleinsten Fläche addiert, usw. –Ordinate: Flächenanteile der Betriebe bzgl. der Gesamtfläche werden der Flächengröße nach aufsummiert.

36 36 Konzentrationsmaße Bsp. landwirtschaftliche Betriebe

37 37 Konzentrationsmaße Bsp: landwirtschaftliche Betriebe

38 38 Konzentrationsmaße Bsp. Landwirtschaftliche Betriebe: Interpretation: auf k i · 100% der landwirtschaftlichen Betriebe entfallen l i · 100% der gesamten Nutzfläche –auf 42% der Betriebe entfallen 6,3% der Nutzfläche, –auf 60% der Betriebe entfallen 12,5% der Nutzfläche, –auf 78% der Betriebe entfallen 27% der Nutzfläche, –auf 94% der Betriebe entfallen 55% der Nutzfläche.

39 39 Konzentrationsmaße Extremfälle: Keine Konzentration, alle Untersuchungs- einheiten haben den gleichen Anteil am Gesamtbetrag. Lorenzkurve ist Diagonale. Gesamtbetrag konzentriert sich (fast) vollständig auf eine Untersuchungseinheit. Lorenzkurve liegt (fast) auf Abszisse, ist also (fast) senkrecht.

40 40 Konzentrationsmaße Extremfälle:

41 41 Konzentrationsmaße Gini-Koeffizient od. Lorenzsche Konzentrationsmaß (LKM): Maßzahl für die Konzentration. Definiert als das 2-fache der Fläche F zw. Diagonale und Lorenzkurve. LKM = 2F. Es gilt immer: 0 LKM (n-1)/n Standardisierter Gini-Koeffizient: LKM nor = n/(n-1) LKM

42 42 Konzentrationsmaße Berechnung von F: –k … Werte auf Abszisse –l … Werte auf Ordinate –q … Anzahl der verschiedenen Merkmalsausprägungen

43 43 Konzentrationsmaße Bsp. Landwirtschaftliche Nutzfläche LMK = 2F = i 2F i – 1 = 1,6048 – 1 = 0,6408 –mit i = 1,…,5 LKM nor = 50/49 · 0,6408 = 0,6539

44 44 Verhältniszahlen Quotient zweier Maßzahlen: Verhältniszahl Gliederungszahlen –Man bezieht eine Teilgröße auf eine ihr übergeordnete Gesamtgröße Beziehungszahlen –Quotient zweier sachlich sinnvoll in Verbindung stehender Maßzahlen Index-Zahlen –Quotient zweier Maßzahlen gleicher Art

45 45 Gliederungszahlen Bsp. Tagesproduktion 1500 Teile, davon 300 fehlerhaft. Dann sind 20% der Tagesproduktion Ausschuss (300/1500·100). Ausschussanteil ist eine Gliederungszahl

46 46 Beziehungszahlen Beziehungszahlen: Verursachungszahlen: Bezieht Bewegungsmassen auf die zugehörigen Bestandsmassen. Entsprechungszahlen: Alle Beziehungszahlen, bei denen man Ereignisse nicht auf ihren Bestand beziehen kann.

47 47 Beziehungszahlen Bsp. Verursachungszahlen: Geburtenziffer Bestandsmasse: Einwohner einer Stadt (E) Bewegungsmasse: Zahl der Lebend- geborenen (L) G = (L/E)*1000 Sagt, wie viele Geburten auf 1000 Einwohner einer Stadt entfallen.

48 48 Beziehungszahlen Bsp. Entsprechungszahlen: Schüler-Lehrer-Verhältnis (Zahl der Schüler) / (Zahl der Lehrer) Sagt, wie viele Schüler (ungefähr) auf eine Lehrer entfallen. Dies entspricht aber i.A. nicht der durchschnittlichen Klassengröße.

49 49 Indexzahlen Indexzahlen: Es werden zwei Maßzahlen der gleichen Art in Beziehung gesetzt. Messzahlen oder Einfache Indizes –Die zugehörigen Maßzahlen beschreiben eine realen Sachverhalt. (Zusammengesetzte) Indexzahlen –Eine der Maßzahlen ist eine Zahl, die einen fiktiven Zustand beschreibt.

50 50 Indexzahlen Einfache Indizes: Reihe von Maßzahlen, die man in Beziehung zueinander setzen will. x 0,...,x t Maßzahlen zu Zeitpunkten t, x 0 Maßzahl zum Basiszeitpunkt 0. Dann ist I 0t = x t / x 0 für t = 0, 1, 2,... eine Zeitreihe einfacher Indizes

51 51 Indexzahlen Messzahlen werden oftmals mit 100 multipliziert. Bsp. Umsatz im Jahr 5, bezogen auf Jahr 0: I 05 ·100 = x 5 /x 0 · 100 = 87 D.h. dass 87% des Umsatzes im Basisjahr im Jahr 5 umgesetzt werden. Oder: Es liegt eine Minderung des Umsatzes um 13% vor. Vergleich von I 05 ·100=87 mit I 06 ·100=90: Der Umsatz ist um 3 Prozentpunkte gestiegen.

52 52 Indexzahlen Umbasieren: Gegeben: Indizes I 0t zur Basisperiode 0 Gesucht: Indizes I kt zur Basisperiode k Berechung ohne Ursprungsdaten: Verkettung: Wenn für x t I 0t berechnet werden soll, und x 0 nicht bekannt ist. I 0t = I 0k · I kt

53 53 Indexzahlen Bsp. Umsatz für Jahre 1990 bis 1998

54 54 Indexzahlen Umbasieren: Index von 1996 zur Basisperiode 1990 sollen in Index zur Basisperiode 1994 umgerechnet werden. –I 1990,1996 = 0,90 (Basisperiode 1990) –I 1990,1994 = 0,93 (Basisperiode 1990) –I 1994,1996 = 0,90 / 0,93 = 0,97 (Basisperiode 1994) Verkettung: Weiterer Wert für 1998 –I 1990,1998 = I 1990,1994 · I 1994,1998 = 0,93 · 1,04 = 0,97

55 55 Indexzahlen Zusammengesetzte Indexzahlen (Indizes): Betrachte Warenkorb: n Waren zu einem Zeitpunkt t Mengen q t1,...,q tn Preise p t1,...,p tn Wert des Warenkorbes in Periode t:

56 56 Indexzahlen Wertindex: Vergleich Wert eines Warenkorbes zur Berichtsperiode t mit dem zur Basisperiode 0

57 57 Indexzahlen Bsp. Durchschnittlicher Verbrauch an Fleisch aller privaten Haushalte in einer Gemeinde. Basismonat 1, Berichtsmonat 12. –(Mengen in g, Preise in DM/kg)

58 58 Indexzahlen Bsp. Wertindex

59 59 Indexzahlen Bsp. Wertindex –100 · W 012 = 100 · 1,0119 = 101,19 –D.h. der tatsächliche Aufwand für Fleisch für die privaten Haushalte ist vom Basismonat bis zum Berichtsmonat um 1,19% gestiegen. –Es ist hier nicht berücksichtigt, dass der durchschnittliche Verbrauch im Berichtsmonat um 205g geringer ist.

60 60 Indexzahlen Preisindizes: Aussagen über die Preisentwicklung Für verschiedene Perioden das gleiche Mengenschema verwenden

61 61 Indexzahlen Preisindex nach Paasche Man vergleicht den Wert eines Warenkorbes q t1,...,q tn zur jeweiligen Berichtsperiode t mit dem Wert, den dieser unter der Preissituation zur Basisperiode gehabt hätte.

62 62 Indexzahlen Bsp. Preisindex nach Paasche

63 63 Indexzahlen Bsp. Preisindex nach Paasche D.h. nimmt man für beide Monaten den durchschnittlichen Verbrauch an Fleisch im Berichtsmonat als Mengenschema (Warenkorb) an, so sind die Preise in diesem Zeitraum um 4,65% gestiegen.

64 64 Indexzahlen Preisindex nach Laspeyres Der Warenkorb q 01,...,q 0n der Basisperiode 0 wird für alle Berichtsperioden zugrundegelegt und ihr fiktiver Wert zur Berichtsperiode t wird mit seinem Wert zur Basisperiode verglichen.

65 65 Indexzahlen Bsp. Preisindex nach Laspeyres D.h. Für die im Basismonat verbrauchten Mengen an Fleisch muss man in der Berichtsperiode 4,68% mehr Geld ausgeben.

66 66 Indexzahlen Vergleich Preisindizes nach Paasche und Laspeyres: L: Warenkorb muss nur für Basisperiode bestimmt werden, Kosten (+) Aktualität (-) P: Warenkorb muss für Berichtsperioden bestimmt werden, Kosten (-) Aktualität (+) Vergleich. Sind Abweichungen groß, muss der Warenkorb neu festgelegt werden. Fishersche Idealindex:

67 67 Indexzahlen Mengenindizes: Aussagen über Mengenentwicklung (unabhängig von der Preisentwicklung)

68 68 Indexzahlen Mengenindex nach Paasche Standardisierung nach den Preisen zur Berichtsperiode

69 69 Indexzahlen Bsp. Mengenindex nach Paasche D.h. der Verbrauch an Fleisch, gewichtet mit den Preisen im Berichtsmonat ist um 3,34% gesunken.

70 70 Indexzahlen Mengenindex nach Laspeyres Standardisierung nach den Preisen zur Basisperiode

71 71 Indexzahlen Bsp. Mengenindex nach Laspeyres D.h. der Verbrauch an Fleisch, gewichtet mit den Preisen zum Basismonat, ist um 3,31% gesunken.


Herunterladen ppt "1 STATISIK LV Nr.: 0028 SS 2005 11.Mai 2005. 2 Streuungsmaße Varianz Standardabweichung Variationskoeffizient Mittlere absolute Abweichung Spannweite."

Ähnliche Präsentationen


Google-Anzeigen