Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

1 STATISIK LV Nr.: 1852 WS 2005/06 6. Dezember 2005.

Ähnliche Präsentationen


Präsentation zum Thema: "1 STATISIK LV Nr.: 1852 WS 2005/06 6. Dezember 2005."—  Präsentation transkript:

1 1 STATISIK LV Nr.: 1852 WS 2005/06 6. Dezember 2005

2 2 Inhalt Maßzahlen: –Konzentrationsmaße –Verhältniszahlen 2-dimensionale Merkmale –Darstellung: Kontingenztafel, Grafiken –Korrelationsrechnung

3 3 Konzentrationsmaße Metrisch skaliertes Merkmal X mit positiven Ausprägungen Frage: Wie teilt sich die Summe der Merkmalswerte x 1,…,x n in der Beobachtungsreihe auf die Untersuchungs- einheiten auf? Bsp: n landwirtschaftliche Betriebe, Größe der Nutzflächen: x 1,...,x n. Wie teilt sich die gesamte Nutzfläche auf die einzelnen Betriebe auf?

4 4 Konzentrationsmaße n Merkmalswerte werden durch q Merkmalsausprägungen a 1 <...

5 5 Konzentrationsmaße Lorenzkurve: Grafische Darstellung der Konzentration der Merkmalswerte Koordinatenkreuz: –Abszisse: es werden die nach der Größe der Merkmals- ausprägung geordneten relativen Häufigkeiten aufsummiert –Ordinate: Ausprägungen werden der Größe nach aufsummiert und auf Summe aller Ausprägungen bezogen

6 6 Konzentrationsmaße Verbinden der Punkte (k i,l i ) ergibt die Lorenzkurve, wobei immer k 0 =l 0 =0 und k q =l q =1 gilt. kiki lili 0 1 1

7 7 Konzentrationsmaße Interpretation: ein Punkt (k i,l i ) der Lorenz- kurve gibt an, dass auf k i · 100% der Untersuchungseinheiten l i · 100% des Gesamtbetrages aller Merkmalsaus- prägungen entfallen. Bsp. auf k i · 100% der landwirtschaftlichen Betriebe entfallen l i · 100% der gesamten Nutzfläche

8 8 Konzentrationsmaße Bsp. landwirtschaftliche Betriebe –Abszisse: Es wird der Prozentsatz der Betriebe mit der kleinsten Fläche bestimmt, dann wird der Prozentsatz der Betriebe mit der zweit- kleinsten Fläche bestimmt und zum Prozentsatz der Betriebe mit der kleinsten Fläche addiert, usw. –Ordinate: Flächenanteile der Betriebe bzgl. der Gesamtfläche werden der Flächengröße nach aufsummiert.

9 9 Konzentrationsmaße Bsp. landwirtschaftliche Betriebe

10 10 Konzentrationsmaße Bsp: landwirtschaftliche Betriebe

11 11 Konzentrationsmaße Bsp. Landwirtschaftliche Betriebe: Interpretation: auf k i · 100% der landwirtschaftlichen Betriebe entfallen l i · 100% der gesamten Nutzfläche –auf 42% der Betriebe entfallen 6,3% der Nutzfläche, –auf 60% der Betriebe entfallen 12,5% der Nutzfläche, –auf 78% der Betriebe entfallen 27% der Nutzfläche, –auf 94% der Betriebe entfallen 55% der Nutzfläche.

12 12 Konzentrationsmaße Extremfälle: Keine Konzentration, alle Untersuchungs- einheiten haben den gleichen Anteil am Gesamtbetrag. Lorenzkurve ist Diagonale. Gesamtbetrag konzentriert sich (fast) vollständig auf eine Untersuchungseinheit. Lorenzkurve ist (fast) senkrecht.

13 13 Konzentrationsmaße Extremfälle:

14 14 Konzentrationsmaße Gini-Koeffizient od. Lorenzsche Konzentrationsmaß (LKM): Maßzahl für die Konzentration. Definiert als das 2-fache der Fläche (F) zw. Diagonale und Lorenzkurve. LKM = 2F. Es gilt immer: 0 LKM (n-1)/n Standardisierter Gini-Koeffizient: LKM nor = n/(n-1) LKM

15 15 Konzentrationsmaße Berechnung von F: –k … Werte auf Abszisse –l … Werte auf Ordinate –q … Anzahl der verschiedenen Merkmalsausprägungen

16 16 Konzentrationsmaße Bsp. Landwirtschaftliche Nutzfläche LMK = 2F = i 2F i – 1 = 1,6048 – 1 = 0,6408 –mit i = 1,…,5 LKM nor = 50/49 · 0,6408 = 0,6539

17 17 Verhältniszahlen Quotient zweier Maßzahlen: Verhältniszahl Gliederungszahlen –Man bezieht eine Teilgröße auf eine ihr übergeordnete Gesamtgröße Beziehungszahlen –Quotient zweier sachlich sinnvoll in Verbindung stehender Maßzahlen Index-Zahlen –Quotient zweier Maßzahlen gleicher Art

18 18 Gliederungszahlen Bsp. Tagesproduktion 1500 Teile, davon 300 fehlerhaft. Dann sind 20% der Tagesproduktion Ausschuss (300/1500·100). Ausschussanteil ist eine Gliederungszahl

19 19 Beziehungszahlen Beziehungszahlen: Verursachungszahlen: Bezieht Bewegungsmassen auf die zugehörigen Bestandsmassen. Entsprechungszahlen: Alle Beziehungszahlen, bei denen man Ereignisse nicht auf ihren Bestand beziehen kann.

20 20 Beziehungszahlen Bsp. Verursachungszahlen: Geburtenziffer Bestandsmasse: Einwohner einer Stadt (E) Bewegungsmasse: Zahl der Lebend- geborenen (L) G = (L/E)*1000 Sagt, wie viele Geburten auf 1000 Einwohner einer Stadt entfallen.

21 21 Beziehungszahlen Bsp. Entsprechungszahlen: Schüler-Lehrer-Verhältnis (Zahl der Schüler) / (Zahl der Lehrer) Sagt, wie viele Schüler (ungefähr) auf eine Lehrer entfallen. Dies entspricht aber i.A. nicht der durchschnittlichen Klassengröße.

22 22 Indexzahlen Indexzahlen: Es werden zwei Maßzahlen der gleichen Art in Beziehung gesetzt. Messzahlen oder Einfache Indizes –Die zugehörigen Maßzahlen beschreiben eine realen Sachverhalt. (Zusammengesetzte) Indexzahlen –Eine der Maßzahlen ist eine Zahl, die einen fiktiven Zustand beschreibt.

23 23 Indexzahlen Einfache Indizes: Reihe von Maßzahlen, die man in Beziehung zueinander setzen will. x 0,...,x t Maßzahlen zu Zeitpunkten t, x 0 Maßzahl zum Basiszeitpunkt 0. Dann ist I 0t = x t / x 0 für t = 0, 1, 2,... eine Zeitreihe einfacher Indizes

24 24 Indexzahlen Messzahlen werden oftmals mit 100 multipliziert. Bsp. Umsatz im Jahr 5, bezogen auf Jahr 0: I 05 ·100 = x 5 /x 0 · 100 = 87 D.h. dass 87% des Umsatzes im Basisjahr im Jahr 5 umgesetzt werden. Oder: Es liegt eine Minderung des Umsatzes um 13% vor. Vergleich von I 05 ·100=87 mit I 06 ·100=90: Der Umsatz ist um 3 Prozentpunkte gestiegen.

25 25 Indexzahlen Umbasieren: Gegeben: Indizes I 0t zur Basisperiode 0 Gesucht: Indizes I kt zur Basisperiode k Berechung ohne Ursprungsdaten: Verkettung: Wenn für x t I 0t berechnet werden soll, und x 0 nicht bekannt ist. I 0t = I 0k · I kt

26 26 Indexzahlen Bsp. Umsatz für Jahre 1990 bis 1998

27 27 Indexzahlen Umbasieren: Index von 1996 zur Basisperiode 1990 sollen in Index zur Basisperiode 1994 umgerechnet werden. –I 1990,1996 = 0,90 (Basisperiode 1990) –I 1990,1994 = 0,93 (Basisperiode 1990) –I 1994,1996 = 0,90 / 0,93 = 0,97 (Basisperiode 1994) Verkettung: Weiterer Wert für 1998 –I 1990,1998 = I 1990,1994 · I 1994,1998 = 0,93 · 1,04 = 0,97

28 28 Indexzahlen Zusammengesetzte Indexzahlen (Indizes): Betrachte Warenkorb: n Waren zu einem Zeitpunkt t Mengen q t1,...,q tn Preise p t1,...,p tn Wert des Warenkorbes in Periode t:

29 29 Indexzahlen Wertindex: Vergleich Wert eines Warenkorbes zur Berichtsperiode t mit dem zur Basisperiode 0

30 30 Indexzahlen Bsp. Durchschnittlicher Verbrauch an Fleisch aller privaten Haushalte in einer Gemeinde. Basismonat 1, Berichtsmonat 12. –(Mengen in g, Preise in DM/kg)

31 31 Indexzahlen Bsp. Wertindex

32 32 Indexzahlen Bsp. Wertindex –100 · W 012 = 100 · 1,0119 = 101,19 –D.h. der tatsächliche Aufwand für Fleisch für die privaten Haushalte ist vom Basismonat bis zum Berichtsmonat um 1,19% gestiegen. –Es ist hier nicht berücksichtigt, dass der durchschnittliche Verbrauch im Berichtsmonat um 205g geringer ist.

33 33 Indexzahlen Preisindizes: Aussagen über die Preisentwicklung Für verschiedene Perioden das gleiche Mengenschema verwenden

34 34 Indexzahlen Preisindex nach Paasche Man vergleicht den Wert eines Warenkorbes q t1,...,q tn zur jeweiligen Berichtsperiode t mit dem Wert, den dieser unter der Preissituation zur Basisperiode gehabt hätte.

35 35 Indexzahlen Bsp. Preisindex nach Paasche

36 36 Indexzahlen Bsp. Preisindex nach Paasche D.h. nimmt man für beide Monate den durchschnittlichen Verbrauch an Fleisch im Berichtsmonat als Mengenschema (Warenkorb) an, so sind die Preise in diesem Zeitraum um 4,65% gestiegen.

37 37 Indexzahlen Preisindex nach Laspeyres Der Warenkorb q 01,...,q 0n der Basisperiode 0 wird für alle Berichtsperioden zugrundegelegt und ihr fiktiver Wert in der Berichtsperiode t wird mit seinem Wert in der Basisperiode verglichen.

38 38 Indexzahlen Bsp. Preisindex nach Laspeyres D.h. Für die im Basismonat verbrauchten Mengen an Fleisch muss man in der Berichtsperiode um 4,68% mehr Geld ausgeben.

39 39 Indexzahlen Vergleich Preisindizes nach Paasche und Laspeyres: L: Warenkorb muss nur für Basisperiode bestimmt werden, Kosten (+) Aktualität (-) P: Warenkorb muss für Berichtsperioden bestimmt werden, Kosten (-) Aktualität (+) Vergleich. Sind Abweichungen groß, muss der Warenkorb neu festgelegt werden. Fishersche Idealindex:

40 40 Indexzahlen Mengenindizes: Aussagen über Mengenentwicklung (unabhängig von der Preisentwicklung)

41 41 Indexzahlen Mengenindex nach Paasche Standardisierung nach den Preisen zur Berichtsperiode

42 42 Indexzahlen Bsp. Mengenindex nach Paasche D.h. der Verbrauch an Fleisch, gewichtet mit den Preisen im Berichtsmonat ist um 3,34% gesunken.

43 43 Indexzahlen Mengenindex nach Laspeyres Standardisierung nach den Preisen zur Basisperiode

44 44 Indexzahlen Bsp. Mengenindex nach Laspeyres D.h. der Verbrauch an Fleisch, gewichtet mit den Preisen zum Basismonat, ist um 3,31% gesunken.

45 45 Zweidimensionale Merkmale Frage: Wie lässt sich der Zusammenhang bzw. die Abhängigkeit zw. zwei Merkmalen messen? –Wie stark ist der Zusammenhang bzw. die Abhängigkeit? Antwort durch Korrelationsrechnung. –Lässt sich der Zusammenhang in einer bestimmten Form darstellen? Antwort durch Regressionsrechnung.

46 46 Zweidimensionale Merkmale n Untersuchungseinheiten, 2 Merkmale X und Y, Ausprägungen des Merkmals X a 1,…,a l und Ausprägungen des Merkmals Y b 1,…,b m. 2-dimensionales Merkmal (X,Y) mit Ausprägungen (a j,b k ), mit absoluten Häufigkeiten h jk und relativen Häufigkeiten f jk =1/n·h jk

47 47 Kontingenztafel Häufigkeitsverteilung von (X,Y) wird durch Kontingenztafel dargestellt. X Yb1b1 …bmbm a1a1 h 11 …h 1m ::: alal h l1 …h lm

48 48 Kontingenztafel Bsp. Geschlecht (X) Rauchverhalten (Y): absolute und relative Häufigkeiten von (X,Y). X YRN-R w 932 m 527 X YRN-R w 0,120,44 m 0,070,37

49 49 Kontingenztafel Absolute Randhäufigkeiten –von a j für j=1,…,l und b k für k=1,...,m: Relative Randhäufigkeiten –von a j für j=1,…,l und b k für k=1,…,m: Randhäufigkeiten ergeben die Häufigkeits- verteilung des Merkmals X bzw.Y (Randverteilung).

50 50 Kontingenztafel Kontingenztafel absoluten Häufigkeiten und Randhäufigkeiten X Yb1b1 …bmbm Σ a1a1 h 11 …h 1m h 1. :::: alal h l1 …h lm h l. Σh.1 …h.m h.. =n

51 51 Kontingenztafel Kontingenztafel relative Häufigkeiten und Randhäufigkeiten X Yb1b1 …bmbm Σ a1a1 f 11 …f 1m f 1. :::: alal f l1 …f lm f l. Σf.1 …f.m f.. =1

52 52 Kontingenztafel Es gilt: Relative Randhäufigkeit = 1 / n · absolute Randhäufigkeit Summe der absoluten Randhäufigkeiten = n Summe der relativen Randhäufigkeiten = 1

53 53 Kontingenztafel Bsp. Geschlecht (X) Rauchverhalten (Y): absolute und relative Häufigkeiten und Randhäufigkeiten von (X,Y). X YRN-R w m X YRN-R w 0,120,440,56 m 0,070,370,44 0,190,811

54 54 Kontingenztafel Bsp. Geschlecht (X) Rauchverhalten (Y): Zeilenprozent: X YRN-R w 0,220,781 m 0,160,841 0,190,811 X YRN-R w m

55 55 Kontingenztafel Bsp. Geschlecht (X) Rauchverhalten (Y): Spaltenprozent: X YRN-R w 0,640,540,56 m 0,360,460, X YRN-R w m

56 56 Darstellung

57 57 Darstellung

58 58 Darstellung

59 59 Darstellung

60 60 Darstellung

61 61 Darstellung

62 62 Korrelation Yulesche Assoziationskoeffizient für eine Vierfeldertafel (X,Y) nominal skaliert Häufigkeitsverteilung von (X,Y) Es gilt: -1 A XY +1; falls ein h ij =0, so gilt: |A XY |=1; Vorzeichen nur in Verbindung Vierfeldertafel interpretierbar

63 63 Korrelation Bsp. Geschlecht – Raucher/Nichtraucher Leicht positiver Zusammenhang zw. Merkmalsausprägungen w und R RN-R w93241 m

64 64 Korrelation Bsp. Geschlecht – Raucher/Nichtraucher Leicht negativer Zusammenhang zw. Merkmalsausprägungen m und R RN-R m52732 w

65 65 Korrelationskoeffizient Bravais-Pearson Korrelationskoeffizient r XY 2-dimensionales metrisch skaliertes Merkmal (X,Y) mit Ausprägungen (a j,b k ) und Häufigkeiten h jk für j=1,…,l und k=1,…,m. Maß für den Zusammenhang zw. X und Y:

66 66 Korrelationskoeffizient r XY liegt immer im Intervall [-1,1] Extremfälle: -1 negativer linearer Zusammenhang r XY = 0 kein linearer Zusammenhang 1 positiver linearer Zusammenhang Interpretation: –r XY < 0 d.h. große Werte von X treten mit kleinen Werten von Y auf –r XY > 0 d.h. große Werte von X treten mit großen Werten von Y auf

67 67 Korrelationskoeffizient Probleme: Scheinkorrelation: X und Y hängen von einem dritten Merkmal Z ab –Bsp. Gefahr eines Waldbrandes (X) und schlechter Kornertrag (Y) hängen von der Stärke der Sonneneinstrahlung (Z) ab. Nonsenskorrelation: sachlogischer Zusammenhang zw. X und Y –Bsp. Korrelation zw. Anzahl der Störche und der Anzahl der Geburten in einem Land Nichtlinearer Zusammenhang: r XY misst nur einen linearer Zusammenhang

68 68 Korrelation

69 69 Korrelation

70 70 Korrelationskoeffizient Bsp. Körpergröße und Gewicht: r = 0,76 –Positiver linearer Zusammenhang zw. Körpergröße und Gewicht.

71 71 Korrelation Fechnersche Korrelationskoeffizient (für 2 metrisch skalierte Merkmale X und Y): r F Basiert auf Vorzeichen der transformierten Paare x* und y* 1 x* und y* gleiches Vorzeichen od. beide 0 v i = ½ genau einer der Werte x* bzw. y* = 0 0 sonst

72 72 Korrelation Fechnersche Korrelationskoeffizient: Werte im Intervalle [-1,1] +1 nicht nur bei positivem linearen Zusammenhang, sonder auch wenn gilt: oder

73 73 Korrelation Bsp. Hennen, Körpergewicht, Legeleistung

74 74 Korrelation Rangkorrelationen für ordinal skalierte Merkmale: Verwendung von Rangzahlen: Merkmal Z, Ausprägungen z 1,…,z n, der Größe nach ordnen (vom größten zum kleinsten Wert) z (1),…,z (n) und nummerieren. Rangzahl: R(z (i) ) = i für i=1,…,n Tritt ein Ausprägung mehrmals auf (Auftreten von Bindungen), dann Rang = arithm. Mittel der Ränge, die sie einnehmen. –Bsp: z (1) =8, z (2) =5, z (3) =5, z (4) =2, Ränge: R(z (1) )=1, R(z (2) )=2,5, R(z (3) )=2,5, R(z (4) )=4

75 75 Korrelation Spearmansche Rangkorrelationskoeffizient r S Entspricht dem Bravais-Pearson Koeffizienten der Rangzahlen Wert +1 schon bei monoton wachsenden Beobachtungen, d.h. es gilt für alle (x i,y i ), (x j,y j ): mit x i < x j ist auch y i < y j

76 76 Korrelation Bsp. Klausur- und Übungspunkte Einfachere Formel für den Spearmanschen Korrelationskoeffizienten (falls alle x i und y i verschieden sind (und d i =R(x i )–R(y i )):

77 77 Korrelation Bsp. Maturanoten Mathe, Deutsch, Englisch MatheDeutschEnglisch Mathe10,230,382 Deutsch0,2310,576 Englisch0,3820,5761


Herunterladen ppt "1 STATISIK LV Nr.: 1852 WS 2005/06 6. Dezember 2005."

Ähnliche Präsentationen


Google-Anzeigen