Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistische Methoden II SS 2008 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag 10.00 - 12.30 (Pause: 11.30 - 11.45) Ort:Hörsaal Makarenkostraße (Kiste)

Ähnliche Präsentationen


Präsentation zum Thema: "Statistische Methoden II SS 2008 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag 10.00 - 12.30 (Pause: 11.30 - 11.45) Ort:Hörsaal Makarenkostraße (Kiste)"—  Präsentation transkript:

1 Statistische Methoden II SS 2008 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag 10.00 - 12.30 (Pause: 11.30 - 11.45) Ort:Hörsaal Makarenkostraße (Kiste) Übungen Gruppe 2: Hermann Haase Di 8.00 - 10.00 SR 222 Gruppe 1: Hermann Haase Di 10.00 - 12.00 SR 222 Gruppe 5: Svenja Schützhold Di 12.00 - 14.00 SR 222 Gruppe 7: Sebastian Grapenthin Di 14:00 - 16:00 HS 11 Gruppe 8: Svenja Schützhold Di 16:00 -18:00 SR 5 Gruppe 4: Sabine Storandt Mi 8.00 - 10.00 SR 222 Gruppe 3: - fällt weg - Mi 10.00 - 12.00 SR 222 Gruppe 6: Sebastian Grapenthin Mi 12.00 - 14.00 SR 3 SR 222 : Fleischmannstraße 6 SR 3 + 5 : Loefflerstraße 70 HS 11 : Domstraße 9a (Hist. Institut)

2 Statistische Methoden I WS 2007/2008 Einleitung: Wie schätzt man die Zahl der Fische in einem See? Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial 2.1. Der Häufigkeitsbegriff 2.2. Lage- und Streuungsparameter 2.3. Konzentrationsmaße (Lorenz-Kurve) 3. Mehrdimensionales Datenmaterial 3.1. Korrelations- und Regressionsrechnung 3.2. Indexzahlen 3.3. Saisonbereinigung

3 II. Wahrscheinlichkeitstheorie 1. Laplacesche Wahrscheinlicheitsräume 1.1. Kombinatorische Formeln 1.2. Berechnung von Laplace-Wahrschein- lichkeiten 2. Allgemeine Wahrscheinlichkeitsräume 2.1. Der diskrete Fall 2.2. Der stetige Fall 2.3. Unabhängigkeit und bedingte Wahrscheinlichkeit 3. Zufallsvariablen 3.1. Grundbegriffe 3.2. Erwartungswert und Varianz 3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz

4 4. Markov-Ketten 4.1. Übergangsmatrizen 4.2. Grenzverhalten irreduzibler Markov-Ketten 4.3. Gewinnwahrscheinlichkeiten 4.4. Beispiel Ruin der Spieler 4.5. Anwendungen

5 III. Induktive Statistik 1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung 2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle

6 3. Tests 3.1. Grundbegriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse

7 Statistische Methoden I WS 2007/2008 Literatur 1) G. Bamberg, F. Baur: Statistik. Oldenbourg 2) G. Bamberg, F. Baur: Statistik-Arbeitsbuch. Oldenbourg 3) L. Fahrmeir, R. Künstler, I. Pigeot, G. Tutz: Statistik. Springer 4) J. Schira: Statistische Methoden der VWL und BWL. Pearson Education 5) H. Haase: Stochastik für Betriebswirte. Shaker 6) J. Hartung: Statistik. Oldenbourg 7) R. Schlittgen: Einführung in die Statistik. Oldenbourg 8) A. Quatember: Statistik ohne Angst vor Formeln. Pearson Studium 9) H.-D. Radke: Statistik mit Excel. Markt + Technik

8

9 Die wichtigsten Tabellen

10 Übersicht I Konfidenzintervalle für den Erwartungswert

11 Übersicht II Konfidenzintervalle für die Varianz

12 Test für den Erwartungswert Varianz bekannt Fall Normalverteilung

13 Test für den Erwartungswert Varianz unbekannt Fall Normalverteilung

14 Chi-Quadrat-Tests Übersicht

15 Faustregeln Chi-Quadrat-Tests Test auf Anpassung Test auf Unabhängigkeit Test auf Homogenität

16 Weitere nützliche Übersichten in den Powerpoint-Präsentationen der Vorlesung! http://www.math-inf.uni-greifswald.de/algebra/

17 Beschreibende Statistik

18 Darstellung von Daten (Stem-Leaf-Diagramm, Box-Plot) Absolute und relative Häufigkeiten Empirische Verteilungsfunktion Lageparameter (arithmetisches Mittel, Median, Quantile, Quartile) Streuungsparameter (Varianz, emp. Varianz, Streuung) Lorenz-Kurve, Gini-Koeffizient Kovarianz Korrelationskoeffizient nach Bravais-Pearson Regressionsrechnung (lineare Regression, Regressionsgerade, Bestimmtheitsmaß) Peisindex nach Laspeyres und nach Paasche Zentrale Themen (praktischer Teil)

19 Beschreibende Statistik (= Deskriptive Statistik) Beschreibung von Datenmaterial Schließenden Statistik (= Induktive Statistik) Analyse von Datenmaterial, Hypothesen, Prognosen 1. Semester 2.Semester Wahrscheinlich- keitstheorie 1. Semester

20

21

22

23

24

25

26 Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten) 3 3 4 5 2 1 3 3 4 3 2 3 4 4 4 5 2 1 3 3 3 3 4 4 4 5 4 3 4 3 2 3 3 2 4 3 2 1 5 4 4 4 5 4 5 1 1 3 3 3 Hier die geordneten Daten 1 1 1 1 1 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5

27 Absolute Häufigkeiten H(1) = 5 H(2) = 6 H(3) = 18 H(4) = 15 H(5) = 6 h(1) = 0.1 h(2) = 0.12 h(3) = 0.36 h(4) = 0.3 h(5) = 0.12 Relative Häufigkeiten Kumulierte relative Häufigkeiten F(1) = 0.1 F(2) = 0.22 F(3) = 0.58 F(4) = 0.88 F(5) = 1

28 Fakultäten EMAU Berechnung der Winkel für ein Kreisdiagramm T: Theologische RSW: Rechts- und Staatswiss. Med: Medizinische Phil: Philosophische MathNat: Mathematisch-Naturwiss. K: Studienkolleg,... h(T) = 0.011 h(RSW) = 0.22 h(Med) = 0.164 h(Phil) = 0.309 h(MathNat) = 0.273 h(K) = 0.022 3.96 Grad 79.2 Grad 59.04 Grad 111.24 Grad 98.28 Grad 7.92 Grad

29 Kreisdiagramm Fakultäten EMAU

30

31 Stabdiagramm Zähne

32 Histogram Zähne

33 Empirische Verteilungsfunktion Zähne

34 Stem-Leaf-Diagramm Bei diesem Diagramm werden meist (siehe aber Aufgabe 3) nur die beiden führenden Ziffern berücksichtigt. Die erste Ziffer wird links von einer senkrecht gezogenen Linie eingetragen. Damit hat man den Stamm. Die zweiten Ziffern - die Blätter - werden rechts davon notiert, und zwar zeilenweise aufsteigend geordnet. Dabei muss jeder Wert des Datensatzes durch eine zweite Ziffer (ggf. Null!) repräsentiert werden. Kaltmieten

35

36 Charakterisierung von Merkmalen Merkmalen quantitative: Merkmale unterscheiden sich nach der Größe qualitative: Merkmale unterscheiden sich nach der Art Unterscheidung nach der zugrundeliegenden Werteskala Nominal- Ordinal- metrische Skala Unterscheidung zwischen qualitativen quantitativen

37 Nominal: keine Rangordnung Ordinal: Rangordnung, aber Zwischenwerte nicht interpretierbar metrisch:Rangordnung, Werte zwischen 2 Werten erlauben eine Interpretation Unterscheidung nach diskreten stetigen Merkmalen diskret: Menge der Werte abzählbar (evtl. abzählbar unendlich) stetig:Menge der Werte kontinuierlich, (z.B. reelle Zahlen oder ein Intervall reeller Zahlen)

38 Ordinal, diskret

39 metrisch, diskret

40 metrisch, stetig

41 Ordinal, diskret

42 Arithmetisches Mittel Merkmal Datensatz

43 Median Merkmal Geordneter Datensatz n ungerade: Wert, der in der Mitte steht n gerade: arithmetisches Mittel der beiden Werte, die in der Mitte stehen

44 Aufgabe 1

45 Aufgabe 2

46 Quantile

47

48

49

50 Boxplot Ober-, Untergrenze der Box: oberes, unteres Quartil dicker Strich in der Box: Median Ausreißer nach oben: Werte > oberes Quartil + 1.5 Quartilsabstand Ausreißer nach unten: Werte < unteres Quartil - 1.5 Quartilsabstand Jeder Ausreißer wird mit einem Symbol gesondert einge- tragen. Antennen: größter und kleinster Wert in der Datenliste, der kein Ausreißer ist

51 Aufgabe 3

52 Aufgabe 4

53 Mittelwert oder Median Grobe Faustregeln Metrische Skalierung Ordinale Skalierung Ausreißer wahrscheinlich Wenn sich die Werte irdendwie gegeneinander ausgleichen Mittelwert Median Mittelwert

54 Streuungsparameter Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.

55 Streuungsparameter Mittelwert Varianz Die Ungleichung gilt für jede Konstante c.

56 Rechenregeln für Mittelwert, Varianz und Streuung

57

58

59 Berechnung von Streuungsparametern an einem einfachen Beispiel

60 Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des Geldvermögens unter den einzelnen Bevölkerungsgruppen Verteilung von Marktanteilen Aufteilung der landwirtschaftlichen Nutzflächen in einer Region

61 Ein Markt wird von 5 Unternehmen beliefert. Die folgende Tabelle beschreibt die Aufteilung der Marktanteile:

62 Daraus ergeben sich die folgenden Werte für die Punkte auf der Lorenz-Kurve:

63 Dazu die Lorenz-Kurve:

64 Berechnung des Gini-Koeffizienten

65 Aufgabe 5

66 Aufgabe 6

67 Landwirtschaftlich genutzte Fläche einer Region

68 Dazu die Lorenz-Kurve:

69 Datenmatrix

70 Datentabelle für 2 Merkmale

71 Kontingenztafel der absoluten Häufigkeiten

72 Kontingenztafel der relativen Häufigkeiten

73 X: Art des Betriebes 1 = Handelsbetriebe 2 = Freie Berufe (Leistungsbetriebe) 3 = Fertigungsbetriebe Y: Art der hinterzogenen Steuer 1 = Lohnsteuer 2 = Einkommenssteuer 3 = Umsatzsteuer 4 = Sonstiges Betriebe und hinterzogene Steuer Kontingenztabelle

74 Kovarianz Merkmal Datensatz Merkmal Datensatz

75 Korrelationskoeffizient nach Bravais-Pearson Kovarianz (X,Y) (Streuung X) (Streuung Y)

76 Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig

77 X größerY größer X größerY kleiner

78 Positiver strikter Zusammenhang Negativer strikter Zusammenhang

79 Korrelationskoeffizient bei verschiedenen Konstellationen von Ausprägungen

80 Korrelationskoeffizient: 0.905 Korrelationskoeffizient: 1.00

81 Korrelationskoeffizient: 0.19 Korrelationskoeffizient: 0.52

82 Korrelationskoeffizient: -0.14 Korrelationskoeffizient: 0.00

83 Korrelationskoeffizient: -1.00 Korrelationskoeffizient: -0.62

84 Aufgabe 7

85 Aufgabe 8

86 Mögliche Funktionenklassen für die Regressionsrechnung

87 Lineare Funktionen Polynome Exponentialfunktionen ( Exponentielles Wachstum; x ist die Zeit ) Gompertz-Kurven Logistische Funktionen

88 Prinzip der kleinsten Quadrate (Kleinst-Quadrat-Schätzung) Man sucht in der betrachteten Klasse diejenige Funktion f, so dass die Summe der Abweichungsquadrate minimiert wird: Bestimme f, so dass minimal !!

89 Aufgaben der Regressionsrechnung Stellt man sich für den Moment x als die Zeit vor, so möchte man die beobachteten Werte auf die Zukunft extrapolieren. Man erstellt eine Prognose. Dazu bedient man sich der gefundenen Funktion f, um für eine Zeit x der Zukunft den Wert y = f(x) zu schätzen. 1. Extrapolation

90 2. Interpolation Man interessiert sich für den Wert von y = f(x) Für Zwischenwerte von x, d. h. für Werte x, die zwischen 2 beobachteten Werten liegen: Wieder bedient man sich der Funktion f, um eine Interpolation der Werte durchzuführen.

91 Lineare Regression Finde reelle Zahlen a und b, so dass der Wert von minimal wird! Mit anderen Worten: Finde den Punkt (a,b), an dem die Funktion ihr Minimum annimmt!

92 Steigung der Regressionsgeraden Schnitt der Regressionsgeraden mit der y-Achse bei

93 Bestimmtheitsmaß Maß für die Güte der Anpassung der Daten an die Regressionsfunktion Dabei ist

94 Im Falle linearer Regression ist das Bestimmtheitsmaß gleich dem Quadrat des Korrelationskoeffizienten nach Bravais-Pearson!

95 In einem Kaufhauskonzern mit 10 Filialen soll die Wirkung von Werbeausgaben auf die Umsatzsteigerung untersucht werden. Die Daten sind: X: Werbeausgaben in 1000 Euro Y: Umsatzsteigerung in 10 000 Euro

96 Demonstrationsbeispiel Lineare Regression Mittelwerte Varianzen Kovarianz

97 Steigung der Regressionsgeraden Schnitt der Regressionsgeraden mit der y-Achse bei

98 Aufgabe 9

99 Aufgabe 10

100 Statistische Maßzahlen Bisher : Lagemaße Mittelwert Median Quantile (Quartile) Streuungsmaße Varianz Standardabweichung Kovarianz Korrelation KonzentrationsmaßeGini-Koeffizient

101 Verhältniszahlen Beziehungs- zahlen Gliederungs- zahlen Index- zahlen

102 Warenkorb N Güter (Mengen und Preise) in der Basisperiode 0 Berichtsperiode t

103 Preise in der Basisperiode 0 Preise in der Berichtsperiode t Mengen in der Basisperiode 0 Mengen in der Berichtsperiode t

104 Preisindex nach Laspeyres Preisindex nach Paasche Laspeyres: Bezug auf den alten Warenkorb Paasche: Bezug auf den neuen Warenkorb

105 Formeln für die Preisindizes nach Laspeyres und nach Paasche

106 Aggregatform

107 Wegen der besseren Übersichtlichkeitdefinieren wir uns einen sehr kleinen Warenkorb bestehend aus: In den Jahren 1950 bis 1953 werden für den Jahres- verbrauch pro Einwohner und für die Preise die folgenden Daten zu Grunde gelegt: Zigaretten Bier Kaffee

108 Index 0 Index 1 Index 2 Index 3 1950 1951 1952 1953

109 Aufgabe 11


Herunterladen ppt "Statistische Methoden II SS 2008 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag 10.00 - 12.30 (Pause: 11.30 - 11.45) Ort:Hörsaal Makarenkostraße (Kiste)"

Ähnliche Präsentationen


Google-Anzeigen