Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Chlotichilda Schmal Geändert vor über 11 Jahren
1
Statistische Methoden I WS 2006/2007 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial 2.1. Der Häufigkeitsbegriff 2.2. Lage- und Streuungsparameter 2.3. Konzentrationsmaße (Lorenz-Kurve) 3. Mehrdimensionales Datenmaterial 3.1. Korrelations- und Regressionsrechnung 3.2. Indexzahlen 3.3. Saisonbereinigung
2
II. Wahrscheinlichkeitstheorie 1. Laplacesche Wahrscheinlicheitsräume 1.1. Kombinatorische Formeln 1.2. Berechnung von Laplace-Wahrschein- lichkeiten 2. Allgemeine Wahrscheinlichkeitsräume 2.1. Der diskrete Fall 2.2. Der stetige Fall 2.3. Unabhängigkeit und bedingte Wahrscheinlichkeit 3. Zufallsvariablen 3.1. Grundbegriffe 3.2. Erwartungswert und Varianz 3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz
3
4. Markov-Ketten 4.1. Übergangsmatrizen 4.2. Grenzverhalten irreduzibler Markov-Ketten 4.3. Gewinnwahrscheinlichkeiten 4.4. Beispiel Ruin der Spieler 4.5. Anwendungen
4
III. Induktive Statistik 1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung 2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle
5
3. Tests 3.1. Grundbegriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse
7
Die wichtigsten Tabellen
8
Übersicht I Konfidenzintervalle für den Erwartungswert
9
Übersicht II Konfidenzintervalle für die Varianz
10
Test für den Erwartungswert Varianz bekannt Fall Normalverteilung
11
Test für den Erwartungswert Varianz unbekannt Fall Normalverteilung
12
Chi-Quadrat-Tests Übersicht
13
Faustregeln Chi-Quadrat-Tests Test auf Anpassung Test auf Unabhängigkeit Test auf Homogenität
14
Weitere nützliche Übersichten in den Powerpoint-Präsentationen der Vorlesung! http://www.math-inf.uni-greifswald.de/algebra/
15
Beschreibende Statistik
16
(= Deskriptive Statistik) Beschreibung von Datenmaterial Schließenden Statistik (= Induktive Statistik) Analyse von Datenmaterial, Hypothesen, Prognosen 1. Semester 2.Semester Wahrscheinlich- keitstheorie 1. Semester
23
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten) 3 3 4 5 2 1 3 3 4 3 2 3 4 4 4 5 2 1 3 3 3 3 4 4 4 5 4 3 4 3 2 3 3 2 4 3 2 1 5 4 4 4 5 4 5 1 1 3 3 3 Hier die geordneten Daten 1 1 1 1 1 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5
24
Absolute Häufigkeiten H(1) = 5 H(2) = 6 H(3) = 18 H(4) = 15 H(5) = 6 h(1) = 0.1 h(2) = 0.12 h(3) = 0.36 h(4) = 0.3 h(5) = 0.12 Relative Häufigkeiten Kumulierte relative Häufigkeiten F(1) = 0.1 F(2) = 0.22 F(3) = 0.58 F(4) = 0.88 F(5) = 1
25
Fakultäten EMAU Berechnung der Winkel für ein Kreisdiagramm T: Theologische RSW: Rechts- und Staatswiss. Med: Medizinische Phil: Philosophische MathNat: Mathematisch-Naturwiss. K: Studienkolleg,... h(T) = 0.011 h(RSW) = 0.22 h(Med) = 0.164 h(Phil) = 0.309 h(MathNat) = 0.273 h(K) = 0.022 3.96 Grad 79.2 Grad 59.04 Grad 111.24 Grad 98.28 Grad 7.92 Grad
26
Kreisdiagramm Fakultäten EMAU
28
Stabdiagramm Zähne
29
Histogram Zähne
30
Empirische Verteilungsfunktion Zähne
31
Stem-Leaf-Diagramm Bei diesem Diagramm werden meist nur die beiden führen- den Ziffern berücksichtigt. Die erste Ziffer wird links von einer senkrecht gezogenen Linie eingetragen. Damit hat man den Stamm. Die zweiten Ziffern - die Blätter - werden rechts davon notiert, und zwar zeilenweise aufsteigend geordnet. Dabei muss jeder Wert des Datensatzes durch eine zweite Ziffer (ggf. Null!) repräsentiert werden. Kaltmieten
33
Charakterisierung von Merkmalen Merkmalen quantitative: Merkmale unterscheiden sich nach der Größe qualitative: Merkmale unterscheiden sich nach der Art Unterscheidung nach der zugrundeliegenden Werteskala Nominal- Ordinal- metrische Skala Unterscheidung zwischen qualitativen quantitativen
34
Nominal: keine Rangordnung Ordinal: Rangordnung, aber Zwischenwerte nicht interpretierbar metrisch:Rangordnung (Reihenfolge), Werte zwischen 2 Werten erlauben eine Interpretation Unterscheidung nach diskreten stetigen Merkmalen diskret: Menge der Werte abzählbar (evtl. abzählbar unendlich) stetig:Menge der Werte kontinuierlich, (z.B. reelle Zahlen oder ein Intervall reeller Zahlen)
35
Ordinal, diskret
36
metrisch, diskret
37
metrisch, stetig
38
Ordinal, diskret
39
Arithmetisches Mittel Merkmal Datensatz
40
Median Merkmal Geordneter Datensatz n ungerade: Wert, der in der Mitte steht n gerade: arithmetisches Mittel der beiden Werte, die in der Mitte stehen
41
Achtung Aufgabe!
42
Achtung noch eine
43
Quantile
47
Boxplot Ober-, Untergrenze der Box: oberes, unteres Quartil dicker Strich in der Box: Median Ausreißer nach oben: Werte > oberes Quartil + 1.5 Quartilsabstand Ausreißer nach unten: Werte < unteres Quartil - 1.5 Quartilsabstand Jeder Ausreißer wird mit einem Symbol gesondert einge- tragen. Antennen: größter und kleinster Wert in der Datenliste, der kein Ausreißer ist
48
Achtung Aufgabe!
49
Achtung noch eine
50
Mittelwert oder Median Grobe Faustregeln Metrische Skalierung Ordinale Skalierung Ausreißer wahrscheinlich Wenn sich die Werte irdendwie gegeneinander ausgleichen Mittelwert Median Mittelwert
51
Streuungsparameter Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
52
Streuungsparameter Mittelwert Varianz Die Ungleichung gilt für jede Konstante c.
53
Rechenregeln für Mittelwert, Varianz und Streuung
56
Berechnung von Streuungsparametern an einem einfachen Beispiel
57
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des Geldvermögens unter den einzelnen Bevölkerungsgruppen Verteilung von Marktanteilen Aufteilung der landwirtschaftlichen Nutzflächen in einer Region
58
Ein Markt wird von 5 Unternehmen beliefert. Die folgende Tabelle beschreibt die Aufteilung der Marktanteile:
59
Daraus ergeben sich die folgenden Werte für die Punkte auf der Lorenz-Kurve:
60
Dazu die Lorenz-Kurve:
61
Berechnung des Gini-Koeffizienten
62
Achtung Aufgabe!
63
Achtung noch eine
64
Landwirtschaftlich genutzte Fläche einer Region
65
Dazu die Lorenz-Kurve:
66
Datenmatrix
67
Datentabelle für 2 Merkmale
68
Kontingenztafel der absoluten Häufigkeiten
69
Kontingenztafel der relativen Häufigkeiten
70
X: Art des Betriebes 1 = Handelsbetriebe 2 = Freie Berufe (Leistungsbetriebe) 3 = Fertigungsbetriebe Y: Art der hinterzogenen Steuer 1 = Lohnsteuer 2 = Einkommenssteuer 3 = Umsatzsteuer 4 = Sonstiges Betriebe und hinterzogene Steuer Kontingenztabelle
71
Kovarianz Merkmal Datensatz Merkmal Datensatz
72
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig
73
X größerY größer X größerY kleiner
74
Positiver strikter Zusammenhang Negativer strikter Zusammenhang
75
Korrelationskoeffizient bei verschiedenen Konstellationen von Ausprägungen
76
Korrelationskoeffizient: 0.905 Korrelationskoeffizient: 1.00
77
Korrelationskoeffizient: 0.19 Korrelationskoeffizient: 0.52
78
Korrelationskoeffizient: -0.14 Korrelationskoeffizient: 0.00
79
Korrelationskoeffizient: -1.00 Korrelationskoeffizient: -0.62
80
Achtung Aufgabe!
81
Achtung noch eine
82
Mögliche Funktionenklassen für die Regressionsrechnung
83
Lineare Funktionen Polynome Exponentialfunktionen ( Exponentielles Wachstum; x ist die Zeit ) Gompertz-Kurven Logistische Funktionen
84
Prinzip der kleinsten Quadrate (Kleinst-Quadrat-Schätzung) Man sucht in der betrachteten Klasse diejenige Funktion f, so dass die Summe der Abweichungsquadrate minimiert wird: Bestimme f, so dass minimal !!
85
Aufgaben der Regressionsrechnung Stellt man sich für den Moment x als die Zeit vor, so möchte man die beobachteten Werte auf die Zukunft extrapolieren. Man erstellt eine Prognose. Dazu bedient man sich der gefundenen Funktion f, um für eine Zeit x der Zukunft den Wert y = f(x) zu schätzen. 1. Extrapolation
86
2. Interpolation Man interessiert sich für den Wert von y = f(x) Für Zwischenwerte von x, d. h. für Werte x, die zwischen 2 beobachteten Werten liegen: Wieder bedient man sich der Funktion f, um eine Interpolation der Werte durchzuführen.
87
Lineare Regression Finde reelle Zahlen a und b, so dass der Wert von minimal wird! Mit anderen Worten: Finde den Punkt (a,b), an dem die Funktion ihr Minimum annimmt!
88
Steigung der Regressionsgeraden Schnitt der Regressionsgeraden mit der y-Achse bei
89
Bestimmtheitsmaß Maß für die Güte der Anpassung der Daten an die Regressionsfunktion Dabei ist
90
In einem Kaufhauskonzern mit 10 Filialen soll die Wirkung von Werbeausgaben auf die Umsatzsteigerung untersucht werden. Die Daten sind: X: Werbeausgaben in 1000 Euro Y: Umsatzsteigerung in 10 000 Euro
91
Demonstrationsbeispiel Lineare Regression Mittelwerte Varianzen Kovarianz
92
Steigung der Regressionsgeraden Schnitt der Regressionsgeraden mit der y-Achse bei
93
Achtung Aufgabe!
94
Achtung noch eine
95
Statistische Maßzahlen Bisher : Lagemaße Mittelwert Median Quantile (Quartile) Streuungsmaße Varianz Standardabweichung Kovarianz Korrelation KonzentrationsmaßeGini-Koeffizient
96
Verhältniszahlen Beziehungs- zahlen Gliederungs- zahlen Index- zahlen
97
Warenkorb N Güter (Mengen und Preise) in der Basisperiode 0 Berichtsperiode t
98
Preise in der Basisperiode 0 Preise in der Berichtsperiode t Mengen in der Basisperiode 0 Mengen in der Berichtsperiode t
99
Preisindex nach Laspeyres Preisindex nach Paasche Laspeyres: Bezug auf den alten Warenkorb Paasche: Bezug auf den neuen Warenkorb
100
Formeln für die Preisindizes nach Laspeyres und nach Paasche
101
Aggregatform
102
Wegen der besseren Übersichtlichkeitdefinieren wir uns einen sehr kleinen Warenkorb bestehend aus: In den Jahren 1950 bis 1953 werden für den Jahres- verbrauch pro Einwohner und für die Preise die folgenden Daten zu Grunde gelegt: Zigaretten Bier Kaffee
103
Index 0 Index 1 Index 2 Index 3 1950 1951 1952 1953
104
Achtung Aufgabe!
Ähnliche Präsentationen
© 2025 SlidePlayer.org Inc.
All rights reserved.