Präsentation herunterladen
1
Statistische Methoden I
WS 2001/2002 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial 2.1. Der Häufigkeitsbegriff 2.2. Lage- und Streuungsparameter 2.3. Konzentrationsmaße (Lorenz-Kurve) 3. Mehrdimensionales Datenmaterial 3.1. Korrelations- und Regressionsrechnung 3.2. Indexzahlen 3.3. Saisonbereinigung
2
II. Wahrscheinlichkeitstheorie
1. Laplacesche Wahrscheinlicheitsräume 1.1. Kombinatorische Formeln 1.2. Berechnung von Laplace-Wahrschein- lichkeiten 2. Allgemeine Wahrscheinlichkeitsräume 2.1. Der diskrete Fall 2.2. Der stetige Fall 2.3. Unabhängigkeit und bedingte Wahrscheinlichkeit 3. Zufallsvariablen 3.1. Grundbegriffe 3.2. Erwartungswert und Varianz 3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz
3
III. Induktive Statistik
1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung 2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle 3. Tests 3.1. Grundbergriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse
4
Beschreibende Statistik
(= Deskriptive Statistik) Beschreibung von Datenmaterial 1. Semester Vorstufe zur Schließenden Statistik (= Induktive Statistik) Analyse von Datenmaterial, Hypothesen, Prognosen 2. Semester
10
Häufigkeiten Gegeben ist eine Datenliste (Urliste)
(hier z. B. die Klausur-Noten von 50 Studenten) Hier die geordneten Daten
11
H(1) = 5 H(2) = 6 H(3) = 18 H(4) = 15 H(5) = 6 Absolute Häufigkeiten h(1) = 0.1 h(2) = 0.12 h(3) = 0.36 h(4) = 0.3 h(5) = 0.12 Relative Häufigkeiten F(1) = 0.1 F(2) = 0.22 F(3) = 0.58 F(4) = 0.88 F(5) = 1 Kumulierte relative Häufigkeiten
12
Fakultäten EMAU Berechnung der Winkel für ein Kreisdiagramm T: Theologische RSW: Rechts- und Staatswiss. Med: Medizinische Phil: Philosophische MathNat: Mathematisch-Naturwiss. K: Studienkolleg, ... h(T) = 0.011 h(RSW) = 0.22 h(Med) = 0.164 h(Phil) = 0.309 h(MathNat) = 0.273 h(K) = 0.022 3.96 Grad Grad 59.04 Grad Grad 98.28 Grad 7.92 Grad
13
Kreisdiagramm Fakultäten EMAU
15
Stabdiagramm „Zähne“
16
Histogramm „Zähne“
17
Empirische Verteilungsfunktion
„Zähne“
18
Stem-Leaf-Diagramm Bei diesem Diagramm werden meist nur
die beiden führenden Ziffern berücksich- tigt. Die erste Ziffer wird links von einer senkrecht gezogenen Linie eingetragen. Damit hat man den Stamm. Die zweiten Ziffern - die Blätter - wer- den rechts davon notiert, und zwar zeilen- weise aufsteigend geordnet. Dabei muss jeder Wert des Datensatzes durch eine zweite Ziffer (ggf. Null!) repräsentiert werden. Kaltmieten
20
Charakterisierung von Merkmalen
Unterscheidung zwischen qualitativen quantitativen Merkmalen quantitative: Merkmale unterscheiden sich nach der Größe qualitative: Merkmale unterscheiden sich nach der Art Unterscheidung nach der zugrundeliegenden Werteskala Nominal- Ordinal- metrische Skala
21
Nominal: keine Rangordnung
Ordinal: Rangordnung, aber Zwischenwerte nicht interpretierbar metrisch: Rangordnung (Reihenfolge), Werte zwischen 2 Werten erlauben eine Interpretation Unterscheidung nach diskreten stetigen Merkmalen diskret: Menge der Werte abzählbar (evtl. abzählbar unendlich) stetig: Menge der Werte kontinuierlich, (z.B. reelle Zahlen oder ein Intervall reeller Zahlen)
22
Ordinal, diskret
23
metrisch, stetig
24
metrisch, diskret
25
Ordinal, diskret
26
Arithmetisches Mittel
Merkmal Datensatz
27
Median Merkmal Geordneter Datensatz
n ungerade: Wert, der in der Mitte steht n gerade: arithmetisches Mittel der beiden Werte, die in der Mitte stehen
28
Achtung Aufgabe!
29
Achtung noch eine Aufgabe!
30
Quantile
34
Boxplot Ober-, Untergrenze der „Box“: oberes, unteres Quartil
„dicker Strich“ in der Box: Median Ausreißer nach oben: Werte > oberes Quartil Quartilsabstand Ausreißer nach unten: Werte < unteres Quartil Quartilsabstand Jeder Ausreißer wird mit einem Symbol gesondert eingetragen. Antennen: größter und kleinster Wert in der Datenliste, der kein Ausreißer ist
35
Achtung Aufgabe!
36
Achtung noch eine Aufgabe!
37
Mittelwert oder Median
Grobe Faustregeln Metrische Skalierung Mittelwert Ordinale Skalierung Median Ausreißer wahrscheinlich Median Wenn sich die Werte „irdendwie“ gegeneinander ausgleichen Mittelwert
38
Streuungsparameter Median Mittlere Abweichung vom Median Varianz
Die Ungleichung gilt für jede Konstante c.
39
Streuungsparameter Mittelwert Varianz Die Ungleichung gilt für jede
Konstante c.
40
Rechenregeln für Mittelwert,
Varianz und Streuung
41
Rechenregeln für Mittelwert,
Varianz und Streuung
42
Rechenregeln für Mittelwert,
Varianz und Streuung
43
Berechnung von Streuungsparametern an einem einfachen Beispiel
44
(Gini-Koeffizient, Lorenz-Kurve)
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des Geldvermögens unter den einzelnen Bevölkerungsgruppen Verteilung von Marktanteilen Aufteilung der landwirtschaftlichen Nutzflächen in einer Region
45
Ein Markt wird von 5 Unternehmen
beliefert. Die folgende Tabelle beschreibt die Aufteilung der Marktanteile:
46
Daraus ergeben sich die folgenden Werte
für die Punkte auf der Lorenz-Kurve:
47
Dazu die Lorenz-Kurve:
48
Berechnung des Gini-Koeffizienten
49
Achtung Aufgabe!
50
Achtung noch eine Aufgabe!
51
Landwirtschaftlich genutzte
Fläche einer Region
52
Dazu die Lorenz-Kurve:
53
Datenmatrix
54
Datentabelle für 2 Merkmale
55
der absoluten Häufigkeiten
Kontingenztafel der absoluten Häufigkeiten
56
der relativen Häufigkeiten
Kontingenztafel der relativen Häufigkeiten
57
Betriebe und hinterzogene Steuer
Kontingenztabelle X: Art des Betriebes 1 = Handelsbetriebe 2 = Freie Berufe (Leistungsbetriebe) 3 = Fertigungsbetriebe Y: Art der hinterzogenen Steuer 1 = Lohnsteuer 2 = Einkommenssteuer 3 = Umsatzsteuer 4 = Sonstiges
58
Kovarianz Merkmal Datensatz Merkmal Datensatz
59
Korrelationskoeffizient
nach Bravais-Pearson Eigenschaften X und Y unabhängig
60
X größer Y größer X größer Y kleiner
61
Positiver strikter Zusammenhang
Negativer strikter Zusammenhang
62
Korrelationskoeffizient bei verschiedenen Konstellationen
von Ausprägungen
63
Korrelationskoeffizient: 1.00
64
Korrelationskoeffizient: 0.52
65
Korrelationskoeffizient: 0.00
66
Korrelationskoeffizient: -0.62
67
Achtung Aufgabe!
68
Achtung noch eine Aufgabe!
69
Prinzip der kleinsten Quadrate (Kleinst-Quadrat-Schätzung)
Man sucht in der betrachteten Klasse diejenige Funktion f, so dass die Summe der Abweichungsquadrate minimiert wird: Bestimme f, so dass minimal !!
70
Aufgaben der Regressionsrechnung
1. Extrapolation Stellt man sich für den Moment x als die Zeit vor, so möchte man die beobachteten Werte auf die „Zukunft“ extrapolieren. Man erstellt eine „Prognose“. Dazu bedient man sich der gefundenen Funktion f, um für eine „Zeit“ x der „Zukunft“ den Wert y = f(x) zu schätzen.
71
2. Interpolation Man interessiert sich für den Wert von y = f(x)
für Zwischenwerte von x, d. h. für Werte x, die zwischen 2 beobachteten Werten liegen: Wieder bedient man sich der Funktion f, um eine Interpolation der Werte durchzuführen.
72
Lineare Regression Finde reelle Zahlen a und b,so dass der Wert von
minimal wird! Mit anderen Worten: Finde den „Punkt“ (a ,b), an dem die Funktion ihr Minimum annimmt!
73
Steigung der Regressionsgeraden
Schnitt der Regressionsgeraden mit der y-Achse bei
74
Bestimmtheitsmaß Maß für die Güte der Anpassung der
Daten an die Regressionsfunktion Dabei ist
75
In einem Kaufhauskonzern mit 10 Filialen
soll die Wirkung von Werbeausgaben auf die Umsatzsteigerung untersucht werden. Die Daten sind: X: Werbeausgaben in 1000 Euro Y: Umsatzsteigerung in Euro
76
Demonstrationsbeispiel
Lineare Regression Mittelwerte Varianzen Kovarianz
77
Steigung der Regressionsgeraden
Schnitt der Regressionsgeraden mit der y-Achse bei
78
Achtung Aufgabe!
79
Achtung noch eine Aufgabe!
80
Statistische Maßzahlen
Bisher: Mittelwert Median Quantile (Quartile) Lagemaße Varianz Standardabweichung Kovarianz Korrelation Streuungsmaße Konzentrationsmaße Gini-Koeffizient
81
Verhältniszahlen Index- zahlen Gliederungs- zahlen Beziehungs- zahlen
82
N Güter (Mengen und Preise) in der Basisperiode 0 Berichtsperiode t
Warenkorb N Güter (Mengen und Preise) in der Basisperiode 0 Berichtsperiode t Preise in der Basisperiode 0 Preise in der Berichtsperiode t Mengen in der Basisperiode 0 Mengen in der Berichtsperiode t
83
Preisindex nach Laspeyres
Preisindex nach Paasche Laspeyres: Bezug auf den alten Warenkorb Paasche: Bezug auf den neuen Warenkorb
84
Formeln für die Preisindizes nach Laspeyres und nach Paasche
85
Aggregatform
86
Wegen der besseren Übersichtlichkeit
definieren wir uns einen sehr kleinen Warenkorb bestehend aus: Zigaretten Bier Kaffee In den Jahren 1950 bis 1953 werden für den Jahresverbrauch pro Einwohner und für die Preise folgende Daten zu Grunde gelegt: Index 0 1950 Index 1 1951 Index 2 1952 Index 3 1953
87
Achtung Aufgabe!
Ähnliche Präsentationen
© 2025 SlidePlayer.org Inc.
All rights reserved.