Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Statistische Methoden I WS 2001/2002 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial.

Ähnliche Präsentationen


Präsentation zum Thema: "Statistische Methoden I WS 2001/2002 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial."—  Präsentation transkript:

1 Statistische Methoden I WS 2001/2002 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial 2.1. Der Häufigkeitsbegriff 2.2. Lage- und Streuungsparameter 2.3. Konzentrationsmaße (Lorenz-Kurve) 3. Mehrdimensionales Datenmaterial 3.1. Korrelations- und Regressionsrechnung 3.2. Indexzahlen 3.3. Saisonbereinigung

2 II. Wahrscheinlichkeitstheorie 1. Laplacesche Wahrscheinlicheitsräume 1.1. Kombinatorische Formeln 1.2. Berechnung von Laplace-Wahrschein- lichkeiten 2. Allgemeine Wahrscheinlichkeitsräume 2.1. Der diskrete Fall 2.2. Der stetige Fall 2.3. Unabhängigkeit und bedingte Wahrscheinlichkeit 3. Zufallsvariablen 3.1. Grundbegriffe 3.2. Erwartungswert und Varianz 3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz

3 III. Induktive Statistik 1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung 2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle 3. Tests 3.1. Grundbergriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse

4 Beschreibende Statistik (= Deskriptive Statistik) Beschreibung von Datenmaterial Vorstufe zur Schließenden Statistik (= Induktive Statistik) Analyse von Datenmaterial, Hypothesen, Prognosen 1. Semester 2. Semester

5

6

7

8

9

10 Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten) Hier die geordneten Daten

11 Absolute Häufigkeiten H(1) = 5 H(2) = 6 H(3) = 18 H(4) = 15 H(5) = 6 h(1) = 0.1 h(2) = 0.12 h(3) = 0.36 h(4) = 0.3 h(5) = 0.12 Relative Häufigkeiten Kumulierte relative Häufigkeiten F(1) = 0.1 F(2) = 0.22 F(3) = 0.58 F(4) = 0.88 F(5) = 1

12 Fakultäten EMAU Berechnung der Winkel für ein Kreisdiagramm T: Theologische RSW: Rechts- und Staatswiss. Med: Medizinische Phil: Philosophische MathNat: Mathematisch-Naturwiss. K: Studienkolleg,... h(T) = h(RSW) = 0.22 h(Med) = h(Phil) = h(MathNat) = h(K) = Grad 79.2 Grad Grad Grad Grad 7.92 Grad

13 Kreisdiagramm Fakultäten EMAU

14

15 Stabdiagramm Zähne

16 Histogramm Zähne

17 Empirische Verteilungsfunktion Zähne

18 Stem-Leaf-Diagramm Bei diesem Diagramm werden meist nur die beiden führenden Ziffern berücksich- tigt. Die erste Ziffer wird links von einer senkrecht gezogenen Linie eingetragen. Damit hat man den Stamm. Die zweiten Ziffern - die Blätter - wer- den rechts davon notiert, und zwar zeilen- weise aufsteigend geordnet. Dabei muss jeder Wert des Datensatzes durch eine zweite Ziffer (ggf. Null!) repräsentiert werden. Kaltmieten

19

20 Charakterisierung von Merkmalen Merkmalen quantitative: Merkmale unterscheiden sich nach der Größe qualitative: Merkmale unterscheiden sich nach der Art Unterscheidung nach der zugrundeliegenden Werteskala Nominal- Ordinal- metrische Skala Unterscheidung zwischen qualitativen quantitativen

21 Nominal: keine Rangordnung Ordinal: Rangordnung, aber Zwischenwerte nicht interpretierbar metrisch:Rangordnung (Reihenfolge), Werte zwischen 2 Werten erlauben eine Interpretation Unterscheidung nach diskreten stetigen Merkmalen diskret: Menge der Werte abzählbar (evtl. abzählbar unendlich) stetig:Menge der Werte kontinuierlich, (z.B. reelle Zahlen oder ein Intervall reeller Zahlen)

22 Ordinal, diskret

23 metrisch, stetig

24 metrisch, diskret

25 Ordinal, diskret

26 Arithmetisches Mittel Merkmal Datensatz

27 Median Merkmal Geordneter Datensatz n ungerade: Wert, der in der Mitte steht n gerade: arithmetisches Mittel der beiden Werte, die in der Mitte stehen

28 Achtung Aufgabe!

29 Achtung noch eine

30 Quantile

31

32

33

34 Boxplot Ober-, Untergrenze der Box: oberes, unteres Quartil dicker Strich in der Box: Median Ausreißer nach oben: Werte > oberes Quartil Quartilsabstand Ausreißer nach unten: Werte < unteres Quartil Quartilsabstand Jeder Ausreißer wird mit einem Symbol gesondert eingetragen. Antennen: größter und kleinster Wert in der Datenliste, der kein Ausreißer ist

35 Achtung Aufgabe!

36 Achtung noch eine

37 Mittelwert oder Median Grobe Faustregeln Metrische Skalierung Ordinale Skalierung Ausreißer wahrscheinlich Wenn sich die Werte irdendwie gegeneinander ausgleichen Mittelwert Median Mittelwert

38 Streuungsparameter Median Mittlere Abweichung vom Median Varianz Die Ungleichung gilt für jede Konstante c.

39 Streuungsparameter Mittelwert Varianz Die Ungleichung gilt für jede Konstante c.

40 Rechenregeln für Mittelwert, Varianz und Streuung

41 Rechenregeln für Mittelwert, Varianz und Streuung

42 Rechenregeln für Mittelwert, Varianz und Streuung

43 Berechnung von Streuungsparametern an einem einfachen Beispiel

44 Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des Geldvermögens unter den einzelnen Bevölkerungsgruppen Verteilung von Marktanteilen Aufteilung der landwirtschaftlichen Nutzflächen in einer Region

45 Ein Markt wird von 5 Unternehmen beliefert. Die folgende Tabelle beschreibt die Aufteilung der Marktanteile:

46 Daraus ergeben sich die folgenden Werte für die Punkte auf der Lorenz-Kurve:

47 Dazu die Lorenz-Kurve:

48 Berechnung des Gini-Koeffizienten

49 Achtung Aufgabe!

50 Achtung noch eine

51 Landwirtschaftlich genutzte Fläche einer Region

52 Dazu die Lorenz-Kurve:

53 Datenmatrix

54 Datentabelle für 2 Merkmale

55 Kontingenztafel der absoluten Häufigkeiten

56 Kontingenztafel der relativen Häufigkeiten

57 X: Art des Betriebes 1 = Handelsbetriebe 2 = Freie Berufe (Leistungsbetriebe) 3 = Fertigungsbetriebe Y: Art der hinterzogenen Steuer 1 = Lohnsteuer 2 = Einkommenssteuer 3 = Umsatzsteuer 4 = Sonstiges Betriebe und hinterzogene Steuer Kontingenztabelle

58 Kovarianz Merkmal Datensatz Merkmal Datensatz

59 Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig

60 X größerY größer X größerY kleiner

61 Positiver strikter Zusammenhang Negativer strikter Zusammenhang

62 Korrelationskoeffizient bei verschiedenen Konstellationen von Ausprägungen

63 Korrelationskoeffizient: Korrelationskoeffizient: 1.00

64 Korrelationskoeffizient: Korrelationskoeffizient: 0.52

65 Korrelationskoeffizient: Korrelationskoeffizient: 0.00

66 Korrelationskoeffizient: Korrelationskoeffizient: -0.62

67 Achtung Aufgabe!

68 Achtung noch eine

69 Prinzip der kleinsten Quadrate (Kleinst-Quadrat-Schätzung) Man sucht in der betrachteten Klasse diejenige Funktion f, so dass die Summe der Abweichungsquadrate minimiert wird: Bestimme f, so dass minimal !!

70 Aufgaben der Regressionsrechnung Stellt man sich für den Moment x als die Zeit vor, so möchte man die beobachteten Werte auf die Zukunft extrapolieren. Man erstellt eine Prognose. Dazu bedient man sich der gefundenen Funktion f, um für eine Zeit x der Zukunft den Wert y = f(x) zu schätzen. 1. Extrapolation

71 2. Interpolation Man interessiert sich für den Wert von y = f(x) für Zwischenwerte von x, d. h. für Werte x, die zwischen 2 beobachteten Werten liegen: Wieder bedient man sich der Funktion f, um eine Interpolation der Werte durchzuführen.

72 Lineare Regression Finde reelle Zahlen a und b,so dass der Wert von minimal wird! Mit anderen Worten: Finde den Punkt (a,b), an dem die Funktion ihr Minimum annimmt!

73 Steigung der Regressionsgeraden Schnitt der Regressionsgeraden mit der y-Achse bei

74 Bestimmtheitsmaß Maß für die Güte der Anpassung der Daten an die Regressionsfunktion Dabei ist

75 In einem Kaufhauskonzern mit 10 Filialen soll die Wirkung von Werbeausgaben auf die Umsatzsteigerung untersucht werden. Die Daten sind: X: Werbeausgaben in 1000 Euro Y: Umsatzsteigerung in Euro

76 Demonstrationsbeispiel Lineare Regression Mittelwerte Varianzen Kovarianz

77 Steigung der Regressionsgeraden Schnitt der Regressionsgeraden mit der y-Achse bei

78 Achtung Aufgabe!

79 Achtung noch eine

80 Statistische Maßzahlen Bisher : Lagemaße Mittelwert Median Quantile (Quartile) Streuungsmaße Varianz Standardabweichung Kovarianz Korrelation KonzentrationsmaßeGini-Koeffizient

81 Verhältniszahlen Beziehungs- zahlen Gliederungs- zahlen Index- zahlen

82 Warenkorb N Güter (Mengen und Preise) in der Basisperiode 0 Berichtsperiode t Preise in der Basisperiode 0 Preise in der Berichtsperiode t Mengen in der Basisperiode 0 Mengen in der Berichtsperiode t

83 Preisindex nach Laspeyres Preisindex nach Paasche Laspeyres: Bezug auf den alten Warenkorb Paasche: Bezug auf den neuen Warenkorb

84 Formeln für die Preisindizes nach Laspeyres und nach Paasche

85 Aggregatform

86 Wegen der besseren Übersichtlichkeit definieren wir uns einen sehr kleinen Warenkorb bestehend aus: In den Jahren 1950 bis 1953 werden für den Jahresverbrauch pro Einwohner und für die Preise folgende Daten zu Grunde gelegt: Index 0 Index 1 Index 2 Index Zigaretten Bier Kaffee

87 Achtung Aufgabe!


Herunterladen ppt "Statistische Methoden I WS 2001/2002 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial."

Ähnliche Präsentationen


Google-Anzeigen