Statistische Methoden I

Slides:

Advertisements

Ähnliche Präsentationen

Statistische Methoden I

Advertisements

Wahrscheinlichkeitstheorie

Statistische Methoden I

Statistische Methoden I

Statistische Methoden I

Statistische Methoden II SS 2008 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Makarenkostraße (Kiste)

Statistische Methoden II SS 2007 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.

Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.

Statistische Methoden I WS 2006/2007 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial.

Statistische Methoden II SS 2008

Achtung Terminänderung !!!

Nachholung der Vorlesung vom Freitag

Konfidenzintervalle Intervallschätzung

Ab nächster Woche wird die Übungsgruppe Gruppe 2: Henrike Berg Di SR 222 wegen Personalmangel eingestellt.

Bitte mein Manuskript (liegt im Bibliotheksgebäude aus) nicht nach Außerhalb tragen. Die Weitergabe an Dritte (d. h. an Personen, die nicht Hörer der Vorlesung.

Die Student- oder t-Verteilung

Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur - statt Vorlesungen -

Statistische Methoden I WS 2006/2007 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.

Erwartungswert und Varianz I Der endliche Fall Erwartungswert Varianz.

Statistische Methoden I

Statistische Methoden I WS 2006/2007 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.

Statistische Methoden I SS 2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.

Mögliche Funktionenklassen

Neu Übungsgruppentausch:

4. Markov-Ketten 4.1. Übergangsmatrizen

Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.

Statistische Methoden I WS 2004/2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.

Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.

Statistische Methoden I WS 2007/2008 Probeklausur Donnerstag, 31. Januar 2008 und Freitag, 1. Februar statt Vorlesungen -

FILTER Input: Empirische Zeitreihe Output: Geglättete Zeitreihe.

Median Merkmal Geordneter Datensatz

Korrelationsrechnung

Statistische Methoden I WS 2009/2010 Vorlesung:Prof. Dr. Michael Schürmann Zeit: Montag 13:15 -15:45 (Pause 14:45) Ort:HS Makarenkostraße (Kiste) Übungen.

Streuungsparameter Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.

Die Vorlesung Mathematik I (Prof. Kugelmann) findet heute um 14:30 Uhr im Hörsaal Loefflerstraße 70 statt.

Rechenregeln für Mittelwert, Varianz und Streuung.

II. Wahrscheinlichkeitstheorie

Statistische Methoden II SS 2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.

Wahrscheinlichkeitstheorie. Statistische Methoden I WS 2009/2010 Einleitung: Wie schätzt man die Zahl der Fische in einem See? Zur Geschichte der Statistik.

III. Induktive Statistik

Statistische Maßzahlen

Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung.

Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)

Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.

Extra-SPSS-Kurse Durchführung: Birte Holtfreter Termine Di Mi Mi Ort PC-Pool Loefflerstarße.

Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.

Datentabelle für 2 Merkmale

Statistische Methoden I WS 2002/2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.

Wahrscheinlichkeitstheorie. Statistische Methoden I WS 2002/2003 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales.

Probeklausur am 21. Januar 2005 statt Vorlesung. Wahrscheinlichkeitstheorie.

Grundbegriffe der (deskriptiven) Statistikder Wahrscheinlichkeitstheorie.

Statistische Methoden I WS 2004/2005 Probeklausur Freitag, 21. Januar statt Vorlesung - In 2 Wochen In 2 Wochen!

Streuungsparameter Median Mittlere Abweichung vom Median

Test auf Normalverteilung

Statistische Methoden I WS 2009/2010 Vorlesung:Prof. Dr. Michael Schürmann Zeit: Montag 13:15 -15:45 (Pause 14:45) Ort:HS Makarenkostraße (Kiste) Übungen.

Klausur am :00 bis 13:00 Hörsaal Loefflerstraße und Hörsaal Makarenkostraße.

Lehrstuhl für Algebra und funktionalanalytische Anwendungen

Statistische Methoden II SS 2010 Vorlesung:Prof. Dr. Michael Schürmann Zeit: Freitag 13:15 -15:45 (Pause 14:45) Ort:HS Makarenkostraße (Kiste) Übungen.

Univariate Statistik M. Kresken.

(Gini-Koeffizient, Lorenz-Kurve)

Vorlesung: Biometrie für Studierende der Veterinärmedizin

Vorlesung: Biometrie für Studierende der Veterinärmedizin

Wiederholung und Beispiele

STATISIK LV Nr.: 0028 SS Mai 2005.

STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.

Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.

Ökonometrie und Statistik Wiederholung

Präsentation transkript:

Statistische Methoden I WS 2001/2002 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial 2.1. Der Häufigkeitsbegriff 2.2. Lage- und Streuungsparameter 2.3. Konzentrationsmaße (Lorenz-Kurve) 3. Mehrdimensionales Datenmaterial 3.1. Korrelations- und Regressionsrechnung 3.2. Indexzahlen 3.3. Saisonbereinigung

II. Wahrscheinlichkeitstheorie 1. Laplacesche Wahrscheinlicheitsräume 1.1. Kombinatorische Formeln 1.2. Berechnung von Laplace-Wahrschein- lichkeiten 2. Allgemeine Wahrscheinlichkeitsräume 2.1. Der diskrete Fall 2.2. Der stetige Fall 2.3. Unabhängigkeit und bedingte Wahrscheinlichkeit 3. Zufallsvariablen 3.1. Grundbegriffe 3.2. Erwartungswert und Varianz 3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz

III. Induktive Statistik 1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung 2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle 3. Tests 3.1. Grundbergriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse

Beschreibende Statistik (= Deskriptive Statistik) Beschreibung von Datenmaterial 1. Semester Vorstufe zur Schließenden Statistik (= Induktive Statistik) Analyse von Datenmaterial, Hypothesen, Prognosen 2. Semester

Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten) 3 3 4 5 2 1 3 3 4 3 2 3 4 4 4 5 2 1 3 3 3 3 4 4 4 5 4 3 4 3 2 3 3 2 4 3 2 1 5 4 4 4 5 4 5 1 1 3 3 3 Hier die geordneten Daten 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5

H(1) = 5 H(2) = 6 H(3) = 18 H(4) = 15 H(5) = 6 Absolute Häufigkeiten h(1) = 0.1 h(2) = 0.12 h(3) = 0.36 h(4) = 0.3 h(5) = 0.12 Relative Häufigkeiten F(1) = 0.1 F(2) = 0.22 F(3) = 0.58 F(4) = 0.88 F(5) = 1 Kumulierte relative Häufigkeiten

Fakultäten EMAU Berechnung der Winkel für ein Kreisdiagramm T: Theologische RSW: Rechts- und Staatswiss. Med: Medizinische Phil: Philosophische MathNat: Mathematisch-Naturwiss. K: Studienkolleg, ... h(T) = 0.011 h(RSW) = 0.22 h(Med) = 0.164 h(Phil) = 0.309 h(MathNat) = 0.273 h(K) = 0.022 3.96 Grad 79.2 Grad 59.04 Grad 111.24 Grad 98.28 Grad 7.92 Grad

Kreisdiagramm Fakultäten EMAU

Stabdiagramm „Zähne“

Histogramm „Zähne“

Empirische Verteilungsfunktion „Zähne“

Stem-Leaf-Diagramm Bei diesem Diagramm werden meist nur die beiden führenden Ziffern berücksich- tigt. Die erste Ziffer wird links von einer senkrecht gezogenen Linie eingetragen. Damit hat man den Stamm. Die zweiten Ziffern - die Blätter - werden rechts davon notiert, und zwar zeilen- weise aufsteigend geordnet. Dabei muss jeder Wert des Datensatzes durch eine zweite Ziffer (ggf. Null!) repräsentiert werden. Kaltmieten

Charakterisierung von Merkmalen Unterscheidung zwischen qualitativen quantitativen Merkmalen quantitative: Merkmale unterscheiden sich nach der Größe qualitative: Merkmale unterscheiden sich nach der Art Unterscheidung nach der zugrundeliegenden Werteskala Nominal- Ordinal- metrische Skala

Nominal: keine Rangordnung Ordinal: Rangordnung, aber Zwischenwerte nicht interpretierbar metrisch: Rangordnung (Reihenfolge), Werte zwischen 2 Werten erlauben eine Interpretation Unterscheidung nach diskreten stetigen Merkmalen diskret: Menge der Werte abzählbar (evtl. abzählbar unendlich) stetig: Menge der Werte kontinuierlich, (z.B. reelle Zahlen oder ein Intervall reeller Zahlen)

Ordinal, diskret

metrisch, stetig

metrisch, diskret

Ordinal, diskret

Arithmetisches Mittel Merkmal Datensatz

Median Merkmal Geordneter Datensatz n ungerade: Wert, der in der Mitte steht n gerade: arithmetisches Mittel der beiden Werte, die in der Mitte stehen

Achtung Aufgabe!

Achtung noch eine Aufgabe!

Quantile

Boxplot Ober-, Untergrenze der „Box“: oberes, unteres Quartil „dicker Strich“ in der Box: Median Ausreißer nach oben: Werte > oberes Quartil + 1.5 Quartilsabstand Ausreißer nach unten: Werte < unteres Quartil - 1.5 Quartilsabstand Jeder Ausreißer wird mit einem Symbol gesondert eingetragen. Antennen: größter und kleinster Wert in der Datenliste, der kein Ausreißer ist

Achtung Aufgabe!

Achtung noch eine Aufgabe!

Mittelwert oder Median Grobe Faustregeln Metrische Skalierung Mittelwert Ordinale Skalierung Median Ausreißer wahrscheinlich Median Wenn sich die Werte „irdendwie“ gegeneinander ausgleichen Mittelwert

Streuungsparameter Median Mittlere Abweichung vom Median Varianz Die Ungleichung gilt für jede Konstante c.

Streuungsparameter Mittelwert Varianz Die Ungleichung gilt für jede Konstante c.

Rechenregeln für Mittelwert, Varianz und Streuung

Rechenregeln für Mittelwert, Varianz und Streuung

Rechenregeln für Mittelwert, Varianz und Streuung

Berechnung von Streuungsparametern an einem einfachen Beispiel

(Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des Geldvermögens unter den einzelnen Bevölkerungsgruppen Verteilung von Marktanteilen Aufteilung der landwirtschaftlichen Nutzflächen in einer Region

Ein Markt wird von 5 Unternehmen beliefert. Die folgende Tabelle beschreibt die Aufteilung der Marktanteile:

Daraus ergeben sich die folgenden Werte für die Punkte auf der Lorenz-Kurve:

Dazu die Lorenz-Kurve:

Berechnung des Gini-Koeffizienten

Achtung Aufgabe!

Achtung noch eine Aufgabe!

Landwirtschaftlich genutzte Fläche einer Region

Dazu die Lorenz-Kurve:

Datenmatrix

Datentabelle für 2 Merkmale

der absoluten Häufigkeiten Kontingenztafel der absoluten Häufigkeiten

der relativen Häufigkeiten Kontingenztafel der relativen Häufigkeiten

Betriebe und hinterzogene Steuer Kontingenztabelle X: Art des Betriebes 1 = Handelsbetriebe 2 = Freie Berufe (Leistungsbetriebe) 3 = Fertigungsbetriebe Y: Art der hinterzogenen Steuer 1 = Lohnsteuer 2 = Einkommenssteuer 3 = Umsatzsteuer 4 = Sonstiges

Kovarianz Merkmal Datensatz Merkmal Datensatz

Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig

X größer Y größer X größer Y kleiner

Positiver strikter Zusammenhang Negativer strikter Zusammenhang

Korrelationskoeffizient bei verschiedenen Konstellationen von Ausprägungen

Korrelationskoeffizient: 1.00

Korrelationskoeffizient: 0.52

Korrelationskoeffizient: 0.00

Korrelationskoeffizient: -0.62

Achtung Aufgabe!

Achtung noch eine Aufgabe!

Prinzip der kleinsten Quadrate (Kleinst-Quadrat-Schätzung) Man sucht in der betrachteten Klasse diejenige Funktion f, so dass die Summe der Abweichungsquadrate minimiert wird: Bestimme f, so dass minimal !!

Aufgaben der Regressionsrechnung 1. Extrapolation Stellt man sich für den Moment x als die Zeit vor, so möchte man die beobachteten Werte auf die „Zukunft“ extrapolieren. Man erstellt eine „Prognose“. Dazu bedient man sich der gefundenen Funktion f, um für eine „Zeit“ x der „Zukunft“ den Wert y = f(x) zu schätzen.

2. Interpolation Man interessiert sich für den Wert von y = f(x) für Zwischenwerte von x, d. h. für Werte x, die zwischen 2 beobachteten Werten liegen: Wieder bedient man sich der Funktion f, um eine Interpolation der Werte durchzuführen.

Lineare Regression Finde reelle Zahlen a und b,so dass der Wert von minimal wird! Mit anderen Worten: Finde den „Punkt“ (a ,b), an dem die Funktion ihr Minimum annimmt!

Steigung der Regressionsgeraden Schnitt der Regressionsgeraden mit der y-Achse bei

Bestimmtheitsmaß Maß für die Güte der Anpassung der Daten an die Regressionsfunktion Dabei ist

In einem Kaufhauskonzern mit 10 Filialen soll die Wirkung von Werbeausgaben auf die Umsatzsteigerung untersucht werden. Die Daten sind: X: Werbeausgaben in 1000 Euro Y: Umsatzsteigerung in 10 000 Euro

Demonstrationsbeispiel Lineare Regression Mittelwerte Varianzen Kovarianz

Steigung der Regressionsgeraden Schnitt der Regressionsgeraden mit der y-Achse bei

Achtung Aufgabe!

Achtung noch eine Aufgabe!

Statistische Maßzahlen Bisher: Mittelwert Median Quantile (Quartile) Lagemaße Varianz Standardabweichung Kovarianz Korrelation Streuungsmaße Konzentrationsmaße Gini-Koeffizient

Verhältniszahlen Index- zahlen Gliederungs- zahlen Beziehungs- zahlen

N Güter (Mengen und Preise) in der Basisperiode 0 Berichtsperiode t Warenkorb N Güter (Mengen und Preise) in der Basisperiode 0 Berichtsperiode t Preise in der Basisperiode 0 Preise in der Berichtsperiode t Mengen in der Basisperiode 0 Mengen in der Berichtsperiode t

Preisindex nach Laspeyres Preisindex nach Paasche Laspeyres: Bezug auf den alten Warenkorb Paasche: Bezug auf den neuen Warenkorb

Formeln für die Preisindizes nach Laspeyres und nach Paasche

Aggregatform

Wegen der besseren Übersichtlichkeit definieren wir uns einen sehr kleinen Warenkorb bestehend aus: Zigaretten Bier Kaffee In den Jahren 1950 bis 1953 werden für den Jahresverbrauch pro Einwohner und für die Preise folgende Daten zu Grunde gelegt: Index 0 1950 Index 1 1951 Index 2 1952 Index 3 1953

Achtung Aufgabe!