Rechenregeln für Mittelwert, Varianz und Streuung.

Slides:



Advertisements
Ähnliche Präsentationen
statistische Maßzahlen
Advertisements

Univariate Statistik M. Kresken.
Berechnung des Korrelationskoeffizienten Vorbemerkung. Der Korrelationskoeffizient ist im Grunde ein Bruch aus 3 unvollständig berechneten statistischen.
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Mehrfachregressionen
2. Univariate Regressionsanalyse 2.1 Das statische Regressionsmodell
Statistische Methoden I
Statistische Methoden I
Statistische Methoden I
Statistische Methoden II SS 2008 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Makarenkostraße (Kiste)
Statistische Methoden I
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Statistische Methoden I WS 2006/2007 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales Datenmaterial.
Statistische Methoden II SS 2008
Achtung Terminänderung !!!
Mögliche Funktionenklassen
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Median Merkmal Geordneter Datensatz
Korrelationsrechnung
Streuungsparameter Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Die Vorlesung Mathematik I (Prof. Kugelmann) findet heute um 14:30 Uhr im Hörsaal Loefflerstraße 70 statt.
Statistische Maßzahlen
Datenmatrix.
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung.
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Datentabelle für 2 Merkmale
Wahrscheinlichkeitstheorie. Statistische Methoden I WS 2002/2003 Zur Geschichte der Statistik I. Beschreibende Statistik 1. Grundlegende Begriffe 2. Eindimensionales.
Probeklausur am 21. Januar 2005 statt Vorlesung. Wahrscheinlichkeitstheorie.
Streuungsparameter Median Mittlere Abweichung vom Median
Quantile.
Lehrstuhl für Algebra und funktionalanalytische Anwendungen
Univariate Statistik M. Kresken.
Tutorium
Das wars!.
(Gini-Koeffizient, Lorenz-Kurve)
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Wiederholung und Beispiele
Daten auswerten Boxplots
Aufgabenzettel V Statistik I
STATISIK LV Nr.: 1375 SS März 2005.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Seminar: Datenerhebung
STATISIK LV Nr.: 0028 SS Mai 2005.
Statistik: Mehr zur Regression.
Kapitel 13 Zeitreihen und Zeitreihen-Modelle
STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Referat über das Thema STOCHASTIK.
1 Stichprobenverfahren zur Qualitätssicherung Hilfestellung der Statistik in der Wirtschaftsprüfung.
Bivariate Statistik M. Kresken.
STATISIK LV Nr.: 1852 WS 2005/06 6. Dezember 2005.
Deskriptive Statistik
Regression Maria Morozova Lisa Ochsenhofer. Einführung Francis Galton 1886 Größe von Vater und Sohn Regression zum Mittelwert.
Forschungsmethodik II, SS 2010 Vesna Pavlovski & Julia Pichlhöfer
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Statistik – Regression - Korrelation
Veranstaltung 4.
Erheben, berechnen und darstellen von Daten
Die einfache/multiple lineare Regression
setzt Linearität des Zusammenhangs voraus
STATISIK LV Nr.: 1375 SS März 2005.
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Ökonometrie und Statistik Wiederholung
 Präsentation transkript:

Rechenregeln für Mittelwert, Varianz und Streuung

Berechnung von Streuungsparametern an einem einfachen Beispiel

Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des Geldvermögens unter den einzelnen Bevölkerungsgruppen Verteilung von Marktanteilen Aufteilung der landwirtschaftlichen Nutzflächen in einer Region

Ein Markt wird von 5 Unternehmen beliefert. Die folgende Tabelle beschreibt die Aufteilung der Marktanteile:

Daraus ergeben sich die folgenden Werte für die Punkte auf der Lorenz-Kurve:

Dazu die Lorenz-Kurve:

Berechnung des Gini-Koeffizienten

Aufgabe 5

Die Punkte auf der Lorenz-Kurve sind (0,2;0,04), (0,4;0,10), (0,6;0,20),(0,8;0,40) (0,2;0,05), (0,4;0,10), (0,6;0,20),(0,8;0,40) (0,2;0,04), (0,4;0,10), (0,6;0,20),(0,8;0,45) (0,2;0,04), (0,4;0,15), (0,6;0,20),(0,8;0,40)

Der Gini-Koeffizient in (a) beträgt G = 0,496 G = 0,604 G = 0,304 G = 0,504

Aufgabe 6

Die Punkte auf der Lorenz-Kurve (gerundet) sind (0,1667;0,3278), (0,3333;0,0741), (0,5;0,1667); (0,6667;0,3982), (0,9333;0,6297) (0,1667;0,0278), (0,3333;0,0741), (0,5;0,2667); (0,6667;0,4982), (0,8533;0,6297) (0,1667;0,0278), (0,3333;0,0741), (0,5;0,1667); (0,6667;0,3982), (0,8333;0,6297) (0,1667;0,0278), (0,5333;0,0741), (0,5;0,3667); (0,6667;0,3982), (0,8333;0,7297)

Der Gini-Koeffizient beträgt rund G = 0,600 G = 0,841 G = 0,401 G = 0,499

Landwirtschaftlich genutzte Fläche einer Region

Dazu die Lorenz-Kurve:

Datenmatrix

Datentabelle für 2 Merkmale

Kontingenztafel der absoluten Häufigkeiten

Kontingenztafel der relativen Häufigkeiten

X: Art des Betriebes 1 = Handelsbetriebe 2 = Freie Berufe (Leistungsbetriebe) 3 = Fertigungsbetriebe Y: Art der hinterzogenen Steuer 1 = Lohnsteuer 2 = Einkommenssteuer 3 = Umsatzsteuer 4 = Sonstiges Betriebe und hinterzogene Steuer Kontingenztabelle

Kovarianz Merkmal Datensatz Merkmal Datensatz

Korrelationskoeffizient nach Bravais-Pearson Kovarianz (X,Y) (Streuung X) (Streuung Y)

Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig

X größerY größer X größerY kleiner

Positiver strikter Zusammenhang Negativer strikter Zusammenhang

Korrelationskoeffizient bei verschiedenen Konstellationen von Ausprägungen

Korrelationskoeffizient: Korrelationskoeffizient: 1.00

Korrelationskoeffizient: 0.19 Korrelationskoeffizient: 0.52

Korrelationskoeffizient: Korrelationskoeffizient: 0.00

Korrelationskoeffizient: Korrelationskoeffizient: -0.62

Aufgabe 7

Es ergibt sich ein Korrelationskoeffizient von rund r = 0,978 r = 0,987 r = 0,879 r = 0,798

Aufgabe 8

Es ergibt sich ein Korrelationskoeffizient von ? ? ? ?

Mögliche Funktionenklassen für die Regressionsrechnung

Lineare Funktionen Polynome Exponentialfunktionen ( Exponentielles Wachstum; x ist die Zeit ) Gompertz-Kurven Logistische Funktionen

Prinzip der kleinsten Quadrate (Kleinst-Quadrat-Schätzung) Man sucht in der betrachteten Klasse diejenige Funktion f, so dass die Summe der Abweichungsquadrate minimiert wird: Bestimme f, so dass minimal !!

Aufgaben der Regressionsrechnung Stellt man sich für den Moment x als die Zeit vor, so möchte man die beobachteten Werte auf die Zukunft extrapolieren. Man erstellt eine Prognose. Dazu bedient man sich der gefundenen Funktion f, um für eine Zeit x der Zukunft den Wert y = f(x) zu schätzen. 1. Extrapolation

2. Interpolation Man interessiert sich für den Wert von y = f(x) Für Zwischenwerte von x, d. h. für Werte x, die zwischen 2 beobachteten Werten liegen: Wieder bedient man sich der Funktion f, um eine Interpolation der Werte durchzuführen.

Lineare Regression Finde reelle Zahlen a und b, so dass der Wert von minimal wird! Mit anderen Worten: Finde den Punkt (a,b), an dem die Funktion ihr Minimum annimmt!

Steigung der Regressionsgeraden Schnitt der Regressionsgeraden mit der y-Achse bei

Bestimmtheitsmaß Maß für die Güte der Anpassung der Daten an die Regressionsfunktion Dabei ist

Im Falle linearer Regression ist das Bestimmtheitsmaß gleich dem Quadrat des Korrelationskoeffizienten nach Bravais-Pearson!

In einem Kaufhauskonzern mit 10 Filialen soll die Wirkung von Werbeausgaben auf die Umsatzsteigerung untersucht werden. Die Daten sind: X: Werbeausgaben in 1000 Euro Y: Umsatzsteigerung in Euro

Demonstrationsbeispiel Lineare Regression Mittelwerte Varianzen Kovarianz

Steigung der Regressionsgeraden Schnitt der Regressionsgeraden mit der y-Achse bei

Aufgabe 9

Die Regressinsgerade wird durch die folgende Geradengleichung wiedergegeben y = 3,45 x + 4,7 y = 2,3 x + 2,6 y = 0,651 x + 62,66 y = 2,422 x + 7,67

Das Bestimmtheitsmaß der linearen Regression ergibt sich zu ca. 0,48 1,67 0,89 0,21

Aufgabe 10

Die Regressinsgerade wird durch die folgende Geradengleichung wiedergegeben ? ? ? ?

Das Bestimmtheitsmaß der linearen Regression ergibt sich zu ? ? ? ?

Statistische Maßzahlen Bisher : Lagemaße Mittelwert Median Quantile (Quartile) Streuungsmaße Varianz Standardabweichung Kovarianz Korrelation KonzentrationsmaßeGini-Koeffizient

Verhältniszahlen Beziehungs- zahlen Gliederungs- zahlen Index- zahlen

Warenkorb N Güter (Mengen und Preise) in der Basisperiode 0 Berichtsperiode t

Preise in der Basisperiode 0 Preise in der Berichtsperiode t Mengen in der Basisperiode 0 Mengen in der Berichtsperiode t

Preisindex nach Laspeyres Preisindex nach Paasche Laspeyres: Bezug auf den alten Warenkorb Paasche: Bezug auf den neuen Warenkorb

Formeln für die Preisindizes nach Laspeyres und nach Paasche

Aggregatform

Wegen der besseren Übersichtlichkeitdefinieren wir uns einen sehr kleinen Warenkorb bestehend aus: In den Jahren 1950 bis 1953 werden für den Jahres- verbrauch pro Einwohner und für die Preise die folgenden Daten zu Grunde gelegt: Zigaretten Bier Kaffee

Index 0 Index 1 Index 2 Index

Aufgabe 11

Die Preisindizes nach Laspeyres und Paasche ergeben sich zu ca. 1,16 und 1,20 0,98 und 1,20 1,37 und 1,20 1,22 und 1,20