Sitzung 1 ZEW - Expertenseminar: Einführung in die Ökonometrie WS 2007/2008 Alexander Spermann Universität Freiburg.

Slides:



Advertisements
Ähnliche Präsentationen
Definition [1]: Sei S eine endliche Menge und sei p eine Abbildung von S in die positiven reellen Zahlen Für einen Teilmenge ES von S sei p definiert.
Advertisements

Stochastik und Markovketten
Die Laufzeit von randomisierten (zufallsgesteuerten) Algorithmen hängt von gewissen zufälligen Ereignissen ab (Beispiel Quicksort). Um die Laufzeiten dieser.
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Grundlagen der Wahrscheinlichkeitsrechnung - Verteilungen -
Berechnung des Korrelationskoeffizienten Vorbemerkung. Der Korrelationskoeffizient ist im Grunde ein Bruch aus 3 unvollständig berechneten statistischen.
Gliederung Definition des Wahrscheinlichkeitsbegriffes
Wahrscheinlichkeit und die Normalverteilung
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-23.
Der Binomialtest Man habe einen wahren Anteil P.
Algorithmentheorie 04 –Hashing
Statistische Methoden I
Konfidenzintervalle Intervallschätzung
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Die Student- oder t-Verteilung
Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur - statt Vorlesungen -
Erwartungswert und Varianz I Der endliche Fall Erwartungswert Varianz.
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird auf Montag, den 17. Mai verlegt! Zeit: 16 Uhr Ort: Kiste Nächste Woche!!!!
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Extra-SPSS-Kurse Durchführung: Birte Holtfreter Termine Di Mi Mi Ort PC-Pool Loefflerstarße.
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Grundbegriffe der (deskriptiven) Statistikder Wahrscheinlichkeitstheorie.
Univariate Statistik M. Kresken.
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Das wars!.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung Biometrie für Studierende der Veterinärmedizin
Wiederholung und Beispiele
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Vorlesung: ANOVA I
Eigenschaften der OLS-Schätzer
Einfache Regressionsgleichung
Multikollinearität Wann spricht man von Multikollinearität?
Wiederholung: Einfache Regressionsgleichung
Histogramm/empirische Verteilung Verteilungen
Ausgleichungsrechnung I
Die t-Verteilung und die Prüfstatistik
Wahrscheinlichkeitsverteilung
STATISIK LV Nr.: 1375 SS März 2005.
Definitionen für Wahrscheinlichkeiten
Die Poisson-Verteilung: Mittelwert und Standardabweichung
Wahrscheinlichkeit Zufallsexperiment:
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
Statistik: Mehr zur Regression.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
STATISIK LV Nr.: 0021 WS 2005/ Oktober 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
STATISIK LV Nr.: 1375 SS März 2005.
Wahrscheinlichkeitsrechnung
Wahrscheinlichkeitsrechnung
Referat über das Thema STOCHASTIK.
Grundbegriffe der Stochastik
Stetige Verteilungen Das Uhrenbeispiel Dichtefunktion
1 (C) 2002, Hermann Knoll, HTW Chur, Fachhochschule Ostschweiz Wahrscheinlichkeitsverteilung Lernziele: Wahrscheinlichkeitsverteilung und der Wahrscheinlichkeitsdichte.
Der Zentralwert.
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Begriff der Zufallsgröße
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
Statistik – Regression - Korrelation
Stochastik Grundlagen
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
Mathematik für BiologInnen WS 05
K. Desch - Statistik und Datenanalyse SS05
Die Binomialverteilung
Geoinformationssysteme
 Präsentation transkript:

Sitzung 1 ZEW - Expertenseminar: Einführung in die Ökonometrie WS 2007/2008 Alexander Spermann Universität Freiburg

Sitzung 1 1 Alexander Spermann WS 2007/2008 Agenda Grundlagen: Varianz, Kovarianz; Erwartungswert, Korrelationskoeffizient Einfache Regressionsanalyse: Methode der Kleinsten Quadrate Gauss-Markov-Bedingungen: unverzerrter, konsistenter und effizienter Schätzer Hypothesentests: Signifikanzniveau, Konfidenzintervall, t-Test, F- Test, Bestimmtheitsmaß, Standardfehler, Fehler vom Typ 1 und 2, einseitiger und zweiseitiger Test Multiple Regressionsanalyse Dummy-Variablen Problem fehlender Variablen Multikollinearität

Sitzung 1 2 Alexander Spermann WS 2007/2008 Fragestellung: Wie hoch ist das durchschnittliche Nettoeinkommen eines Haushaltes einer Stadt? Möglichkeit:Nettoeinkommen aller Haushalte dieser Stadt (Grundgesamtheit) wird in die Berechnung miteinbezogen. Durchschnitt wird ausgerechnet. PROBLEM: eine Erhebung ist zu teuer. 2. Möglichkeit: Stichprobe wird gezogen. Grundgesamtheit und Stichprobe 1

Sitzung 1 3 Alexander Spermann WS 2007/2008 Grundgesamtheit: Gesamte Menge numerischer Informationen einer (population) bestimmten Größe, die der Wissenschaftler beobachtet. Beispiel: Nettoeinkommen aller Haushalte. Stichprobe: Beobachtete Teilmenge der Werte einer (sample) Grundgesamtheit. Beispiel: Nettoeinkommen von z.B. 1% aller Haushalte wird beobachtet. Diese Haushalte werden zufällig gezogen. Grundgesamtheit und Stichprobe 2

Sitzung 1 4 Alexander Spermann WS 2007/2008 Mittelwert Summe der numerischen Werte der (= Durchschnittswert) : Beobachtungen geteilt durch die Anzahl der (mean) Beobachtungen. Mittelwert (1)

Sitzung 1 5 Alexander Spermann WS 2007/2008 Notation:N = Anzahl der Beobachtungen x 1, x 2, x 3,…,x n – Beobachtungen der Grundgesamtheit Beispiel: Gegeben sind 7 Monatsgehälter von Geschäftsführern in Euro: Mittelwert (2)

Sitzung 1 6 Alexander Spermann WS 2007/2008 Durchschnittswert der Grundgesamtheit ist: Im Beispiel: Mittelwert (3)

Sitzung 1 7 Alexander Spermann WS 2007/2008 Notation: n – Anzahl der Beobachtungen x 1, x 2, …, x n – Beobachtungen der Stichprobe Durchschnittswert der Stichprobe ist: Beispiel:Prozentuale Gewinne einer Stichprobe von 8 Unternehmen gegenüber dem Vorjahr sahen wie folgt aus : 13,6% 25,5% 43,6% -19,8% -13,8% 12,0% 36,3% 14,3% Mittelwert (4)

Sitzung 1 8 Alexander Spermann WS 2007/2008 Median (median): mittlerer Wert einer geordneten Datenreihe Beispiel:Gehälter der 7 Geschäftsführer sind nach der Größe wie folgt geordnet:: Median = Wert in der Mitte rechts und links davon sind jeweils 3 Werte Median:N ungerade: der mittlere Wert bei einer Reihe nach der Größe geordneten Beobachtungen N gerade: Durchschnitt der 2 mittleren Werte bei einer Reihe der Größe nach geordneten Beobachtungen Median 1

Sitzung 1 9 Alexander Spermann WS 2007/2008 Berechnung des Median: Fall 1:N ungerade: Im Beispiel: Fall 2:N gerade: Im Beispiel: Durchschnittswert der Grundgesamtheit, 3350 = µ Vierter beobachteter Wert Median Median 2

Sitzung 1 10 Alexander Spermann WS 2007/2008 Wann Median und wann Mittelwert? Sollen die Ausreißer einer Stichprobe automatisch aus der Mittelwertberechnung eliminiert werden, ist die Anwendung des Median eine gute Alternative. Beispiel: Ermittlung der durchschnittlichen Einkommens- bzw. Vermögenssituation in einer Stadt. Einbeziehung der extrem Vermögenden würde das tatsächliche Einkommensbild verzerren! Median 3

Sitzung 1 11 Alexander Spermann WS 2007/2008 Neues Beispiel:7 Geschäftsführer eines zweiten Unternehmens haben folgende Monatsgehälter: Mittelwert und Median des 1. Unternehmens = Mittelwert und Median des 2. Unternehmens Die Streuung ist jedoch unterschiedlich: Unt. 1 Unt. 2 Streuungsmaße

Sitzung 1 12 Alexander Spermann WS 2007/2008 Streuung:Abweichungen der Beobachtungen vom Durchschnittswert. (dispersion) x 1 - μ, x 2 – μ, …,x N - μ Da manche der Werte kleiner bzw. größer als μ sind, ist Da das Vorzeichen der Abweichung unwichtig ist und alle Werte gleich behandelt werden Betrachtung der quadrierten Werte Varianz: Durchschnitt der quadrierten Abweichungen (variance) der beobachteten Werte von ihrem Mittelwert. Varianz ist für den Vergleich zweier oder mehrerer Mengen der Beobachtungen nützlich. Varianz

Sitzung 1 13 Alexander Spermann WS 2007/2008 Formel für Varianz: Σ=0Σ= Σ=0Σ= Unternehmen 1 Unternehmen 2 Im Beispiel: Varianz der Grundgesamtheit

Sitzung 1 14 Alexander Spermann WS 2007/2008 Mit der Standardabweichung (standard deviation) kann man interpretieren, wie weit die beobachteten Werte vom Mittelwert tatsächlich entfernt sind. Beispiel: Standardabweichung der Grundgesamtheit

Sitzung 1 15 Alexander Spermann WS 2007/2008 Die Abweichungen der beobachteten Werte vom Mittelwert einer Stichprobe sind: und die quadrierten Werte entsprechend: Die Varianz der Stichprobe ist dann: ® Da bei der Berechnung der Stichprobenvarianz nicht der Mittelwert der Grundgesamtheit µ, sondern der Mittelwert der Stichprobe als Schätzer (proxy) verwendet wird, dividiert man als Kompensation durch (n -1), anstatt durch n. Varianz der Stichprobe 1

Sitzung 1 16 Alexander Spermann WS 2007/2008 Beispiel: Prozentuale Gewinne einer Stichprobe von 8 Unternehmen gegenüber dem Vorjahr sahen wie folgt aus : 13,6% 25,5% 43,6% -19,8% -13,8% 12,0% 36,3% 14,3% Die Summe der Quadrate der beobachteten Werte ist: Die Varianz der Stichprobe: Varianz der Stichprobe 2

Sitzung 1 17 Alexander Spermann WS 2007/2008 Notation: Standardabweichung der Stichprobe aus dem Beispiel ist: Standardabweichung der Stichprobe

Sitzung 1 18 Alexander Spermann WS 2007/2008 Zufallsexperiment:Vorgang, der zu einer von (random experiment)mindestens 2 möglichen Ausprägungen führt, wobei es unbekannt ist, zu welcher. Stichprobenraum S: Menge aller möglichen (sample space) Ausprägungen. Es können nicht gleichzeitig zwei Ausprägungen auftreten, aber eine muss auftreten. Zufallsexperiment 1

Sitzung 1 19 Alexander Spermann WS 2007/2008 Beispiele: Ein Vorgang wird beobachtet: Werfen einer Münze Werfen eines Würfels Mögliche Ausprägungen: entweder Kopf oder Zahl 1,2,3,4,5,6 Stichprobenraum: S=(Kopf, Zahl) S=(1,2,3,4,5,6) Zufallsexperiment 2

Sitzung 1 20 Alexander Spermann WS 2007/2008 Ereignis:Eine Teilmenge möglicher Ausprägungen mit dem (event)gleichen Merkmal. Notation: Großbuchstaben, z.B. A, B,...,Z Beispiel: Ereignis A/B: Eintreten einer ungeraden /geraden Zahl beim Werfen eines Würfels. Ergebnis eines Würfelwurfs z.B. 3 Ereignis A eingetreten. Zufallsexperiment 3

Sitzung 1 21 Alexander Spermann WS 2007/2008 Bezeichnung: P (probability) Ein Zufallsexperiment soll stattfinden. Wie groß ist die Wahrscheinlichkeit P bzw. die Chance, dass ein Ereignis eintritt? 1. Wahrscheinlichkeit als relative Häufigkeit : P liegt immer zwischen 0 und 1:0: ein Ereignis tritt auf keinen Fall ein 1: ein Ereignis tritt sicher ein Beispiel:Münze wird geworfen. Ereignis A: Kopf, zu 50% Ereignis B: Zahl, zu 50% In beiden Fällen P=0,5 Wahrscheinlichkeit P

Sitzung 1 22 Alexander Spermann WS 2007/2008 Was tun, wenn ein Experiment gar nicht oder zumindest nicht unter gleichen Umweltbedingungen wiederholt werden kann – Bsp. Konjunktur? 2. Wahrscheinlichkeit als subjektive Wahrscheinlichkeit : Bezeichnung: P subj Die subjektive Wahrscheinlichkeit beschreibt den rein individuellen Glauben über die Chance, dass ein bestimmtes Ereignis bei begrenzter Anzahl der Experiment eintritt. Zudem hängt sie von den gegebenen Informationen sowie ihrer persönlichen Interpretation ab. Gutes Bsp. sind Investitionsentscheidungen bezüglich entsprechender Gewinnerwartungen. Subjektive Wahrscheinlichkeit

Sitzung 1 23 Alexander Spermann WS 2007/2008 Zufallsvariablen:Ausprägungen eines Zufallsexperimentes: (random variable) 1. diskret: gutes / defektes Produkt (gut = 1, defekt = 2) 2. stetig: Familieneinkommen Wichtige Unterscheidung zwischen: einer Zufallsvariable X und dem Wert x, den sie annimmt. Zufallsvariable 1

Sitzung 1 24 Alexander Spermann WS 2007/2008 Beispiel 1:Beispiel 2: Werfen eines WürfelsProduktion Zufallsvariable X = AugenzahlZufallsvariable X = Qualität des Produktes 6 Ausprägungen x = 1, x = 2,..., x =6 2 Ausprägungen: x = 1, x = 2 wobei 1=gut, 2=defekt Diskrete Zufallsvariable: Nimmt nur eine abzählbare Anzahl an Ausprägungen an. Zufallsvariable 2

Sitzung 1 25 Alexander Spermann WS 2007/2008 Wahrscheinlichkeitsfunktion:gibt die Wahrscheinlichkeit wieder, dass eine =Dichtefunktion diskrete Zufallsvariable X die Ausprägung x (probability function)annimmt: P x ( x ) = P( X = x ) Die Wahrscheinlichkeiten aller Ausprägungen summieren sich auf 1: Beispiel: X = Augenzahl bei geworfenem Würfel Wahrscheinlichkeits-/ Dichtefunktion für das Bsp. mit unabhängigen Ereignissen /6 Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable

Sitzung 1 26 Alexander Spermann WS 2007/2008 Beziehung zwischen Wahrscheinlichkeitsfunktion und kumulierter Wahrscheinlichkeitsfunktion (cumulative probability function) ist gegeben als: Die kumulierte Wahrscheinlichkeitsfunktion des Würfelbeispiels: /2 1 Grafik der kumulierten Wahrscheinlichkeitsfunktion aus dem Beispiel: Für P(X 3) = Px(X=1)+Px(X=2)+Px(X=3)= 0,5 Kumulierte Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariablen 1

Sitzung 1 27 Alexander Spermann WS 2007/2008 Beispiel: Korrektur einer Stichprobe von Büchern, Zufallsvariable X =Tippfehler auf einer Seite 81% der Seiten hatten keinen Tippfehler der Wert der Zufallsvariable x = 0 17% hatten einen Tippfehler x = 1 2% hatten zwei Tippfehler x = 2 Dies kann man schreiben als: P x (0) = 0,81 P x (1) = 0,17 P x (2) = 0,02 Um einen repräsentativen Mittelwert zu bekommen, müssen die jeweiligen Werte mit ihren Wahrscheinlichkeiten gewichtet werden Erwartungswert (expected value) Erwartungswert einer diskreten Zufallsvariable 1

Sitzung 1 28 Alexander Spermann WS 2007/2008 Durch das Berechnen des Erwartungswertes erhalten wir den mittleren Wert einer diskreten Zufallsvariable. E(X) wird dann der Mittelwert der diskreten Zufallsvariable genannt. Notation: Beispiel: d.h. dass im Mittel auf jeder Seite 0,21 Tippfehler bzw. auf etwa jeder 5. Seite ein Tippfehler zu erwarten ist Erwartungswert einer diskreten Zufallsvariable 2

Sitzung 1 29 Alexander Spermann WS 2007/2008 Varianz:Der Erwartungswert der quadrierten Streuung (X – μ x )² gewichtet mit der Wahrscheinlichkeit Notation: Standardabweichung: Quadratwurzel der Varianz Notation: σ x Erwartungswert, Varianz und Standardabweichung 1

Sitzung 1 30 Alexander Spermann WS 2007/2008 Beispiel: Tippfehler Um die Varianz zu finden, muss zuerst der Erwartungswert gefunden werden: Varianz: und die Standardabweichung entsprechend: Erwartungswert, Varianz und Standardabweichung 2

Sitzung 1 31 Alexander Spermann WS 2007/2008 Stetige Zufallsvariablen:Nicht abzählbare Anzahl an Werten (continuous random variable) auf einem Wertestrahl (Kontinuum). Beispiele: Zeit, Entfernung, Temperatur. Verteilungsfunktion einer stetigen Zufallsvariable: Wahrscheinlichkeit, dass X den Wert x nicht übersteigt. Notation: Verteilungsfunktion einer stetigen Zufallsvariable entspricht der kumulierten Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable. Verteilungsfunktion einer stetigen Zufallsvariable 1

Sitzung 1 32 Alexander Spermann WS 2007/2008 Beispiel: Nehmen wir an, dass ein Tunnel genau 1 km lang ist. Es werden die Unfälle im Tunnel beobachtet. Zufallsvariable: X = Entfernung vom Eingang des Tunnels zum Zeitpunkt des Unfalls. Die Wahrscheinlichkeit, dass ein Unfall passiert, ist für jede Teilstrecke gleich. Verteilungsfunktion dieser Grafik zum Beispiel: Zufallsvariable ist: 1 Verteilungsfunktion einer stetigen Zufallsvariable 2

Sitzung 1 33 Alexander Spermann WS 2007/2008 Es ist unmöglich, die Wahrscheinlichkeit für einen bestimmten Wert, den die Zufallsvariable annimmt, zu berechnen. Es kann nur die Wahrscheinlichkeit berechnet werden, dass die Zufallsvariable einen Wert zwischen den Werten a und b annimmt. Diese Wahrscheinlichkeit ist: P (a < x < b) = F x (b) – F x (a) Im Beispiel: Da die Zufallsvariable zwischen 0 und 1 einheitlich verteilt ist, ist die Verteilungsfunktion in diesem Bereich: F x (x) = x Für a=1/4 und b=3/4 ist die Wahrscheinlichkeit, dass ein Unfall in diesem Bereich liegt: P (1/4< x < 3/4) = F x (3/4) – F x (1/4) = 3/4 – 1/4= 1/2 Verteilungsfunktion einer stetigen Zufallsvariable 3

Sitzung 1 34 Alexander Spermann WS 2007/2008 Die Dichtefunktion für eine stetige Zufallsvariable X ist eine Funktion mit folgenden Eigenschaften: f X (x) 0 für alle x - Werte Grafik der Dichtefunktion: a und b sind Werte der Zufallsvariable X, wobei a<b. Die Wahrscheinlichkeit, dass x zwischen a und b liegt, ist der Bereich unter der Kurve zwischen diesen zwei Werten. Beispiel : x ab Dichtefunktion einer stetigen Zufallsvariable 1

Sitzung 1 35 Alexander Spermann WS 2007/2008 Eigenschaften der Dichtefunktion: Die Fläche unter der Dichtefunktion entspricht dem Wert 1. Die Fläche unter der Kurve der Dichtefunktion, f X (x), links von dem Wert x 0 ist F x (x 0 ), wobei x 0 irgendein Wert ist, den die Zufallsvariable annehmen kann. Dichtefunktion einer stetigen Zufallsvariable 2

Sitzung 1 36 Alexander Spermann WS 2007/2008 Gesamtfläche = 1 = 0,5 F x (x) F(b)=3/4 F(a)=1/4 =0,5 (50%) 0 b ¾*1km=750m a ¼*1km=250m 1 Gesamtfläche = 1 Dichte- und Verteilungsfunktion einer stetigen Zufallsvariable 3 – laut Beispiel

Sitzung 1 37 Alexander Spermann WS 2007/2008 Stetige Verteilung, die in der Statistik eine zentrale Rolle spielt. Eine Zufallsvariable X ist normalverteilt wenn ihre Dichtefunktion wie folgt aussieht: Und: x µ, wobei die Varianz immer positiv ist. Die Normalverteilung 1

Sitzung 1 38 Alexander Spermann WS 2007/2008 Eigenschaften: Der Mittelwert der Zufallsvariable ist µ, also: E (X) = μ Die Varianz der Zufallsvariable ist σ² also: mit Standardabweichung: = σ wobei gilt: je kleiner σ², desto enger liegt die Verteilung um den wahren Wert Die Form der Dichtefunktion ist eine symmetrische Glockenkurve mit dem Zentrum im Mittelwert µ. Notation: X~ N (µ,σ²) Die Normalverteilung 2

Sitzung 1 39 Alexander Spermann WS 2007/2008 Standardnormalverteilung mit =1 und =0 2 =1,44 und =0 2 =4 und =0 2 =2,25 und =3 =2,25 und =1 Die Normalverteilung 3

Sitzung 1 40 Alexander Spermann WS 2007/2008 Gezogene Zufallsstichproben der Grundgesamtheit sind: X 1,X 2,X 3,…,X n Der Stichprobenmittelwert ist dann: Es gilt, dass der Erwartungswert der Summe der Stichprobe gleich der Summe der Erwartungswerte ist: Da jede Zufallsstichprobe X i den Mittelwert μ X hat, können wir schreiben: Stichprobe und Grundgesamtheit: Erwartungswert 1

Sitzung 1 41 Alexander Spermann WS 2007/2008 Der Erwartungswert des Mittelwertes der Stichprobe ist dann: Also entspricht der Erwartungswert des Mittelwertes der Stichprobe dem Mittelwert der Grundgesamtheit. Das heißt, dass der Mittelwert der Stichprobe ein erwartungstreuer Schätzer für den Mittelwert der Grundgesamtheit ist. Stichprobe und Grundgesamtheit: Erwartungswert 2

Sitzung 1 42 Alexander Spermann WS 2007/2008 Erwartungswert des Schätzers = wahrer Wert, d.h. unverzerrt (unbiased). n = 100 n= Dichtefunktionen der Normalverteilung für wahre Stichprobenmittelwerte vom Umfang n=25 und n=100 Beobachtungen, mit der Standardabweichung=5. Stichprobe und Grundgesamtheit: Erwartungswert 3

Sitzung 1 43 Alexander Spermann WS 2007/2008 Beispiel: Es sollen Arbeitsteams aus jeweils 4 Beschäftigten mit Berufserfahrung von 2 bis 8 Jahren zusammengestellt werden. Es werden fünfzehn Stichproben von vier Beobachtungswerten aus einer Grundgesamtheit von sechs Werten: 2,4,6,6,7,8, gezogen. StichprobeMittelwertStichprobeMittelwert 2,4,6,64,52,6,7,85,75 2,4,6,74,752,6,7,85,75 2,4,6,854,6,6,75,75 2,4,6,74,754,6,6,86 2,4,6,854,6,7,86,25 2,4,7,85,254,6,7,86,25 2,6,6,75,256,6,7,86,75 2,6,6,85,5 Der wahre Mittelwert (sample mean) dieser Grundgesamtheit ist der Durchschnitt dieser sechs Werte: μ X =5,5 Stichprobe und Grundgesamtheit: Erwartungswert 4

Sitzung 1 44 Alexander Spermann WS 2007/2008 Die Häufigkeitsverteilung der Wahrscheinlichkeiten von Mittelwerten der Stichproben (sampling distribution of the sample mean) ist: Der Erwartungswert des Mittelwertes der Stichprobe entspricht dem Mittelwert der Grundgesamtheit: Stichprobe und Grundgesamtheit: Erwartungswert 5

Sitzung 1 45 Alexander Spermann WS 2007/2008 Es werden n Beobachtungen X 1,X 2,X 3,…,X n aus der Grundgesamtheit zufällig gezogen, wobei der wahre Mittelwert und die wahre Varianz unbekannt sind. Die Varianz der Grundgesamtheit ist: Da aber μ X unbekannt ist, wird es durch (= Mittelwert der Stichprobe) geschätzt. Die Varianz der Stichprobe lautet: Mit Hilfe dieser Definition der S XX ² kann gezeigt werden, dass Das bedeutet, dass der erwartete Wert der Stichprobenvarianz der Varianz der Grundgesamtheit entspricht. Man sagt dann, dass der Schätzer für die Varianz erwartungstreu ist. Stichprobe und Grundgesamtheit: Varianz 1

Sitzung 1 46 Alexander Spermann WS 2007/2008 Kovarianz einer Stichprobe: wegen der Approximation von µ durch und ŷ wird als Kompensation durch (n-1), anstatt durch n dividiert, d.h es wird ein Freiheitsgrad aufgegeben. Kovarianz

Sitzung 1 47 Alexander Spermann WS 2007/2008 Erläuterung: S : Anzahl der Jahre in Ausbildung Y : Stundenlohn in Dollar (1992) Quelle:Dougherty Kovarianz einer Stichprobe – ein Beispiel

Sitzung 1 48 Alexander Spermann WS 2007/2008 Illustration der Kovarianz: Quelle:Dougherty S Y Interpretation von S SY 2 = 15,294 : es liegt positiver Zusammenhang vor = 14,225 und = 13,250 Kovarianz einer Stichprobe – ein Beispiel

Sitzung 1 49 Alexander Spermann WS 2007/2008 Quelle: Dougherty Nach Multiplikation von Y mit 100, S SY 2 = 1529,4 d.h. trotz Änderung der Dimension bleibt der Zusammenhang unverändert und wird lediglich in eine andere Größenordnung (*100) transformiert. Vergleich Kovarianz und Korrelationskoeffizient – ein Beispiel

Sitzung 1 50 Alexander Spermann WS 2007/2008 Korrelationskoeffizient Formel: Beispiel: Vorteil des Korrelationskoeffizienten gegenüber der Kovarianz: dimensionslos mit : gegeben

Sitzung 1 51 Alexander Spermann WS 2007/2008 Dougherty, Christopher; Introduction to Econometrics Gujarati, Damodar; Basic Econometrics (4th Edition) Wooldridge, Jeffrey; Introductory Econometrics Datensätze und weitere Infos vom und zum Autor auch unter: Chiang, Alpha C.; Fundamental Methods of Mathematical Economics Simon, Carl and Lawrence Blume; Mathematics for Economists Literatur