Deskriptive Statistik und Wahrscheinlichkeitstheorie

Slides:



Advertisements
Ähnliche Präsentationen
T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.
Advertisements

Korrektur Tutoratsaufgaben V
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Bewegungswissenschaft
Untersuchungsarten im quantitativen Paradigma
Forschungsstrategien Johannes Gutenberg Universität Mainz
Thema der Stunde I. Einführung in die Varianzanalyse:
Klassische Hypothesenprüfung
EmPra Der Einfluss und die Verarbeitung von emotionalen Reizen
Gliederung Vertrauensintervalle Arten von Hypothesen
Gliederung Der Begriff der Stichprobe, Stichprobenfehler
Forschungsstatistik II
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Der Binomialtest Man habe einen wahren Anteil P.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Hypothesen testen: Grundidee
Prüfung statistischer Hypothesen
Reliabilitätsanalysen
Die Standardnormalverteilung
Tutorat IV: Diagramme, Datenkontrolle, Wahrscheinlichkeitsrechnung
Effektgrößen, Kontraste & Post-hoc-Tests
Deskriptive Statistik und Wahrscheinlichkeitstheorie
Statistische Methoden I
Konfidenzintervalle Intervallschätzung
M-L-Schätzer Erwartungswert
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Die Student- oder t-Verteilung
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,
Klausurtermin (laut Prüfungsamt) Probeklausur Freitag, 13. Juni 2003 statt Vorlesung.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird auf Montag, den 17. Mai verlegt! Zeit: 16 Uhr Ort: Kiste Nächste Woche!!!!
Statistische Methoden II SS 2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Maximum-Likelihood-Schätzer ( diskreter Fall) Likelihood-Funktion mit oder M-L-Schätzer.
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Tutorium
Tutorium Willkommen zurück, in der wunderbaren Welt der Statistik Teil II.
Tutorium
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
Vorlesung: ANOVA I
Einführung in die Metaanalyse
Eigenschaften der OLS-Schätzer
Multikollinearität Wann spricht man von Multikollinearität?
Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014
Formulierung und Überprüfung von Hypothesen
Einführung in die beurteilende Statistik
Vergleich der 3 Arten des t-Tests Testergebnisse berichten
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Chi Quadrat Test Tamara Katschnig.
Wahrscheinlichkeitsrechnung
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
Konfidenzintervall und Testen für den Mittelwert und Anteile
Mehr zum Testen von Hypothesen
1 Stichprobenverfahren zur Qualitätssicherung Hilfestellung der Statistik in der Wirtschaftsprüfung.
Tutorium Statistik II Übung IV Philipp Schäpers Mi – 11.45
Statistik – Regression - Korrelation
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
Der Binomialtest Man habe einen wahren Anteil P. Kann man aufgrund von p sagen, daß in der Population tatsächlich der Anteil P zugrunde liegt? [Beispiele]
Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung
STATISIK LV Nr.: 1375 SS März 2005.
Prüft ebenfalls die Annahme der Varianzhomogenität (exakter)
Forschungsstrategien Johannes Gutenberg Universität Mainz
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
 Präsentation transkript:

Deskriptive Statistik und Wahrscheinlichkeitstheorie Termin7 Tutorat Deskriptive Statistik und Wahrscheinlichkeitstheorie Kai Vogt vogtkai@gmx.net

Heute: Kurze Wiederholung (Aufgabenblatt) Hypothesenprüfung Hypothesenformulierung Alpha- und Beta-Fehler Einflussgrößen des Beta-Fehlers

Wichtiges aus Termin 6 Kombinatorik Stichprobentheorie Schätzungen Wann wird was verwendet? Einfache Beispiele rechnen bzw. einsetzen. Stichprobentheorie Zufallsauswahl vs. Nicht-zufallsgesteuerte Auswahlverfahren (Welche gibt es jeweils? Pros & Contras) Schätzungen Punktschätzung vs. Intervallschätzung Standardfehler  Was ist das? Konfidenzintervall (Definition, einfache Berechnungen & Interpretationen, Mutungs- vs. Vertrauensintervalle) 3

Arbeitsblatt Stichprobentheorie Die Varianz ist ein erwartungstreuer Schätzer Das Effizienzkriterium fordert, dass die Streuung des Schätzers möglichst gering sein soll Laut Konsistenzkriterium spielt die Stichprobengröße keine Rolle Die Varianz erfüllt das Kriterium der Exhaustivität nicht

Man unterscheidet zwischen zufallsgesteuerten und nicht-zufallsgesteuerten Verfahren der Stichprobengewinnung Zufallsauswahl ist immer besser als eine nicht- zufallgesteuerte Auswahl Die Quotenauswahl ist ein nicht-zufallsgesteuertes Auswahlverfahren Die Klumpenauswahl ist ein zufallsgesteuertes Verfahren

Bei der uneingeschränkten Zufallsauswahl unterscheidet sich die Wahrscheinlichkeit in die Stichprobe aufgenommen zu werden je nach Personengruppe Die geschichtete Zufallsauswahl hat keine Voraussetzungen Die Klumpenauswahl hat mit der mehrstufigen Zufallsauswahl nichts zu tun Eine Stichprobe computergestützt zufällig aus einem Register zu ziehen ist ein Beispiel für eine Ad-hoc Auswahl

Bei der geschichteten Zufallsauswahl wird nicht davon ausgegangen, dass sich die Teilpopulationen systematisch unterscheiden Bei einer Quotenauswahl lässt sich streng genommen kein Standardfehler bestimmen Bei der geschichteten Zufallsauswahl wird von einem systematischen Unterschied der Teilstichproben ausgegangen Am Bertoldsbrunnen die ersten zehn Leute zu befragen ist ein Beispiel für die Ad-hoc Auswahl

Ein Mutungsintervall schätzt, in welchem Bereich ein Populationsparameter liegt. Ein Konfidenzintervall schätzt, in welchem Bereich ein Anteil der Stichprobe/Population liegt Der zentrale Grenzwertsatz postuliert keine Zusammenhänge zwischen der Anzahl der Stichproben und der Verteilungskurve der gewonnen Mittelwerte Die Streuung der Mittelwerteverteilung ist die Standardabweichung

Hypothesenprüfung

Grundlegende Idee Anhand von Stichprobenkennwerten werden Hypothesen für die Population getestet Dabei soll die Bedeutsamkeit einer Mittelwertsdifferenz oder Relevanz eines Zusammenhangs, einer Korrelation getestet werden Wie groß muss mein gefundener Mittelwertunterschied sein, damit keiner sagen kann, er sei zufällig entstanden? Ab wann ist er statistisch bedeutsam?

Vorgehen bei statistischen Tests: Formulierung der Hypothesen (gerichtet oder ungerichtet). Berechnung eine empirischen Werts (z.B. t, r,…) Vergleich von empirischem Wert mit kritischem Wert (Tabelle) Der kritische Wert hängt ab von den Freiheitsgraden und der Art der Hypothese Je nachdem ob der emprische über oder unter dem kritischen Wert liegt wird die H0 aufrechterhalten oder verworfen (=H1 angenommen) heute!

Nullhypothese & Alternativhypothese Nullhypothese (H0): Diese “Negativhypothese” behauptet immer, dass es keine Mittelwertsunterschiede, beziehungsweise keine Zusammenhänge in der Population gibt. Alternativhypothese (H1): Diese besagt, dass ein Unterschied oder ein Zusammenhang in der Population existiert. Die Alternativhypothese sollte immer aus einem Theoriegebäude, aus Vorstudien und der Literatur abgeleitet sein.

Grundlegende Idee (Reloaded) Anhand von Stichprobenkennwerten werden Hypothesen für die Population getestet Dabei soll die Bedeutsamkeit einer Mittelwertsdifferenz oder Relevanz eines Zusammenhangs, einer Korrelation getestet werden. Grundlage beim Hypothesentesten ist immer die H0. Statistisch wird die Wahrscheinlichkeit für gefundene Mittelwertsdifferenzen (Effekte) erhoben. Wenn die Gültigkeit der H0 aufgrund der gefundenen Stichprobenergebnisse sehr unwahrscheinlich ist, wird die Gültigkeit der H1 angenommen (ansonsten wird die H0 beibehalten.)

Das alpha-Niveau Das alpha-Niveau wird immer vor der Untersuchung festgelegt (und darf danach nicht mehr verändert werden).  Meistens liegt es bei 5% (selten bei 1% oder 0,1%) Es legt in Abhängigkeit von Stichprobengröße und zugrunde liegender theoretischer Verteilung den Grenzwert für ein Konfidenzintervall fest.  Umgangssprachlich: „Es legt die Größe des Konfidenzintervalls fest  und damit die Grenze für die Wahrscheinlichkeit eines alpha- Fehlers“. Liegt der empirisch ermittelte Kennwert einer erhobenen Stichprobe außerhalb dieses Intervalls so wird die Ho verworfen und die H1 angenommen.  Es liegt ein signifikanter Mittelwertsunterschied vor…

Die (heilige) Signifikanz  Liegt die Wahrscheinlichkeit für das Auftreten eines gefundenen Mittelwertunterschieds unter der Bedingung der H0, unterhalb des alpha- Niveaus, handelt es sich um einen signifikanten (bedeutsamen) Mittelwertsunterschied.

Statistische Formulierung von Hypothesen Es sei μ1 das mittlere (…) in der Population der (...) und es sei μ2 die mittlere (...) in der Population der (...). Dann gilt: H0 : μ1 = μ2 und H1 : μ1 ≠ μ2 bei einem alpha-Niveau von 5%.  zweiseitige bzw. ungerichtete Testung

Statistische Formulierung von Hypothesen Es sei μ1 das mittlere (…) in der Population der(...) und es sei μ2 die mittlere (...) in der Population der (...). Dann gilt: H0 : μ1 ≤ μ2 und H1 : μ1 > μ2 bei einem alpha-Niveau von 5%.  einseitige bzw. gerichtete Testung Oder : H0 : μ1 ≥ μ2 und H1 : μ1 < μ2

Fehler beim Hypothesentesten Aufgrund von Unsicherheiten bei der Stichprobenziehung besteht die Gefahr eines falschen Schlusses auf die Population. Es wird zwischen zwei möglichen Fehlern bei der Testung einer Hypothese unterschieden.

Zwei mögliche Fehler: alpha-Fehler: Ablehnung der “richtigen” Nullhypothese bei gültiger Nullhypothese (Fehler erster Art).  Umgangssprachlich: „Ein Effekt wird angenommen dabei gibt es diesen nicht.“ beta-Fehler: Beibehaltung der “falschen” Nullhypothese bei gültiger Alternativhypothese (Fehler zweiter Art).  Umgangssprachlich: „Ein Effekt wird nicht entdeckt obwohl dieser eigentlich existiert.“

Teststärke Die Teststärke ist die Wahrscheinlichkeit, dass ein in der Population vorhandener Unterschied bei statistischer Testung entdeckt wird. Sie berechnet sich mit T= 1 - β  Umgangssprachlich: „Wahrscheinlichkeit dafür, dass ein existierender Effekt auch gefunden wird.“

Zur Übersicht: ? ?

Was beeinflusst den Beta-Fehler? Höhe des alpha-Niveaus Ein- oder zweiseitige Testung Homogenität der Merkmalsverteilung (=Streuung des Merkmals) Stichprobenumfang Größe des statistischen Effekts Abhängige versus unabhängige Stichproben Teststärke (1 − beta-Fehler)

WICHTIGES AUS TERMIN 7 Einführung: Hypothesenprüfung Nullhypothese (H0) vs. Alternativhypothese (H1)  Was ist eine H1 bzw. eine H0?  Verständnis für die grundlegende Idee des Hypothesentestens (Es wird von der H0 ausgegangen  wenn H0 zu unwahrscheinlich dann wird die H1 angenommen.) Alpha-Niveau und Signifikanz Hypothesen formulieren (gerichtet & ungerichtet) Alpha-Fehler, Beta-Fehler & Teststärke (T=1-ß)  Definitionen (Was ist Fehler erster bzw. zweiter Ordnung? Was versteht man unter der Teststärke)  Einzeichnen der beiden Fehler in Verteilungsformen.  Wie lassen sich die beiden Fehler beeinflussen? (alpha-Fehler a posteriori überhaupt nicht mehr…)

Vielen Dank für eure Aufmerksamkeit! Bis nächste Woche… Schreibt euch Fragen auf wenn ihr welche habt… Fragen an vogtkai@gmx.net Vielen Dank für eure Aufmerksamkeit!