Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Klassische Hypothesenprüfung nach Neyman & Pearson (1928) nach Fisher (1925)

Ähnliche Präsentationen


Präsentation zum Thema: "Klassische Hypothesenprüfung nach Neyman & Pearson (1928) nach Fisher (1925)"—  Präsentation transkript:

1 Klassische Hypothesenprüfung nach Neyman & Pearson (1928) nach Fisher (1925)

2 Theorie und Empirie Theorie Empirie

3 Theorie und Hypothesen Theorie Hypothese Prüfung

4 Theorie und Hypothesen Hypothese Prüfung Theorie

5 Theorie und Hypothesen Theorie Hypothese Prüfung

6 Theorie und Hypothesen Theorie Hypothese Prüfung Prüfung Prüfung T heorie

7 H 1 und H 0 H 1 (Alternativhypothese, inhaltliche Hypothese, Arbeitshypothese, theoriekonforme Hypothese) –abgeleitet aus einer innovativen Theorie z.B. Widerspruch zu herkömmlichen Theorien, kontraintuitiv (im Widerspruch zu intuitiven Theorien), oder Erklärung neuer Sachverhalte, Ergänzungen,... H 0 (Nullhypothese) –keineswegs aus Gegentheorie abgeleitet, sondern lediglich Verneinung von H 1. theoriefrei

8 Ziel einer Studie meist: Beweis von H 1. –Festigung (nicht: Beweis) der eigenen Theorie gelegentlich: Beweis von H 0. –theoriefreie Schwächung (nicht: Widerlegung) einer gängigen Theorie Popper: Asymmetrie Beweis einer Theorie geht nicht, Widerlegung mit einem einzigen Experiment möglich. –z.B.: All-Aussagen: Alle Menschen haben ihr Herz links. –sinnvolle Theorien meist komplexer strukturiert.

9 Hypothesen Unterschieds- versus Zusammenhangshypothesen –Die Einführung von PowerPoint in die Lehre verändert den Lernerfolg. UH werden mit Häufigkeits- und Mittelwertvergleichen geprüft. –Zwischen Internetgebrauch und Lesetätigkeit besteht ein Zusammenhang. ZH werden mit Korrelationsrechnungen geprüft. Gerichtete versus ungerichtete Hypothesen –Die Einführung von PowerPoint in die Lehre verbessert den Lernerfolg. –Zunehmender Internetgebrauch beeinträchtigt die Lesetätigkeit. Spezifische versus unspezifische Hypothesen –Die Einführung von PowerPoint verbessert den Lernerfolg um 1 Note. –Die Korrelation zwischen Internetgebrauch und Lesetätigkeit ist kleiner als –0.5.

10 Überführung in statistische Hypothesen –Die Einführung von PowerPoint in die Lehre verändert den Lernerfolg. Der durchschnittliche Lernerfolg µ 1 einer mit PP unterrichtete Gruppe ist ungleich dem durchschnittlichen Lernerfolg µ 0 einer ohne PP unterrichteten Gruppe. H 1 : µ 1 µ 0. H 0 : µ 1 = µ 0. –Die Einführung von PowerPoint in die Lehre verbessert den Lernerfolg. Der durchschnittliche Lernerfolg µ 1 einer mit PP unterrichtete Gruppe ist größer als der durchschnittlichen Lernerfolg µ 0 einer ohne PP unterrichteten Gruppe. H 1 : µ 1 > µ 0. H 0 : µ 1 µ 0.

11 Überführung in statistische Hypothesen –Zwischen Internetgebrauch und Lesetätigkeit besteht ein Zusammenhang. In einer repräsentativen Stichprobe ist die Korrelation zwischen Internetgebrauch und Lesetätigkeit ungleich Null. H 1 : 0. H 0 : = 0. –Zunehmender Internetgebrauch beeinträchtigt die Lesetätigkeit. In einer repräsentativen Stichprobe ist die Korrelation zwischen Internetgebrauch und Lesetätigkeit kleiner Null. H 1 : < 0. H 0 : 0.

12 H 1 stimmtH 0 stimmt in Wirklichkeit stimmt H 1 stimmt H 0 -Fehler Fehler 2. Art -Fehler Fehler 1. Art Fehler Ergebnis der Hypothesenprüfung Welcher Fehler ist schlimmer? Das hängt davon ab... H 1 : Der eben aus Hongkong eingetroffene Tourist ist mit SARS infiziert. H 1 : Der eben aus Paris eingetroffene Tourist ist nicht mit SARS infiziert. richtig

13 -Fehler Wahrscheinlichkeit z. B. im Fall einer gerichteten Unterschiedshypothese H 1 : µ 1 > µ 0. –µ 0 und 0 seien bekannt. –Eine Stichprobe mit n=30 ergibt Mittelwert. –erwartete Verteilung für bei n=30: N(µ 0, 0 ²/30). z = ( – µ 0 ) / = ( – µ 0 ) / ( 0 / n) –testet eigentlich µ 1 = µ 0, nicht µ 1 µ 0.

14 -Fehler Wahrscheinlichkeit z. B. im Fall einer ungerichteten Unterschiedshypothese H 1 : µ 1 µ 0. –µ 0 und 0 seien bekannt. –Eine Stichprobe mit n=30 ergibt Mittelwert. –erwartete Verteilung für bei n=30: N(µ 0, 0 ²/30). z = ( – µ 0 ) / = ( – µ 0 ) / ( 0 / n) –testet korrekterweise µ 1 = µ 0.

15 Signifikanzniveaus p (Ergebnis | H 0 ) 0.05: signifikant p (Ergebnis | H 0 ) 0.01: sehr signifikant Fahrer:Was bedeutet die durchgezogene gelbe Linie am Fahrbahnrand? Polizist:Dort dürfen Sie nicht parken. Fahrer:Und was ist, wenn da zwei gelbe Linien sind? Polizist:Dort dürfen Sie überhaupt nicht parken! entweder:Signifikanzniveaus vor Untersuchungsbeginn festlegen, nicht anhand der Daten. oder: Nur Fehlerwahrscheinlichkeiten berichten. Praxis:hochsignifikante Ergebnisse (p<0.002) (Verstoß gegen die reine Lehre, aber kein wirkliches Problem)

16 -Fehler Wahrscheinlichkeit

17 z. B. im Fall einer gerichteten Unterschiedshypothese H 1 : µ 1 > µ 0. –µ 1 ist unbekannt. 1 wird als identisch zu 0 angenommen. –Eine Stichprobe mit n=30 ergibt Mittelwert. –erwartete Verteilung für bei n=30: N(µ 1, 0 ²/30). Die -Fehler Wahrscheinlichkeit ist eine Funktion von µ 1 ! µ 1 festlegen: µ 1 = µ 0 + E, Effektstärke = (µ 1 – µ 0 ) / 0 = E / fragwürdige Vorgehensweise...

18 - und -Fehler bei unterstellter Effektstärke - und -Fehler sind gegenläufig

19 - und -Signifikanzniveaus konservativ: –kleines -Fehler-Niveau (5%, 1%) –hohes -Fehler-Niveau (z. B. 20%) Indifferenzbereich, z.B. hier: weder H 0 noch H 1 verwerfen.

20 n erhöhen nimmt ab (hier: n' = 4*n, ' = /2). Indifferenzbereich, hier: sowohl H 0 als auch H 1 verwerfen.

21 optimaler Stichprobenumfang (hier: n' = 2*n, ' = /1.4). kein Indifferenzbereich....

22 Kritik optimaler Stichprobenumfang verschleiert das Problem, das durch den Indifferenzbereich aufgedeckt wird: Wenn eine Effektstärke vorgegeben wird, sind H 0 und H 1 keine komplementären Hypothesen mehr. Es ist z. B. sehr gut möglich, daß zwar ein Effekt da ist, er aber nicht die postulierte Effektstärke erreicht. Dann stimmt weder H 0 noch H 1. verwandte Begriffe: -Fehler, Effektstärke, optimaler Stichprobenumfang, Teststärke (power) 1 –.

23 - und -Fehler sind gegenläufig: - und -Fehler mit unterstellter Effektstärke

24 - und -Fehler bei komplementären Hypothesen -Fehler testet nicht H 0 : µ 1 µ 0, sondern worst case µ 1 = µ 0. -Fehler testet nicht H 1 : µ 1 > µ 0, sondern worst case µ 1 = µ 0 + (mit beliebig klein). = 1 –. - und -Fehler sind gegenläufig: H 1 : µ 1 > µ 0. H 0 : µ 1 µ 0.

25 Korrekter Test einer unterstellten Effektstärke wirklich konservativ: –kleines -Fehler-Niveau (5%, 1%) fürH 1 : µ 1 > µ 0, H 0 : µ 1 µ 0. –kleines -Fehler-Niveau (5%, 1%) fürH 1 : µ 1 > µ 0 + E,H 0 : µ 1 µ 0 + E. -Fehlerwahrscheinlichkeit von 20% entspricht -Fehlerwahrscheinlichkeit von 80% !!!

26 Wann ist es sinnvoll, den -Fehler separat zu bestimmen? Die Effektgröße muß bekannt sein. Sonst muß man eine beliebig kleine Effektgröße zulassen, und ist einfach 1 –. Was soll dann noch fraglich sein? Eine klassische Unterschiedshypothese kommt nicht in Frage. Umkehrung der Fragestellung: –bisher:Zugehörigkeit der VP zu Gruppe A oder B ist bekannt. Frage: Gibt es einen Unterschied zwischen A und B? –jetzt:Unterschied zwischen Gruppe A und B ist bekannt. Frage: Gehört VP zu Gruppe A oder zu Gruppe B? SDT (Statistical Decision Theory, Signal Detection Theory)


Herunterladen ppt "Klassische Hypothesenprüfung nach Neyman & Pearson (1928) nach Fisher (1925)"

Ähnliche Präsentationen


Google-Anzeigen