Vergleich der 3 Arten des t-Tests Testergebnisse berichten

Slides:

Advertisements

Ähnliche Präsentationen

T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.

Advertisements

T-Tests und Varianzanalysen

Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse

Korrektur Tutoratsaufgaben V

Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.

Aufgabe Analyse (Friedman-Test) von letzter Stunde wiederholen

Aufgabe Analyse (Friedman-Test) von letzter Stunde wiederholen

Forschungsstrategien Johannes Gutenberg Universität Mainz

Methoden der Psychologie Multivariate Analysemethoden und Multivariates Testen Günter Meinhardt Johannes Gutenberg Universität Mainz

Thema der Stunde I. Einführung in die Varianzanalyse:

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Klassische Hypothesenprüfung

EmPra Der Einfluss und die Verarbeitung von emotionalen Reizen

Einfaktorielle Varianzanalyse

Gliederung Vertrauensintervalle Arten von Hypothesen

Gliederung Definition des Wahrscheinlichkeitsbegriffes

Gliederung Der Begriff der Stichprobe, Stichprobenfehler

Gliederung Unterschied zwischen parametrischen und nicht-parametrischen Testverfahren Abhängige vs. unabhängige Stichprobe Mann-Whithney-U-Test für unabhängige.

Forschungsstatistik II

Forschungsstatistik II

Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.

Forschungsstatistik II

Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.

Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.

Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.

A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.

Der Binomialtest Man habe einen wahren Anteil P.

Mehrfachregressionen

Ein frohes und erfolgreiches Jahr

Prüfung statistischer Hypothesen

Effektgrößen, Kontraste & Post-hoc-Tests

Deskriptive Statistik und Wahrscheinlichkeitstheorie

Fragen Was wird mit der Alphafehler-Kumulierung bzw. –inflation bezeichnet? Wie hoch ist die Wahrscheinlichkeit bei einer Untersuchung mit 4 Gruppen einen.

Nachholung der Vorlesung vom Freitag

Ab nächster Woche wird die Übungsgruppe Gruppe 2: Henrike Berg Di SR 222 wegen Personalmangel eingestellt.

Die Student- oder t-Verteilung

Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.

Klausurtermin (laut Prüfungsamt) Probeklausur Freitag, 13. Juni 2003 statt Vorlesung.

Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.

Test auf Normalverteilung

Kodiersysteme und erste Umrechnungen

Vorlesung: Biometrie für Studierende der Veterinärmedizin

Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014

Formulierung und Überprüfung von Hypothesen

Varianzanalyse IV: Messwiederholung

Überblick Statistik Deskriptive Statistik=beschreibende Statistik

Statistik I WS 08/09 Dr. Andreas Voß Raum: 4010

Einfaktorielle Varianzanalyse (ANOVA)

t-Test für unabhängige Stichproben

Seminar: Datenerhebung

Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,

Überblick Statistik Deskriptive Statistik=beschreibende Statistik

Modul Statistische Datenanalyse

Mehr zum Testen von Hypothesen

Statistik I - Übung Sarah Brodhäcker.

Varianzanalyse Teststatistik: F – Test -> vergleich zweier Varianzen -> Grundlage der Varianzanalyse Welche „Varianzen“ werden miteinander verglichen?

Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig

Überblick Statistik Deskriptive Statistik=beschreibende Statistik

Der Binomialtest Man habe einen wahren Anteil P. Kann man aufgrund von p sagen, daß in der Population tatsächlich der Anteil P zugrunde liegt? [Beispiele]

Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung

STATISIK LV Nr.: 1375 SS März 2005.

Forschungsstrategien Johannes Gutenberg Universität Mainz

Test 1 Test 2 Test 3. Test 4 Test 5 Test 6 Test 7 Test 8 Test 9.

Signifikanzprüfung Peter Wilhelm Herbstsemester 2015.

Analysen univariater Stichproben

Vergleich Eindimensionaler Stichproben

Forschungsstrategien Johannes Gutenberg Universität Mainz

Präsentation transkript:

Vergleich der 3 Arten des t-Tests Testergebnisse berichten Der t-Test Gliederung Vergleich der 3 Arten des t-Tests Testergebnisse berichten Effektstärke Teststärke (Power) 08_ttest(3) 1

Vergleich der 3 Arten des t-Tests unabhängige Stichproben abhängige Stichproben Eingruppen t-Test Fragestellung Unterscheiden sich die Mittelwerte von zwei Gruppen? Unterscheiden sich die Mittelwerte zu zwei Messzeit-punkten? Unterscheidet sich der Mittelwert von einem Vergleichs-wert? Voraus-setzungen Intervallskalen-niveau Normalverteilung Varianz-homogenität Unabhängige Stichproben Abhängige Stichproben Eine Zufalls- stichprobe 08_ttest(3) 2

Vergleich der 3 Arten des t-Tests Unabhängige Stichproben Abhängige Stichproben Eingruppen t-Test Ungerichtete Hypothese H0: μ1 = μ2 H1: μ1 ≠ μ2 H0: μd = 0 H1: μd ≠ 0 H0: μ = c H1: μ ≠ c Gerichtete Hypothese H0: μ1 ≤ μ2 H1: μ1 > μ2 H0: μd ≤ 0 H1: μd > 0 H0: μ ≤ c H1: μ > c 08_ttest(3) 3

Vergleich der 3 Arten des t-Tests Unabhängige Stichproben Abhängige Stichproben Eingruppen t-Test Kennwert des Tests Standardfehler des Kennwerts t-Wert Freiheitsgrade 08_ttest(3) 4

Vergleich der 3 Arten des t-Tests Unabhängige Stichproben Abhängige Stichproben Eingruppen t-Test Kritischer t-Wert hängt ab von … df α Art des Tests (1- vs. 2 seitig) H0 wird ver-worfen, wenn … |temp| > tkrit In SPSS: H0 wird ver-worfen, wenn … p < .05 (2-seitiger Test) p/2 < .05 (1-seitiger Test) 08_ttest(3) 5

Testergebnisse berichten Beim Bericht von Testergebnissen … müssen alle relevanten Informationen vollständig präsentiert werden sollten möglichst wenig unnötige Informationen präsentiert werden. müssen formale Kriterien eingehalten werden Ziele: Übersichtliche Darstellung Es muss nachvollziehbar sein, was wie gerechnet wurde Richtlinien werden von der APA (American Psychological Association) vorgegeben: American Psychological Association (2001). Publication manual of the American Psychological Association (5th ed.). Washington, DC: American Psychological Association. 08_ttest(3) 6

Testergebnisse berichten Aufbau einer psychologischen Arbeit: Titelseite Zusammenfassung 1 Einleitung 2 Methode 3 Ergebnisse 4 Diskussion Literatur Anhang 08_ttest(3) 7

Aufbau einer psychologischen Arbeit Eine Titelseite sollte folgende Informationen enthalten: Titel Autor Datum Adresse / email Veranstaltung Dozent 08_ttest(3) 8

Aufbau einer psychologischen Arbeit Zusammenfassung Länge 100 – 200 Wörter Enthält Fragestellung Hypothesen Ergebnisse 08_ttest(3) 9

Aufbau einer psychologischen Arbeit Einleitung Herleitung der Fragestellung Relevanz der Fragestellung Bisherige Forschungsarbeiten Eigene Hypothesen (inhaltlich formuliert) 08_ttest(3) 10

Aufbau einer psychologischen Arbeit Gliederung des Methodenteils Überblick Stichprobe Design (Versuchsplan) Material Prozedur 08_ttest(3) 11

Aufbau einer psychologischen Arbeit Ergebnisse Ggf. Datenvorbehandlung Transformation von Variablen Ausschluss von Ausreißerwerten Deskriptive Statistiken Testverfahren Welches Verfahren (t-Test) Gewähltes Alphaniveau Testergebnisse Empirischer t-Wert (gerundet aus 2 Nachkommastellen) mit Freiheitsgraden p-Wert (gerundet aus 2 Nachkommastellen) Ein- oder zweiseitiger Test? Ggf. Richtung des Effekts 08_ttest(3) 12

Aufbau einer psychologischen Arbeit Diskussion Zusammenfassung der Ergebnisse Inhaltlich keine Teststatistiken Bedeutung der Ergebnisse diskutieren Haben sich die Hypothesen bestätigt? Falls nein, wie könnte man die Ergebnisse erklären Wie passen die eigenen Ergebnisse zu anderen Studien? Ausblick Lässt die Studie wichtige Fragen offen? Wie könnten Folgestudien aussehen? Haben die Ergebnisse Konsequenzen für die Praxis? 08_ttest(3) 13

Aufbau einer psychologischen Arbeit Literatur Jede Quelle, die im irgendwo im Text zitiert wurde, muss im Literaturverzeichnis aufgeführt werden. Es werden nur Quellen aufgeführt, die auch zitiert wurden. Bei der Zitation MUSS man sich an die APA Richtlinien halten. 08_ttest(3) 14

Aufbau einer psychologischen Arbeit Anhang Psychologische Arbeiten haben eher selten einen Anhang Der Anhang enthält Informationen, die … so umfangreich sind, dass sie die Lesbarkeit des Textes beeinträchtigen z.B. eine Liste aller 60 Adjektive, die in einem Gedächtnisexperiment verwendet wurden z.B. die genauen Instruktionen, die eine Versuchsperson erhält. für die meisten Leser weniger interessant sind z.B. die mathematische Herleitung einer verwendeten Formel 08_ttest(3) 15

Beispiel: „Levels of processing“ Im Folgenden werden kurz einige Ausschnitte zu einer Darstellung des Gedächtnisexperiments gezeigt. Zur Erinnerung: Es wurde getestet, wie verschiedene Verarbeitungsformen sich auf die Anzahl erinnerter Adjektive auswirken Vokale zählen Bildhaftigkeit beurteilen Emotionalität beurteilen 08_ttest(3) 16

Beispiel: „Levels of processing“ Titel der Arbeit Beeinflusst die Verarbeitungstiefe die Gedächtnisleitung? Eine Überprüfung der „Level of processing“ Hypothese Andreas Voß Albert-Ludwigs-Universität Freiburg … 08_ttest(3) 17

Beispiel: „Levels of processing“ Zusammenfassung Bisherige Forschungsarbeiten zeigen, dass die Verarbeitungstiefe von Stimuli in einer Lernphase den späteren Abruf aus dem Gedächtnis beeinflussen. In der vorliegenden Studie soll diese Annahme empirisch überprüft werden. Es wird dabei erwartet, dass emotionale und bildhafte Verarbeitung zu einer besseren Erinnerungsleistung führen als eine rein strukturelle Verarbeitung. Die Ergebnisse einer Studie mit einem unangekündigten Erinnerungstest (free recall) bestätigen diese Hypothese. 08_ttest(3) 18

Beispiel: „Levels of processing“ Einleitung 1 Einleitung Carik und Lockhart (1972) zeigten, sich eine tieferer Verarbeitung positive auf den Gedächtnisabruf auswirkt … In der vorliegenden Arbeit … Dabei wird erwartet dass … 08_ttest(3) 19

Beispiel: „Levels of processing“ Methode 2 Methode 2.1 Stichprobe. An dem vorliegenden Experiment nahmen 77 Psychologiestudierende (64 weiblich) im ersten Studiensemester teil. Das mittlere Alter lag bei 23.4 (SD=6.3; Spanne: 18 bis 48). 2.2 Material. Als Stimulusmaterial für die Gedächtnisaufgabe wurden 60 deutsche Adjektive verwendet (siehe Anhang). 2.3 Design. Der Versuchsplan beinhaltet die Gruppenvariable Verarbeitungsbedingung mit den drei Stufen „strukturell“ (N=23), „emotional“ (N=28) und „bildhaft“ (N=26) (siehe Prozedur für Details). Abhängige Variable ist die Anzahl korrekt erinnerter Wörter minus die Anzahl falsch erinnerter Wörter. 08_ttest(3) 20

Beispiel: „Levels of processing“ Methode (Fortsetzung) 2.4 Prozedur. Der Versuch fand in einer gemeinsamen Sitzung aller Versuchspersonen in einem Hörsaal statt. Dazu wurden die 60 Adjektive nacheinander mittels eines Beamers präsentiert. Jedes Wort wurde drei Sekunden gezeigt und dann ohne Pause direkt durch das nächste Wort ersetzt. Die Versuchspersonen sollten dabei zu jedem Wort eine Angabe in einem Fragebogen machen: Die „strukturelle Aufgabe bestand darin, die Anzahl der Vokale jedes Adjektivs zu notieren. In den anderen Gruppen wurde die Bildhaftigkeit bzw. die Emotionalität der Adjektive auf einer Skala von 1 bis 5 eingeschätzt. 08_ttest(3) 21

Beispiel: „Levels of processing“ Methode (Fortsetzung) … Nach der Lernphase wurde ein Fragebogen, der nicht mit der aktuellen Studie im Zusammenhang steht ausgefüllt. Nach fünf Minuten wurden alle Teilnehmer aufgefordert, alle Wörter der Lernphase, an die sie sich erinnerten, zu notieren. Dafür standen 10 Minuten zur Verfügung. In einer Nachbefragung äußerte eine Probandin, dass sie mit dem Gedächtnistest gerechnet hatte. 08_ttest(3) 22

Beispiel: „Levels of processing“ Ergebnisse Erläuterungen: M = Mittelwert; SD = Standardabweichung Als Dezimaltrenner wird immer der Punkt verwendet 3 Ergebnisse Für jede Versuchsperon wurde die Gedächtnisleitung als Anzahl der notierten Wörter, die in der Lernliste enthalten waren, minus die Anzahl der notierten Wörter, die nicht enthalten waren, berechnet (M=9.18; SD=5.52). 08_ttest(3) 23

Beispiel: „Levels of processing“ Ergebnisse (Fortsetzung) … Die mittelere Gedächtnisleistung der Gruppen wurde mit t-Tests für unabhängige Stichproben verglichen. Für alle Tests wurde ein Alphaniveau von α=.05 angenommen. Es zeigten sich bessere Gedächtnisleitungen sowohl bei emotionaler Verarbeitung (M=9.82; SD=5.40) als auch bei bildhafter Verarbeitung (M=11.96; SD=4.94) im Vergleich zur strukturellen Verarbeitung (M=5.26; SD=4.02), mit t(49)=3.37; p<.01 bzw. t(47)=5.16; p<.001. Der Unterschied von emotionaler Verarbeitung und bildhafter Verarbeitung erreichte keine statistische Bedeutsamkeit, t(52)=1.52; p<.14. 08_ttest(3) 24

Beispiel: „Levels of processing“ Hinweise zum Ergebnisteil: Bei mehr als 2 Gruppen sollte statt den t-Test besser die Varianzanalyse verwendet werden. Die lernen wir im Sommersemester kennen. Die Teststatistiken können wie im vorliegenden Beispiel (durch ein Komma getrennt) an den Text angehängt werden. Oder man berichtet die Testergebnsisse in einer Klammer am Ende des Satzes: „Der Unterschied von emotionaler Verarbeitung und bildhafter Verarbeitung erreichte keine statistische Bedeutsamkeit (t(52)=1.52; p<.14).“ t- und p-Werte werden immer mit zwei Nachkommastellen angegeben. Bei p wird die Null vor dem Komma weggelassen. 08_ttest(3) 25

Beispiel: „Levels of processing“ Hinweise zum Ergebnisteil: Üblicherweise wird bei signifikanten Ergebnissen immer nur das Signifikanzniveau angegeben: p<.05 („signifikant“) p<.01 („hoch signifikant“) p<.001 („hoch signifikant“) Bei einem nicht-signifikanten Ergebnis wird häufig der exakte p-Wert angegeben. Alternativ kann auch n.s. (nicht signifikant ) geschrieben werden: „Der Unterschied von emotionaler Verarbeitung und bildhafter Verarbeitung erreichte keine statistische Bedeutsamkeit, t(52)=1.52; n.s.“ Ausnahme: Bei t-Werten kleiner 1 dürfen Freiheitsgrade und p-Werte ganz weggelassen werden (weil t<1 nie signifikant ist). „Männer und Frauen unterscheiden sich nicht in Ihrer Einstellung zur Statistik, t<1“. 08_ttest(3) 26

Beispiel: „Levels of processing“ Diskussion 4 Diskussion In der vorliegenden Studie wurde die Annahme des „Levels of Processing“ Ansatzes überprüft. Entsprecht der Hypothesen zeigte sich, dass eine rein strukturelle Verarbeitung (Vokale zählen) zu einer schlechteren Erinnerungsleistung führt als eine semantische Bearbeitung (Emotionalität oder Bildhaftigkeit einschätzen). Diese Befunde haben praktische Konsequenzen für Lernsituationen. Auch in Alltagssituationen ist eine tiefe Verarbeitung von Lernstoff empfehlenswert. … Kritisch anzumerken ist an der vorliegenden Studie, dass eine wenig kontrollierte Massentestung vorgenommen wurde. Es wäre daher empfehlenswert, diese Befunde in einer Laborsituation mit Einzeltestungen zu replizieren. 08_ttest(3) 27

Beispiel: „Levels of processing“ Literatur Hinweise: Nachname, Vorname (Nur Initialen) Jahreszahl in Klammern Titel des Aufsatzes Titel der Zeitschrift (kursiv) Band der Zeitschrift (Kursiv) Seitenzahlen des Aufsatzes Literatur Craik, F. I. M., & Lockhart, R. S. (1972). Levels of processing: A framework for memory research. Journal of Verbal Learning and Verbal Behavior, 11, 671-684. 08_ttest(3) 28

APA Richtlinien American Psychological Association (2001). Publication manual of the American Psychological Association (5th ed.). Washington, DC: American Psychological Association. 08_ttest(3) 29

Effektstärke (beim t-Test für unabhängige Stichproben) Wenn ein signifikanter Gruppenunterschied gefunden wurde, sollte ein Standardisiertes Maß für die Größe dieses Effektes, also die Effektstärke, berechnet werden. Dabei wird nicht nur der Mittelwertsunterschied sondern auch die Varianz des Merkmals berücksichtigt. 08_ttest(3) 30

Nach Cohen (1988) teilt man die Effektstärke folgendermaßen ein: d ≥ .20: kleiner Effekt d ≥ .50: mittlerer Effekt d ≥ .80: großer Effekt 08_ttest(3) 31

Beispiel 1 „Levels of Processing“ Effektstärke Beispiel 1 „Levels of Processing“ Emotional: M=10 Strukturell: M=5 σ= 4.5 Beispiel 2 „Levels of Processing“ Bildhaft: M=12 σ= 5.0 08_ttest(3) 32

In der Population gilt die Teststärke Teststärke Die Teststärke ist die Wahrscheinlichkeit, einen in der Population vorhanden Effekt in einer statistischen Untersuchung zu finden: Teststärke = p(sig. | H1). Damit ist die Teststärke ein „Gegenstück“ zum β-Fehler: Teststärke = 1-β. In der Population gilt die Testergebnis Ent-scheidung H0 H1 p > α „H0“ (1-α) β p < α „H1 “ α (1-β) 08_ttest(3) 33

Teststärke Die Teststärke ist also die Wahrscheinlichkeit, einen tatsächlich existierenden Effekt mit einer empirischen Untersuchung auch zu finden. Jede Untersuchung sollte eine hohe Teststärke haben (also einen kleinen β-Fehler)! Der β-Fehler kann allerdings nicht einfach festgelegt werden. Im Folgenden werden verschiedene Einflussgrößen auf β-Fehler und Teststärke dargestellt. 08_ttest(3) 34

Beeinflussung der Teststärke (Power) Höhe des Alpha-Niveaus Je größer (weniger streng) Alpha, desto größer die Teststärke (1-Beta)! H0 H1 08_ttest(3) 35

Beeinflussung der Teststärke (Power) (2) Art der Testung: Die Teststärke hängt von der Art der Testung (einseitig- vs. zweiseitig) ab: Bei einer zweiseitigen Testung ist die Power geringer als bei einer einseitigen Testung, da dann erst bei einem höheren t-Wert die H1 angenommen wird. 08_ttest(3) 36

Beeinflussung der Teststärke (Power) (3) Varianz des Merkmals Je mehr Varianz ein Merkmal hat, desto geringer ist die Teststärke. Durch Verwendung von „homogenen Stichproben“ und / oder die Entfernung von „Ausreißern“ aus einer Stichprobe verringert sich die Varianz; damit wird es wahrscheinlicher, einen Effekt nachweisen zu können. Zudem sollte versucht werden, während einer Untersuchung externe Einflüsse konstant zu halten, um die „Fehlervarianz“ zu verringern 08_ttest(3) 37

Beeinflussung der Teststärke (Power) Bei geringerer Varianz des Merkmals wird der Standardfehler der Mittelwertsdifferenz geringer und die Test-stärke wird größer! 08_ttest(3) 38

Beeinflussung der Teststärke (Power) (4) Stichprobenumfang Je größer die Stichprobe, desto höher ist die Power eines Tests. Diese liegt daran, dass sich … … der Standardfehler verringert und dadurch der empirische t-Wert vergrößert. … die Freiheitsgrade erhöhen und dadurch der kritische t-Wert verringert. 08_ttest(3) 39

Beeinflussung der Teststärke (Power) (5) Größe der Mittelwertsdifferenz Je größer die Mittelwertsdifferenz, desto höher ist die Power eines Tests. Werden nur geringe Mittelwertsdifferenzen erwartet, dann müssen andere Mittel eingesetzt werden, um die Teststärke zu erhöhen. 08_ttest(3) 40

Beeinflussung der Teststärke (Power) (6) Auswahl des statistischen Tests Stichprobe: Tests mit abhängigen Stichproben haben eine höhere Power als Tests mit unabhängigen Stichproben. Vorannahmen Parameterische Test (die eine Normalverteilung des Merkmals voraussetzen) haben eine höhere Power als non-parameterische Tests. Skalenniveau: Tests, die auf einem höherem Skalenniveau beruhen, haben in der Regel eine höhere Power t-Test (intervall) > U-Test (ordinal) > Binomial-Test (nominal) 08_ttest(3) 41

Bestimmung der Teststärke (Power) Die tatsächliche Teststärke kann aus der Effektstärke, der Stichprobengröße und dem α-Fehler berechnet werden Die macht z.B. das kostenlosen Programm „ G*Power 3“. Beispiele für die Teststärke des t-Test sfür unabhängige Stichproben für d = .80 und α = .05: N1 = N2 Power 23 .76 24 .77 25 .79 26 .81 08_ttest(3) 42

Optimale Stichprobengrößen Von einem optimalen Stichprobenumfang spricht man, wenn die Power groß genug ist, um für eine vorgegebene Effektstärke sicher zwischen der H0 und der H1 entscheiden zu können. Wenn man vor einer Untersuchung schon weiß, wie groß ein zu erwartender Effekt ist, dann kann a priori die optimale Stichprobengröße errechnet werden Dies geschieht ebenfalls mit „G*Power 3“ 08_ttest(3) 43

Optimale Stichprobengrößen Beispiele für optimalen Stichprobenumfänge beim t-Test für unabhängige Stichproben für α = .05 und β = .20 d N1 = N2 .20 310 .30 138 .40 78 .50 50 .60 37 .70 26 .80 20 08_ttest(3) 44

Das Programm „ G*Power 3“ erlaubt die Berechnung der Teststärke. Es ist kostenlos verfügbar unter: http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3/ Berechnungsarten: A priori: Die Effektstärke, Alpha und die Teststärke werden eingegeben und der benötigte Stichprobenumfang wird berechnet. Post-Hoc: Die Effektstärke, Alpha und der Stichprobenumfang wird eingegeben und die Teststärke wird berechnet. 08_ttest(3) 45

A priori - Analyse t-Test für unabhängige Stichproben 2-seitiger Test N1=N2 08_ttest(3) 46

A priori - Analyse t-Test für unabhängige Stichproben 1-seitiger Test N1=N2 08_ttest(3) 47

A priori - Analyse t-Test für abhängige Stichproben 2-seitiger Test

A priori - Analyse t-Test für unabhängige Stichproben 2-seitiger Test N1=N2 08_ttest(3) 49

A priori - Analyse t-Test für unabhängige Stichproben 2-seitiger Test N1=N2 08_ttest(3) 50

post-hoc - Analyse t-Test für unabhängige Stichproben 2-seitiger Test

Es werden drei Arten des t-Test unterschieden: Zusammenfassung Es werden drei Arten des t-Test unterschieden: t-Test für unabhängige Stichproben t-Test für abhängige Stichproben Eingruppen t-Test Die Test unterscheiden sich in den Kennwerten den Standardfehlern der Kennwerte den Freiheitsgraden Alles andere ist weitgehend identisch 08_ttest(3) 52

Zusammenfassung Die Effektstärke (des t-Tests für unabhängige Stichproben) ist die Mittelwertsdifferenz relativiert an der gemeinsamen Merkmalsvarianz. Nach Cohen unterschiedet man kleine Effekte (d ≥ .20), mittlere Effekte (d ≥ .50), und große Effekte (d ≥ .80). Die Teststärke Power (1-β) ist die Wahrscheinlichkeit, einen tatsächlich existierenden Effekt zu finden. 08_ttest(3) 53

Die Teststärke ist groß, wenn … Zusammenfassung Die Teststärke ist groß, wenn … ein hoher α-Fehler akzeptiert wird, eine gerichtete Hypothese formuliert wird, die Merkmalsvarianz verringert wird, der Stichprobenumfang erhöht wird, für eine große Mittelwertsdifferenz gesorgt wird, abhängige Stichproben verwendet werden, ein statistisches Verfahren verwendet wird, dass das erhobene Skalenniveau ausnutzt. 08_ttest(3) 54

Beide Berechnungen können mit G*Power 3 durchgeführt werden. Zusammenfassung Die tatsächliche Teststärke kann post-hoc aus der Effektstärke, der Stichprobengröße und dem α-Fehler berechnet werden. Umgekehrt kann die optimale Stichprobengröße aus der a priori festgelegten Teststärke, dem α-Fehler und der erwarteten Effektstärke berechnet. Beide Berechnungen können mit G*Power 3 durchgeführt werden. 08_ttest(3) 55