Verschiedene Statistik- Programme - verschiedene Ergebnisse bei gleichen Analysen, kann das sein? Autor: Patrick Arnold.

Slides:



Advertisements
Ähnliche Präsentationen
Nora Fenske Bernd Fellinghauer In Kooperation mit Birgit Seebacher
Advertisements

Gliederung Vertrauensintervalle Arten von Hypothesen
Gliederung Unterschied zwischen parametrischen und nicht-parametrischen Testverfahren Abhängige vs. unabhängige Stichprobe Mann-Whithney-U-Test für unabhängige.
„Der Euro: Hart, aber unfair: Die neue Währung als Spielverderber“
Die t-Verteilung (fortgesetzt)
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Der Binomialtest Man habe einen wahren Anteil P.
Fachbereich Maschinenbau und Produktion
Statistische Methoden II
Nachholung der Vorlesung vom Freitag
Vorlesung Die Vorlesung Statistische Methoden II nächste Woche vom 6. Juni ( nächste Woche ) wird auf den 4. Juni (Mittwoch) vorverlegt ! 14 – 16 Zeit:
Nachholung der Vorlesung vom Freitag
Konfidenzintervalle Intervallschätzung
Ab nächster Woche wird die Übungsgruppe Gruppe 2: Henrike Berg Di SR 222 wegen Personalmangel eingestellt.
Die Vorlesung Statistische Methoden II findet am (nächste Woche) wegen der Projektwoche nicht wegen der Projektwoche nicht statt.
SR 222 : Fleischmannstraße 6 SR : Loefflerstraße 70
Vorlesung Die Vorlesung Statistische Methoden II in 2 Wochen vom 6. Juni ( in 2 Wochen ) wird auf den 4. Juni (Mittwoch) vorverlegt ! 14 – 16 Zeit: 14.
Chi-Quadrat-Test auf Unabhängigkeit I
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Die Student- oder t-Verteilung
Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur - statt Vorlesungen -
Statistische Methoden I SS 2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
4. Markov-Ketten 4.1. Übergangsmatrizen
Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.
Klausurtermin (laut Prüfungsamt) Probeklausur Freitag, 13. Juni 2003 statt Vorlesung.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
II. Wahrscheinlichkeitstheorie
III. Induktive Statistik
Extra-SPSS-Kurse Durchführung: Birte Holtfreter Termine Di Mi Mi Ort PC-Pool Loefflerstarße.
Chi-Quadrat-Test auf Unabhängigkeit I Hypothese Ablehnungsbereich.
Approximative Konfidenzintervalle im Bernoulli-Fall II
Test auf Normalverteilung
Chi-Quadrat-Tests. Satz von Karl Pearson I X: Stichprobenvariable, die r > 2 verschieden Werte annehmen kann: Die Verteilung von X ist durch einen Wahrscheinlichkeitsvektor.
Klausur am :00 bis 13:00 Hörsaal Loefflerstraße und Hörsaal Makarenkostraße.
Das wars!.
Einstichproben-Tests
Vorlesung: ANOVA II.
Probleme der Modellspezifikation
Daten auswerten Boxplots
Einführung in die beurteilende Statistik
Vergleich der 3 Arten des t-Tests Testergebnisse berichten
Ausgleichungsrechnung II
Teilnehmer bevorzugen es aufgrund ihrer Leistung namentlich nicht genannt zu werden. Projekt STOCHASTIK.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Chi Quadrat Test Tamara Katschnig.
Ausgleichungsrechnung I
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Die Logistische Gleichung & Die Kepler Gleichungen
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Die t-Verteilung Jonathan Harrington. Standard error of the mean (SE) ist die Standardabweichung von Mittelwerten Ich werfe 5 Würfel und berechne den.
Aufgabenzettel VIII Statistik I © by Ewald Krawitz & Oliver Schattmann.
Die Poisson-Verteilung: Mittelwert und Standardabweichung
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Wiederholung BSP 2.1.
STATISIK LV Nr.: 0028 SS Mai 2005.
Statistische Tests in kleinen Stichproben
Phasen einer empirischen Untersuchung
STATISIK LV Nr.: 1852 WS 2005/ Dezember 2005.
Statistische Tests in kleinen Stichproben
Kapitel 10 Multikollinearität
Automatisierte Worterkennung (Autocorrect) Automatisierung in der Medientechnik, Labor, KulturMediaTechnologie Lucia Winsauer SS14.
Varianzanalyse Teststatistik: F – Test -> vergleich zweier Varianzen -> Grundlage der Varianzanalyse Welche „Varianzen“ werden miteinander verglichen?
Verteilungen, Varianz Tamara Katschnig.
STATISIK LV Nr.: 1375 SS März 2005.
Kooperationstraining im Volleyball. Goethe-Universität Frankfurt am Main Gliederung 1.Einführung 2.Methode 3.Ergebnisse 4.Diskussion
Prüft ebenfalls die Annahme der Varianzhomogenität (exakter)
Auflösung klassischer Geschlechterrollen
Test 1 Test 2 Test 3. Test 4 Test 5 Test 6 Test 7 Test 8 Test 9.
Test.
 Präsentation transkript:

Verschiedene Statistik- Programme - verschiedene Ergebnisse bei gleichen Analysen, kann das sein? Autor: Patrick Arnold

Gliederung 1. Einleitung 1. Einleitung 2. Der Wilcoxon Mann Whitney Test 2. Der Wilcoxon Mann Whitney Test 3. Beispiel für WMW Test 3. Beispiel für WMW Test 4. Spezieller WMW-Test 4. Spezieller WMW-Test 5. Ergebnisse des speziellen WMW-Tests mit verschiedenen Softwarepaketen 5. Ergebnisse des speziellen WMW-Tests mit verschiedenen Softwarepaketen 6. Resümee 6. Resümee 7. Quellen 7. Quellen

1.Einleitung Verschiedene Statistik-Programme - verschiedene Ergebnisse bei gleichen Analysen, kann das sein ? Verschiedene Statistik-Programme - verschiedene Ergebnisse bei gleichen Analysen, kann das sein ? Problem an Hand eines Beispieles erläutern Problem an Hand eines Beispieles erläutern Beispiel, an dem man dieses Problem beobachten kann ist ein statistischer Test Beispiel, an dem man dieses Problem beobachten kann ist ein statistischer Test Wilcoxon-Mann- Whitney Test Wilcoxon-Mann- Whitney Test Diesr Test ist aber noch nicht in der Statistikvorlesung behandelt worden Diesr Test ist aber noch nicht in der Statistikvorlesung behandelt worden

2. Der WMW Test Wird auch U-Test genannt Wird auch U-Test genannt nichtparametrisches statistisches Prüfverfahren zum Vergleich zweier unabhängiger Zufallsvariablen X und Y nichtparametrisches statistisches Prüfverfahren zum Vergleich zweier unabhängiger Zufallsvariablen X und Y Ausgangsdaten bestehen aus zwei voneinander unabhängigen Stichproben Ausgangsdaten bestehen aus zwei voneinander unabhängigen Stichproben U-Test benötigt man nur die Rangplätze U-Test benötigt man nur die Rangplätze

2. Der WMW Test Beide Stichproben werden zusammengelegt Beide Stichproben werden zusammengelegt und dann der Grösse nach geordnet und dann der Grösse nach geordnet jeder Wert einen Rang zugeordnet jeder Wert einen Rang zugeordnet der kleinste Wert bekommt den Rang 1 der kleinste Wert bekommt den Rang 1 Kommt ein Wert mehrfach vor, spricht man von Ties oder auf deutsch von Bindungen Kommt ein Wert mehrfach vor, spricht man von Ties oder auf deutsch von Bindungen

2. Der WMW Test dann erhalten die numerisch gleich grossen Einzelwerte die mittlere Rangzahl dann erhalten die numerisch gleich grossen Einzelwerte die mittlere Rangzahl Stichprobenumfang der ersten Stichprobe <= der der zweiten Stichprobenumfang der ersten Stichprobe <= der der zweiten der U-Test fest, ob die so genannte Dominanzwahrscheinlichkeit: pd:= P(X<=Y) gleich 0,5 ist oder nicht der U-Test fest, ob die so genannte Dominanzwahrscheinlichkeit: pd:= P(X<=Y) gleich 0,5 ist oder nicht

2. Der WMW Test Man unterscheidet beim U-Test noch zwischen der einseitige und der zweiseitige Fragestellung Man unterscheidet beim U-Test noch zwischen der einseitige und der zweiseitige Fragestellung Bei zweiseitiger Fragestellung : Bei zweiseitiger Fragestellung : Dominanzwahrscheinlich keit pd ungleich 0,5 Dominanzwahrscheinlich keit pd ungleich 0,5 Bei der einseitigen Fragestellung : Bei der einseitigen Fragestellung : wird Alternativhypothese so gewählt das die Dominanzwahrscheinlich- keit entweder größer oder kleiner als 0,5 ist wird Alternativhypothese so gewählt das die Dominanzwahrscheinlich- keit entweder größer oder kleiner als 0,5 ist

2. Der WMW Test U-Test ist besonders geeignet, Unterschiede in der zentralen Tendenz aufzufinden U-Test ist besonders geeignet, Unterschiede in der zentralen Tendenz aufzufinden brauchbare Alternative zum t-Test brauchbare Alternative zum t-Test kann auch eingesetzt werden, wenn die Daten nicht intervall- bzw. verhältnisskaliert sind kann auch eingesetzt werden, wenn die Daten nicht intervall- bzw. verhältnisskaliert sind

2. Der WMW Test Zusammenfassend: wir brauchen zwei voneinander unabhängige Stichproben mit ähnlicher bis gleicher Verteilungsform, die wir miteinander vergleichen und deren Rangfolge aufstellen!

3. Beispiel für WMW Test

4. Spezieller WMW-Test Test in verschiedenen Statistikprogrammen durchführen Test in verschiedenen Statistikprogrammen durchführen Mit Spezialfall von so einen WMW Test Mit Spezialfall von so einen WMW Test Der so genannten ROTATROD Test Der so genannten ROTATROD Test Testet Verhalten von Ratten Testet Verhalten von Ratten Rotarod Apparatur besteht aus einem rotierenden Zylinder Rotarod Apparatur besteht aus einem rotierenden Zylinder Besteht aus vier möglichen Positionen Besteht aus vier möglichen Positionen

4. Spezieller WMW-Test Zylinder rotiert mit 12 Umdrehungen pro Minute Zylinder rotiert mit 12 Umdrehungen pro Minute Ratten wurden einzeln auf den Zylinder gesetzt Ratten wurden einzeln auf den Zylinder gesetzt Zeit, wie lange sich so eine Ratte auf dem Zylinder aufhält wird gemessen Zeit, wie lange sich so eine Ratte auf dem Zylinder aufhält wird gemessen Jedoch maximal Zeit die Ratten auf dem Zylinder sitzen 300s Jedoch maximal Zeit die Ratten auf dem Zylinder sitzen 300s Sitzt Ratte länger wie 300s, trotzdem nur 300 s angerechnet Sitzt Ratte länger wie 300s, trotzdem nur 300 s angerechnet 2 Gruppen von jeweils 12 Ratten getestet 2 Gruppen von jeweils 12 Ratten getestet Die gemessenen Werte sind in der folgenden Tabelle zu sehen Die gemessenen Werte sind in der folgenden Tabelle zu sehen

Time (sec) Rank Rank

4. Spezieller WMW-Test Den Ratten aus Gruppe 1, der control group, wurde Saline verabreicht und den anderen Ratten aus der 2 Gruppe, der treatment group, wurde ein Muskel Präparat oral verabreicht. Den Ratten aus Gruppe 1, der control group, wurde Saline verabreicht und den anderen Ratten aus der 2 Gruppe, der treatment group, wurde ein Muskel Präparat oral verabreicht.

5. Ergebnisse des speziellen WMW-Tests mit verschiedenen Softwarepaketen Die genauen, per Hand berechneten Werte sind: Die genauen, per Hand berechneten Werte sind: ohne Korrektur: z= p = ohne Korrektur: z= p = mit Korrektur für Normalverteilung: z = mit Korrektur für Normalverteilung: z = p = p = mit Korrektur für Bindungen: z = p = mit Korrektur für Bindungen: z = p = mit Korrektur für Bindungen und Normalverteilung: mit Korrektur für Bindungen und Normalverteilung: z = p = z = p =

Eingeben der gemessenen Werte in ein Statistikprogramm und den U-Test durchführen Eingeben der gemessenen Werte in ein Statistikprogramm und den U-Test durchführen falls er in der Software implementiert falls er in der Software implementiert Statistiksoftware liefert ein Ergebnis Statistiksoftware liefert ein Ergebnis Nimmt man sich nun ein anderes Statistikprogramm und gibt dieselben Werte wie eben ein, passiert es in der Regel, dass ein leicht unterschiedliches Ergebnis heraus kommt Nimmt man sich nun ein anderes Statistikprogramm und gibt dieselben Werte wie eben ein, passiert es in der Regel, dass ein leicht unterschiedliches Ergebnis heraus kommt

5. Ergebnisse des speziellen WMW-Tests mit verschiedenen Softwarepaketen SigmaStat : SigmaStat : Mediane der beiden Stichproben werden angegeben und p = 0.85 Mediane der beiden Stichproben werden angegeben und p = 0.85 SigmaStat liefert noch einen Satz indem steht das es keine signifikante Differenz in den beiden Stichproben gibt SigmaStat liefert noch einen Satz indem steht das es keine signifikante Differenz in den beiden Stichproben gibt SYSSTAT: SYSSTAT: Rangsummen für jede Stichprobe angegeben, der kritische Wert U, hier ist U = 42 und die dementsprechende Wahrscheinlichkeit p = Rangsummen für jede Stichprobe angegeben, der kritische Wert U, hier ist U = 42 und die dementsprechende Wahrscheinlichkeit p = In Anleitung findet man nicht wie Programm rechnet, ob mit oder ohne Ties In Anleitung findet man nicht wie Programm rechnet, ob mit oder ohne Ties

5. Ergebnisse des speziellen WMW-Tests mit verschiedenen Softwarepaketen S-Plus: S-Plus: am Anfang kann man auswählen wie der Test berechnet werden soll, ob mit continuity correction oder Use exact Ditibution. am Anfang kann man auswählen wie der Test berechnet werden soll, ob mit continuity correction oder Use exact Ditibution. continuity correction ausgewählt, zeigt es in der Ausgabe z = und p = an, Ergebnis ohne die Korrekturen continuity correction ausgewählt, zeigt es in der Ausgabe z = und p = an, Ergebnis ohne die Korrekturen Mit Korrektur ist z = und p = Mit Korrektur ist z = und p =

5. Ergebnisse des speziellen WMW-Tests mit verschiedenen Softwarepaketen STATISTICA: STATISTICA: das Programm anzeigt sind wieder z und p mit z = und p = das Programm anzeigt sind wieder z und p mit z = und p = ein adjusted z wird angezeigt mit z = und p = ein adjusted z wird angezeigt mit z = und p = wird noch ein exact p ausgegeben mit p = wird noch ein exact p ausgegeben mit p =

5. Ergebnisse des speziellen WMW-Tests mit verschiedenen Softwarepaketen SPSS: SPSS: hier werden wieder verschiedene z und p Werte ausgegeben hier werden wieder verschiedene z und p Werte ausgegeben Ergebnisse sind wieder ähnlich wie bei allen anderen Programmen Ergebnisse sind wieder ähnlich wie bei allen anderen Programmen es stimmen ein paar Werte mit den exakten überein es stimmen ein paar Werte mit den exakten überein

6. Resümee Test zeigt dass man sich doch nicht immer 100% auf die Ergebnisse verlassen kann die ein solches Statistikprogramm ausgibt Test zeigt dass man sich doch nicht immer 100% auf die Ergebnisse verlassen kann die ein solches Statistikprogramm ausgibt Oft Ergebnisse nicht falsch, sondern nicht ausreichend beschrieben und es stehen dann zum Beispiel 3 verschiedene Werte für p oder z da und man weiss gar nicht welches jetzt für einen das richtige ist Oft Ergebnisse nicht falsch, sondern nicht ausreichend beschrieben und es stehen dann zum Beispiel 3 verschiedene Werte für p oder z da und man weiss gar nicht welches jetzt für einen das richtige ist

6. Resümee Wenn Zahlenwerte von einander abweichen, liegt das an Rundungsfehlern oder daran das sich jemand von den Programmierern gedacht hat das er die Formeln die dieser Test benötigt etwas verbessern kann. Das Problem an der Sache ist dann bloß, das nirgends beschrieben wird mit welchen Formeln der Test berechnet wird Wenn Zahlenwerte von einander abweichen, liegt das an Rundungsfehlern oder daran das sich jemand von den Programmierern gedacht hat das er die Formeln die dieser Test benötigt etwas verbessern kann. Das Problem an der Sache ist dann bloß, das nirgends beschrieben wird mit welchen Formeln der Test berechnet wird Quellcode ist nie frei zugänglich Quellcode ist nie frei zugänglich

7. Quellen Hartung: Statistik 13.Auflage Hartung: Statistik 13.Auflage Lothar Sachs: Angewandte Statistik Lothar Sachs: Angewandte Statistik Zeitungsartikel aus The American Statistican vom Februar 2000 Zeitungsartikel aus The American Statistican vom Februar 2000 Internet (Homepages andere Universitäten) Internet (Homepages andere Universitäten)