Achtung Vorlesung am nächsten Montag (21. Juni) Zeit: Uhr Ort: Kiste
TESTS
Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe) Entscheidung Vorgabe: Irrtumswahrscheinlichkeit Formulierung einer HypotheseNullhypothese In der Statistik kann man nie ganz sicher sein. Die Irrtumswahrscheinlichkeit sollte wenigstens klein sein.
Mathematischer Rahmen I TESTS Statistische Struktur Testproblem (Hypothese)Nullhypothese Gegeben sind: Stetiger Fall Diskreter Fall Niveau
Mathematischer Rahmen II TESTS Test Test gegeben durch: Ablehnungsbereich Teilmenge der Grundgesamtheit : Menge aller Beobachtungen, die zur Ablehnung der Hypothese führen
Mathematischer Rahmen III TESTS Beobachtung (Stichprobe) Entweder Oder Beobachtung liegt im Annahmebereich Beobachtung liegt im Ablehnungsbereich Hypothese annehmen! Hypothese ablehnen!
Fehler erster und zweiter Art
Hypotheseakzeptiert Hypothese abgelehnt Hypothesewahr Hypothese falschEntscheidungRealität Fehler 1. Art Fehler 2. Art
Niveau und Macht Obere Grenze für die Wahrscheinlichkeit, Fehler 1. Art einen Fehler 1. Art zu begehen Niveau Wahrscheinlichkeit, keinenFehler 2. Art keinen Fehler 2. Art zu begehen, wenn der wahre Parameterwert in dem Punkt liegt Macht Macht in einem Punkt der Alternative
Test für den Erwartungswert Varianz bekannt Fall Normalverteilung
Test für den Erwartungswert Varianz unbekannt Fall Normalverteilung
Chi-Quadrat-Tests
Satz von Karl Pearson I X: Stichprobenvariable, die r > 2 verschieden Werte annehmen kann: Die Verteilung von X ist durch einen Wahrscheinlichkeitsvektor gegeben. Stichprobe vom Umfang n:
Satz von Karl Pearson II Dann hat man: Dabei ist:
Chi-Quadrat-Test auf Anpassung Hypothese Ablehnungsbereich
Fairer Würfel? Hypothese verwerfen!
Bakterielle Infektion durch Stämme I, II, III Lehrmeinung Konkrete Stichprobe (80 Infektionen) Typ Prozentsatz IIIIII Anzahl IIIIII Typ
Chi-Quadrat-Verteilung 0,831
Mendelsche Gesetze rund und gelb runzelig runzelig und gelb rund und grün runzelig runzelig und grün Prozentsätze nach der Theorie
rund und gelb runzelig runzelig und gelb rund und grün runzelig runzelig und grün Beobachtete Häufigkeiten Summe 480
Chi-Quadrat-Verteilung 0,831
Krankmeldungen Wochentag Mo Di Mi Do Fr n Anzahl Krankmeldungen
Chi-Quadrat-Verteilung 0,831
Test auf Normalverteilung Umsetzung in einen Chi-Quadrat-Test auf Anpassung Beispiel Mieten
1 3534
Tafel für die Verteilungsfunktion bei Normalverteilung
1,2,3 4,5 6,7 8,9 Klasse 1: Klasse 2: Klasse 3: Klasse 4: Klasse 5: Klasse 6: Wir fassen die Klassen 10,11 und 12, 13, 14 jeweils zu einer Klasse zusammen und erhalten so 6 Klassen:
Leichte Abschwächung der Faustregel für den Chi-Quadrat-Test auf Anpassung (vgl. Fahrmeier/Künstler/Pigeot/Tutz) für alle Indizes k für 80% der Indizes k
Chi-Quadrat-Verteilung 0,831
Chi-Quadrat-Test auf Unabhängigkeit I
Chi-Quadrat-Test auf Unabhängigkeit II Hypothese Ablehnungsbereich
Chi-Quadrat-Test auf Unabhängigkeit III
Berufsstatus Vater - Sohn 38 X Y
Chi-Quadrat-Verteilung 0,831
Konkurrierende Computer-Unternehmen
Chi-Quadrat-Verteilung 0,831
Sonntagsfrage (Fahrmeir/Künstler/Pigeot/Tutz) Die Ergebnisse der Sonntagsfrage: Welche Partei würden Sie wählen, wenn am nächsten Sonntag Bundestagswahlen wären? sind für den Be- fragungszeitraum in der folgenden Tabelle wiedergegeben:
Das Untersuchungsziel ist festzustellen, ob die voneinander abweichenden Häufigkeiten für Männer und Frauen rein zufällige Schwankungen Darstellen oder ob zwischen Geschlecht und Partei- präferenz ein Zusammenhang besteht. Nullhypothese: Zwischen Geschlecht und Parteipräferenz besteht kein Zusammenhang
Chi-Quadrat-Test auf Unabhängigkeit zum Niveau = 0.05
Chi-Quadrat-Verteilung 0,831
Chi-Quadrat-Test auf Homogenität Hypothese Ablehnungsbereich
Mathe-Test Klasse 9 1. Versuch
Produktion zweier Betriebe
Chi-Quadrat-Verteilung 0,831
Zusammenhang zwischen Geschlecht und Schulbildung
Chi-Quadrat-Verteilung 0,831
Chi-Quadrat-Verteilung 0,831
Mathe-Test Klasse 9 2. Versuch
Chi-Quadrat-Verteilung 0,831
KREDITWÜRDIGKEIT Eine Bank steht vor dem Problem, einen potentiellen Kreditnehmer einzuschätzen und den Kredit zu vergeben, oder ihn der Klasse der Problemfälle zuzuordnen und auf das Kreditgeschäft zu verzichten bzw.eine genauere Prüfung vorzunehmen. Gesucht wird ein Prädikator für die Kreditwürdigkeit. Hierzu werden 1000 Konsumentenkredite betrachtet. Für jeden Kunden aus dieser Stichprobe ist seine Kredit- würdigkeit X bekannt. Als weiteres Merkmal Y wird notiert, ob der Kunde ein laufendes Konto bei der Bank unterhält und, wenn ja, ob es gut oder mittel geführt wird. (Fahrmeir/Künstler/Pigeot/Tutz)
Kreditwürdigkeit Merkmal X: Kreditwürdigkeit Konto Merkmal Y: Konto Wertungen kein Konto gut geführt mittel gut geführt
Chi-Quadrat-Verteilung 0,831
Chi-Quadrat-Test auf Homogenität zum Niveau = 0.05 Nullhypothese: Verteilung auf die Kategorien des Merkmals Konto ist für unproblematische Kreditnehmer und für Problemkunden gleich
Sonntagsfrage (Fahrmeir/Künstler/Pigeot/Tutz) Die Ergebnisse der Sonntagsfrage: Welche Partei würden Sie wählen, wenn am nächsten Sonntag Bundestagswahlen wären? sind für den Be- fragungszeitraum in der folgenden Tabelle wiedergegeben:
Chi-Quadrat-Tests Übersicht
Faustregeln Chi-Quadrat-Tests Test auf Anpassung Test auf Unabhängigkeit Test auf Homogenität