Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 W.-Rechner Folie.

Ähnliche Präsentationen


Präsentation zum Thema: "Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 W.-Rechner Folie."—  Präsentation transkript:

1 Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, W.-Rechner Folie 1 Das war Stochastik 3 Normalverteilung, Standardabweichung, Messwerte Gaußsches Wurzel(n)-Gesetz, Standardfehler Irrtumswahrscheinlichkeit,( P-Wert). The english translation 4 is another file.

2 Seminarplan Stochastik 4 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, W.-Rechner Folie 2 Überblick über Vorgehensweisen der Stochastik: Angabe von Messwerten Gauß-Test mit Messwerten Regression, Korrelation Elemente der beschreibenden Statistik, Weitere Verteilungen, Empirisches Forschen The english translation is another file. Stochastik ist der Oberbegriff von beschreibender und beurteilender Statistik und Wahrscheinlichkeitstheorie

3 Mathix hat den Eindruck, sein Messgerät zeige zu kleine Werte an. Er betrachtet einen Vorgang, bei dem bekanntermaßen 20 mA mit sigma=1.6 mA gemessen werden. Er misst xi={18,19,17,18} mA. Zeigt sein Messgerät signifikant andere Werte? Hypothesentest bei Messwerten Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 3 Velangt sind die Elemente der folgenden Seite

4 Hypothesentest bei Messwerten Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 4 Der Test ist links-einseitig, weil er vor der Messung zu kleine Werte vermutet hat. Mittelwert grün:Verteilung der Einzelwerte Dieser Wert heißt Standardfehler Ist der Mittelwert in kritischen Gebiet muss man H1 annehmen und H0 verwerfen. Verteilung sol- cher Mittelwerte Messprotokoll Beibehaltungsbereich für H0 Ist der Mittelwert im Beibehaltungsbereich von H0, ist nichts bewiesen.

5 Regression, Ausgleichsgerade Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 5 Gegeben sind Messpunkte. Das Ziel ist, eine beste Gerade durch die Punkt- wolke zu finden. Gezeigt sind in Braun die Fehlerquadrate, auch Residuen- quadrate. In Blau ist deren Summe links gezeigt. Sie muss minimal sein.

6 Regression, Regeressionsgerade Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 6 in Optimierung S. 208 ff und Stochastik S. 259 Es gibt zwei Parameter für die Gerade, m und k. Also ist die Summe der Fehler- quadrate eine Funktion von zwei Variablen, gezeigt als 3D-Raumfläche. Ihr Minimalpunkt (m,k) ist das Ziel. Oft ist es möglich, eine Ausgleichsgerade nach Augenmaß zu finden. Andere Regressionskurven sind möglich. In Excel und GeoGebra werden die Ausgleichskurven Trendlinien genannt. Hiermit kann man exakte Polynome n-Grades durch n+1 Punkte legen.

7 Regressionsgerade, Ausgleichs-, Trendlinie Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 7 Links sind die x- und y-Varianz und die gemischte Varianz zu sehen. Die Parabeln hier sind die aus der 3D-Sicht, nun aber in derselben Ebene dargestellt.

8 Regression, Korrelationskoeffizient Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 8 r = 0.974r = 0.674r = starke Korrelation schwache Korrelation starke Korrelation

9 Beschreibende Statistik falsche Darstellungen Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 9 Arbeitslohn von Männern und Frauen Stochastik S. 258 Bild b) ist falsch, weil die y-Achse bei 1500€ beginnt. So werden erscheint das Einkommens- verhältnis kleiner als es in Wahrheit ist. Bild c) ist falsch, weil man die Größe des Ein- kommens der Frauen nicht erkennen kann. Diese Darstellung wäre allenfalls sinnvoll, wenn es um das Familieneinkommen bei zwei Verdienern ginge.

10 Beschreibende Statistik falsche Darstellungen Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 10 Arbeitslohn von Männern und Frauen Werte wie oben d) Hier ist die dritte Wurzel aus den Werten von a) berechnet. Wenn der Lohn in Euromünzen vorläge, hätten die Würfel exakt. Durch den perspektivischen Effekt, wird die Information verschleiert. Das Bild ist richtig, aber die Nutzer von Excel machen das nicht so. Bild e) ist falsch, da Excel dazu verleitet, die Löhne aus a) als Kantenlängen zu nehmen. Die so gezeigten Volumina werden falsch. Überlege: Ein Würfel mit der halben Kanten- länge hat nur ein Achtel das Volumens. Bild e) ist aus demselben Grund falsch. Für die Ikosaeder ist der Effekt noch deutlicher.

11 Vierfeldertafeln Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 11 nicht für die Klausur Wenn das Verhältnis, dann sind auch die anderen passsenden Verhältnisse fast gleich. Dann sind die Gruppen bezüglich E nicht unterscheidbar. Nullhypothese H0: Die Gruppen bezüglich E nicht unterscheidbar. Forschungshypothese H1: B hat deutlich weiniger E (entspr. oben)

12 Vierfeldertafeln Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 12 Beispiel A sind die Studis, die die Aufgaben machen, B diejenigen, die die Klausur bestehen. nicht für die Klausur

13 Die W. für ein falsch-positves Erg. ist P(K|T+)=591:721=82%. Mathilde wartet mit Gelassenheit auf weitere Tests. Oft denkt man nicht an die Prävalenz P(K)= Vierfeldertafeln Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 13 Dieses Beispiel hatte ich vorbereitet, musste es dann aber weglassen. Daher ist es nun nicht klausurrelevant. Es ist aber so interessant und wichtig für Lebenspraxis, dass ich es nicht weglassen möchte. Situation: Mathilde geht zur Vorsorgeuntersuchung. Es geht um eine Krankheit K. Der Test fällt positiv aus, T+. Das heißt aber nicht, dass Mathilde die Krankheit wirklich hat. Wie groß ist die Wahrscheinlichkeit, dass sie trotz T+ gesund ist? T+T- K n K Beispiel aus Sachs,Hedderich: Angewandte Statistik, Springer 2006 S. 135 Bekannt ist die Spezifität des Testes, die Wahrscheinlichkeit, dass ein Gesunder doch T- erhält. Das ist P(T-| n K)=94% Damit kann man in dieser Tabelle alle leeren Plätze füllen. Zuerst den freien Platz rechts =9850, dann (n K, T-)= 0.94*9850=9259. Der Rest ergibt sich durch Ergänzungen. Dann kann man die Sensitivität des Testes. T+T- K n K ausrechnen P(T+| K)=130:150=86,7%, die W., dass ein Kranker T+ bekommt. Mit Sensitivität und Spezifität werden richtige Entscheidungen be- schrieben. Mathilde hofft, in dem Feld mit der 591 zu sein, in dem die Gesunden sind, die T+ hatten. nicht für die Klausur

14 Datentypen, Merkmalstypen Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 14 nominal, qualitative Daten ordinal, Rangdaten metrisch, Maßdaten Intervalldaten Verhältnisdaten Maßdaten sind diskret oder stetig Haarfarbe, Religion, Herkunftsland, Familientand.. man kann sie sinnvoll ordnen: Schulnoten, Zustimmumgsgrad, Platzierungen in Wettbewerben, Schwierigkeit von Ski-Abfahrten creditpoints Größen ohne natürlichen Nullpunkt, z.B. Temperatur, „doppelt“ geht nicht Größen mit natürlichem Nullpunkt, die man ins Verhältnis setzen kann. z.B. Masse, Länge, Zeit,, Anzahl Treffer, „doppelt“ ist sinnvoll

15 Benfordverteilung Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 15 Historisches Im Jahre 1881 entdeckte der Mathematiker Simon Newcomb, dass die Seiten einer fünfstelligen Logarithmentafel für die kleine führende Ziffernfolgen wesentlich stärker abgegriffen waren als für große. Newcomb veröffentlichte seine Beobachtung, stellte auch schon eine logarithmische Formel auf, aber seine Arbeit wurde nicht beachtet. Im Jahr 1938 entdeckte der Physiker Frank Benford das Gestetz neu und untermauerte es mit Daten. Er bewies es aber nicht.

16 Benfordverteilung Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 16 Erst 1995 deckte der Mathematik Theodore Hill genaueres auf und bewies auch noch weitere Zusammenhänge. Diese setzte der Mathematiker Mark Negrini in einem Analyseprogramm um, mit dem man die Echtheit von Daten prüfen kann, die „Benford-verteilt“ sein müssten. Dazu gehören vor allem Daten aus exponentiellen zusammenhängen, aber aggregierte Daten, die selbst nicht benford-verteilt sind, folgen der Benford-Verteilung. Auf diese Weise kann man Wirtschafts- und Bankdaten, wissenschaftliche Messdaten u.a. prüfen und Betrug aufdecken.

17 Seminarplan Stochastik 4 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, W.-Rechner Folie 17 Überblick über Vorgehensweisen der Stochastik: Angabe von Messwerten Gauß-Test mit Messwerten Regression, Korrelation Elemente der beschreibenden Statistik, Weitere Verteilungen, Empirisches Forschen Stochastik ist der Oberbegriff von beschreibender und beurteilender Statistik und Wahrscheinlichkeitstheorie

18 Stochastik Vorlesung in vier Teilen im Rahmen von Mathematik für alle, Leuphanasemester Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 18 Ich hoffe, es hat Sie bereichert!


Herunterladen ppt "Seminarplan Stochastik 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 W.-Rechner Folie."

Ähnliche Präsentationen


Google-Anzeigen