Seminarplan Stochastik 3

Slides:



Advertisements
Ähnliche Präsentationen
Stochastik und Markovketten
Advertisements

Klausur „Mathematik für alle“
Wie wir in „Mathematik für alle“ die Welt der Mathematik sehen
WR + WS ZEIGEN Neues aus der Mathematik.
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Stochastik in der Sek. II Sabrina Schultze.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Dynamische Mathematik
Dynamische Mathematik
So sieht ein Protokoll aus:
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Mehrfachregressionen
Hypothesen testen: Grundidee
Statistische Methoden II
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Konfidenzintervalle Intervallschätzung
Bitte mein Manuskript (liegt im Bibliotheksgebäude aus) nicht nach Außerhalb tragen. Die Weitergabe an Dritte (d. h. an Personen, die nicht Hörer der Vorlesung.
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Die Student- oder t-Verteilung
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,
Mögliche Funktionenklassen
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Klausurtermin (laut Prüfungsamt) Probeklausur Freitag, 13. Juni 2003 statt Vorlesung.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Wahrscheinlichkeitsräume. A. N. Kolmogorov Kolmogorov wurde (mehr zufällig, seine Mutter war auf der Durchreise) in Tambov, Russland, geboren.
Datenmatrix.
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.
Datentabelle für 2 Merkmale
Sportwissenschaftliche Forschungsmethoden SS Statistischer Test.
Tutorium Willkommen zurück, in der wunderbaren Welt der Statistik Teil II.
Tutorium
Unser neuntes Tutorium
(Gini-Koeffizient, Lorenz-Kurve)
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Wiederholung und Beispiele
Vorlesung: ANOVA I
Eigenschaften der OLS-Schätzer
Multikollinearität Wann spricht man von Multikollinearität?
Histogramm/empirische Verteilung Verteilungen
Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Folie 1 GeoGebra ohne Ende Mathematik Interaktive Erkundungen Visualisierungen.
Einführung in die beurteilende Statistik
Ausgleichungsrechnung I
Chi Quadrat Test Tamara Katschnig.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Die Poisson-Verteilung: Mittelwert und Standardabweichung
Lineare Algebra, Teil 2 Abbildungen
Wahrscheinlichkeitsrechnung
Statistik – Regression - Korrelation
Mathematik Sek II Möglichkeiten mit GeoGebra
Arzt-Patienten-Beziehung
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
Mathematik für BiologInnen WS 05
setzt Linearität des Zusammenhangs voraus
Binärbäume.
Geoinformationssysteme
Mathematik Leuphanasemester im Modul Fächerübergreifende Methoden Organisatorisches Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015
Programmiersprachen II Fortsetzung Datenstrukturen Balancierte Bäume 3 Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Funktionen als zentrales Werkzeug
Polynome und mehrfache Nullstellen
Optimierung als Ziel Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg,
Wie wir in „Mathematik für alle“ die Welt der Mathematik sehen
1 Codierung Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, Haydn: Streichquartett op 54.3 aus Largo,
Lineare Optimierung Nakkiye Günay, Jennifer Kalywas & Corina Unger Jetzt erkläre ich euch die einzelnen Schritte und gebe Tipps!
TEIL 2: GeóGebra als umfassendes didaktisches Werkzeug
HCS Übung 3 Von: Patrick Denk Oleg Arenz
Sierpinski Dreieck Start links unten. 1. Es wird gewürfelt,
Funktionen als zentrales Werkzeug
 Präsentation transkript:

Seminarplan Stochastik 3 Das war Stochastik 3 Normalverteilung, Standardabweichung, Messwerte Gaußsches Wurzel(n)-Gesetz, Standardfehler Irrtumswahrscheinlichkeit,( P-Wert). W.-Rechner The english translation 4 is another file. Folie 1 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Seminarplan Stochastik 4 The english translation is another file. Seminarplan Stochastik 4 Überblick über Vorgehensweisen der Stochastik: Angabe von Messwerten Gauß-Test mit Messwerten Regression, Korrelation Elemente der beschreibenden Statistik, Weitere Verteilungen, Empirisches Forschen W.-Rechner Stochastik ist der Oberbegriff von beschreibender und beurteilender Statistik und Wahrscheinlichkeitstheorie Folie 2 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Hypothesentest bei Messwerten Mathix hat den Eindruck, sein Messgerät zeige zu kleine Werte an. Er betrachtet einen Vorgang, bei dem bekanntermaßen 20 mA mit sigma=1.6 mA gemessen werden. Er misst xi={18,19,17,18} mA . Zeigt sein Messgerät signifikant andere Werte? Velangt sind die Elemente der folgenden Seite Folie 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Hypothesentest bei Messwerten Der Test ist links-einseitig, weil er vor der Messung zu kleine Werte vermutet hat. grün:Verteilung der Einzelwerte Messprotokoll Verteilung sol- cher Mittelwerte Beibehaltungsbereich für H0 Mittelwert Dieser Wert heißt Standardfehler Ist der Mittelwert in kritischen Gebiet muss man H1 annehmen und H0 verwerfen. Folie 4 Ist der Mittelwert im Beibehaltungsbereich von H0, ist nichts bewiesen. Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Regression, Ausgleichsgerade Gegeben sind Messpunkte. Das Ziel ist, eine beste Gerade durch die Punkt- wolke zu finden. Gezeigt sind in Braun die Fehlerquadrate, auch Residuen- quadrate. In Blau ist deren Summe links gezeigt. Sie muss minimal sein. Folie 5 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Regression, Regeressionsgerade Es gibt zwei Parameter für die Gerade, m und k. Also ist die Summe der Fehler- quadrate eine Funktion von zwei Variablen, gezeigt als 3D-Raumfläche. Ihr Minimalpunkt (m,k) ist das Ziel. in Optimierung S. 208 ff und Stochastik S. 259 Oft ist es möglich, eine Ausgleichsgerade nach Augenmaß zu finden. Andere Regressionskurven sind möglich. In Excel und GeoGebra werden die Ausgleichskurven Trendlinien genannt. Hiermit kann man exakte Polynome n-Grades durch n+1 Punkte legen. Folie 6 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Regressionsgerade, Ausgleichs-, Trendlinie Die Parabeln hier sind die aus der 3D-Sicht, nun aber in derselben Ebene dargestellt. Links sind die x- und y-Varianz und die gemischte Varianz zu sehen. Folie 7 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Regression, Korrelationskoeffizient starke Korrelation starke Korrelation schwache Korrelation r = 0.974 r = 0.674 r = - 0.968 Folie 8 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Beschreibende Statistik falsche Darstellungen Arbeitslohn von Männern und Frauen Bild b) ist falsch, weil die y-Achse bei 1500€ beginnt. So werden erscheint das Einkommens- verhältnis kleiner als es in Wahrheit ist. Stochastik S. 258 Bild c) ist falsch, weil man die Größe des Ein- kommens der Frauen nicht erkennen kann. Diese Darstellung wäre allenfalls sinnvoll, wenn es um das Familieneinkommen bei zwei Verdienern ginge. Folie 9 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Beschreibende Statistik falsche Darstellungen Arbeitslohn von Männern und Frauen Werte wie oben Beschreibende Statistik falsche Darstellungen d) Hier ist die dritte Wurzel aus den Werten von a) berechnet. Wenn der Lohn in Euromünzen vorläge, hätten die Würfel exakt. Durch den perspektivischen Effekt, wird die Information verschleiert. Das Bild ist richtig, aber die Nutzer von Excel machen das nicht so. Bild e) ist falsch, da Excel dazu verleitet, die Löhne aus a) als Kantenlängen zu nehmen. Die so gezeigten Volumina werden falsch. Überlege: Ein Würfel mit der halben Kanten- länge hat nur ein Achtel das Volumens. Bild e) ist aus demselben Grund falsch. Für die Ikosaeder ist der Effekt noch deutlicher. Folie 10 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Vierfeldertafeln Wenn das Verhältnis , dann sind auch die anderen nicht für die Klausur Wenn das Verhältnis , dann sind auch die anderen passsenden Verhältnisse fast gleich. Dann sind die Gruppen bezüglich E nicht unterscheidbar. Nullhypothese H0: Die Gruppen bezüglich E nicht unterscheidbar. Forschungshypothese H1: B hat deutlich weiniger E (entspr. oben) If the ratio , the other suitable ratios are the same too. Then the groups are not distinctable in respect to E. Folie 11 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Vierfeldertafeln Beispiel A sind die Studis, die die Aufgaben machen, B diejenigen, die die Klausur bestehen. nicht für die Klausur Folie 12 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

nicht für die Klausur Vierfeldertafeln Dieses Beispiel hatte ich vorbereitet, musste es dann aber weglassen. Daher ist es nun nicht klausurrelevant. Es ist aber so interessant und wichtig für Lebenspraxis, dass ich es nicht weglassen möchte. Situation: Mathilde geht zur Vorsorgeuntersuchung. Es geht um eine Krankheit K. Der Test fällt positiv aus, T+. Das heißt aber nicht, dass Mathilde die Krankheit wirklich hat. Wie groß ist die Wahrscheinlichkeit, dass sie trotz T+ gesund ist? T+ T- K 130 150 n K 10000 Beispiel aus Sachs,Hedderich: Angewandte Statistik, Springer 2006 S. 135 Bekannt ist die Spezifität des Testes, die Wahrscheinlichkeit, dass ein Gesunder doch T- erhält. Das ist P(T-| n K)=94% Damit kann man in dieser Tabelle alle leeren Plätze füllen. Zuerst den freien Platz rechts 10000-150=9850, dann (n K, T-)=0.94*9850=9259. Der Rest ergibt sich durch Ergänzungen. Dann kann man die Sensitivität des Testes. ausrechnen P(T+| K)=130:150=86,7%, die W., dass ein Kranker T+ bekommt. Mit Sensitivität und Spezifität werden richtige Entscheidungen be- schrieben. Mathilde hofft, in dem Feld mit der 591 zu sein, in dem die Gesunden sind, die T+ hatten. T+ T- K 130 20 150 n K 591 9259 9850 721 9279 10000 Die W. für ein falsch-positves Erg. ist P(K|T+)=591:721=82%. Mathilde wartet mit Gelassenheit auf weitere Tests. Oft denkt man nicht an die Prävalenz P(K)=0.0150. Folie 13 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Datentypen, Merkmalstypen nominal, qualitative Daten Haarfarbe, Religion, Herkunftsland, Familientand.. ordinal, Rangdaten man kann sie sinnvoll ordnen: Schulnoten, Zustimmumgsgrad , Platzierungen in Wettbewerben, Schwierigkeit von Ski-Abfahrten creditpoints metrisch, Maßdaten Intervalldaten Verhältnisdaten Größen ohne natürlichen Nullpunkt, z.B. Temperatur, „doppelt“ geht nicht Größen mit natürlichem Nullpunkt, die man ins Verhältnis setzen kann. z.B. Masse, Länge, Zeit, , Anzahl Treffer , „doppelt“ ist sinnvoll Maßdaten sind diskret oder stetig Folie 14 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Benfordverteilung Historisches Im Jahre 1881 entdeckte der Mathematiker Simon Newcomb, dass die Seiten einer fünfstelligen Logarithmentafel für die kleine führende Ziffernfolgen wesentlich stärker abgegriffen waren als für große. Newcomb veröffentlichte seine Beobachtung, stellte auch schon eine logarithmische Formel auf, aber seine Arbeit wurde nicht beachtet. Im Jahr 1938 entdeckte der Physiker Frank Benford das Gestetz neu und untermauerte es mit Daten. Er bewies es aber nicht. Folie 15 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Benfordverteilung Erst 1995 deckte der Mathematik Theodore Hill genaueres auf und bewies auch noch weitere Zusammenhänge. Diese setzte der Mathematiker Mark Negrini in einem Analyseprogramm um, mit dem man die Echtheit von Daten prüfen kann, die „Benford-verteilt“ sein müssten. Dazu gehören vor allem Daten aus exponentiellen zusammenhängen, aber aggregierte Daten, die selbst nicht benford-verteilt sind, folgen der Benford-Verteilung. Auf diese Weise kann man Wirtschafts- und Bankdaten, wissenschaftliche Messdaten u.a. prüfen und Betrug aufdecken. Folie 16 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Seminarplan Stochastik 4 W.-Rechner Überblick über Vorgehensweisen der Stochastik: Angabe von Messwerten Gauß-Test mit Messwerten Regression, Korrelation Elemente der beschreibenden Statistik, Weitere Verteilungen, Empirisches Forschen Stochastik ist der Oberbegriff von beschreibender und beurteilender Statistik und Wahrscheinlichkeitstheorie www.mathematik-sehen-und-verstehen.de Folie 17 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de

Stochastik Ich hoffe, es hat Sie bereichert! Vorlesung in vier Teilen im Rahmen von Mathematik für alle, Leuphanasemester Folie 18 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik-sehen-und-verstehen.de