Statistik und Biometrie

Slides:



Advertisements
Ähnliche Präsentationen
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Advertisements

Konfidenzintervalle Intervallschätzung
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Die Student- oder t-Verteilung
Hier noch ein Beispiel zur bedingten Wahrscheinlichkeit Drei Personen A, B und C befinden sich im Gefängnis. Einer von den dreien ist zum Tode verurteilt,
Median Merkmal Geordneter Datensatz
Klausurtermin (laut Prüfungsamt) Probeklausur Freitag, 13. Juni 2003 statt Vorlesung.
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
Die Vorlesung Mathematik I (Prof. Kugelmann) findet heute um 14:30 Uhr im Hörsaal Loefflerstraße 70 statt.
Erwartungswert und Varianz I Der endliche Fall Erwartungswert Varianz.
Datenmatrix.
Quantile.
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Bedingte Wahrscheinlichkeiten Die Belegschaft eines Betriebes wird nach Rauchern und Nicht- rauchern eingeteilt. Dabei ergibt sich die folgende Tabelle:
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Bedingte Wahrscheinlichkeiten
Grundbegriffe der (deskriptiven) Statistikder Wahrscheinlichkeitstheorie.
Verteilungsfunktion der Normalverteilung I. Verteilungsfunktion der Normalverteilung II.
Quantile.
Test auf Normalverteilung
Lehrstuhl für Algebra und funktionalanalytische Anwendungen
Univariate Statistik M. Kresken.
Das wars!.
Diskrete Wahrscheinlichkeitsmodelle
Stetige Zufallsgrößen
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Binomialverteilung: Beispiel
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.
Referat über das Thema STOCHASTIK.
1 (C) 2002, Hermann Knoll, HTW Chur, Fachhochschule Ostschweiz Wahrscheinlichkeitsverteilung Lernziele: Wahrscheinlichkeitsverteilung und der Wahrscheinlichkeitsdichte.
Erheben, berechnen und darstellen von Daten
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
K. Desch - Statistik und Datenanalyse SS05
Verteilungen, Varianz Tamara Katschnig.
Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.
Mathe Hausaufgabe Von Joschka und Niklas.
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
Ein Dozent hat mittels eines Fragebogens die Körpergröße seiner Studenten festgestellt. Anhand der erfassten Daten weiß er, dass der kleinste Student 158.
Vorbereitungsseminar zum fachdidaktischen Blockpraktikum WS 2009/10 Seminarleiterin: Frau StDin Homberg-Halter Seminarsitzung: Oberstufe Stochastik -Planung.
1. 2 Das Grundproblem der Beurteilenden Statistik ● Wir haben uns bisher mit Problemen der Wahrscheinlichkeitsrechnung beschäftigt: – Die Wahrscheinlichkeit.
Page  1 Agenda  Beantwortung der Forschungsfragen  Datendarstellung für Präsentation und Bericht  Häufigkeitsverteilungen  Statistische Kennwerte.
Wahrscheinlichkeitstheorie
Übersetzung: / Tradotto da:
Betrachtung der Realität aus der Sicht der Statistik VARIABILITÄT
Übersetzung: / Tradotto da:
Kapitel 8.1 Auswertung statistischer Daten
4 Spezifizierende Beschreibung
7.2 Theoretische Kennwerte
Binomialverteilung.
Median, Spannweite, Halbweite
Wahrscheinlichkeitsverteilungen
Binomialverteilung FI Mag. Günther Schwarz.
Stochastik in der MUED (c) A. Warmeling
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
Ökonometrie und Statistik Wiederholung
Univariate Statistik M. Kresken.
mathe-merk-mal Klasse 5
UE/BiTS Berlin, ALBA BERLIN College Sommersemester 2018
3 Gesamtbeschreibung empirischer Verteilungen.
Forschungsstrategien Johannes Gutenberg Universität Mainz
Ökonometrie und Statistik Wiederholung
ReduSoft Ltd. Kurzbeschreibungen zu einigen Modulen, die im Programm MathProf 5.0 unter dem Themenbereich Stochastik implementiert sind.
Heute: Geschichten vom Schulweg
Erwartungswerte berechnen
Mehrstufige Zufallsexperimente
Ökonometrie und Statistik Wiederholung
Abiturprüfung Mathematik 2015 Baden-Württemberg Allgemeinbildende Gymnasien Wahlteil Analytische Geometrie / Stochastik Aufgabe B 2.1 und B Lösungen.
Konfidenzintervalle und Tests auf Normalverteilung
Ökonometrie und Statistik Wiederholung
 Präsentation transkript:

Statistik und Biometrie Deskriptive Statistik I

angebl. Winston Churchill Spruch des Tages Traue keiner Statistik, die du nicht selbst gefaelscht hast angebl. Winston Churchill

Wiederholung Merkmale Beobachtungseinheiten sind Träger von Merkmalen

Wiederholung Die Aufgaben von Merkmalen

Deskriptive Statistik: qualitative Merkmale n = Umfang der Stichprobe (Z.B.: Anzahl der Personen) Ai = Ausprägung des Merkmals (i=1,2,.,k) Absolute Häufigkeit ni Relative Häufigkeit hi = ni/n Adjustierte Häufigkeit hi = ni/(n-no)

Deskriptive Statistik: qualitative Merkmale Beispiel 2.1 Tabelle 2.1: Urliste für das Merkmal Besserung nach Salbenbehandlung Patient Besserung 1 Gering 7 Deutlich 13 19 2 8 14 20 3 9 Keine Angabe 15 Keine 21 4 10 16 22 5 11 17 23 6 keine 12 18 deutlich 24

Deskriptive Statistik: qualitative Merkmale Tabelle 2.2: Häufigkeiten für das Merkmal Besserung nach Salbenbehandlung Besserung Absolute Häufigkeit Relative Häufigkeit Adjustierte relative Häufigkeit Keine 3 12.5% 15% Gering 10 41.7% 50% Deutlich 7 29.2% 35% Keine Angabe 4 16.6% - Gesamt 24 100%

Quantitativ diskretes Merkmal Beispiel 2.2. Tabelle 2.3: Häufigkeiten für das quantitativ diskrete Merkmal Anzahl der Nebenwirkungen Anzahl der Nebenwirkungen absolute Häufigkeit relative Häufigkeit (%) absolute Häufigkeitssumme relative Häufigkeitssumme 209 41.8% 1 122 24.4% 331 66.2% 2 108 21.6% 439 87.8% 3 44 8.8% 483 96.6% 4 13 2.6% 496 99.2% 5 0.0% 6 0.8% 500 100.0%

Graphische Darstellung eines quantitativ diskreten Merkmals Abbildung 2.4: Stabdiagramm für das Merkmal Anzahl gemeldeter Nebenwirkungen

Herrman Joseph Abs, dt Bankier Spruch des Tages Die Statistik ist wie eine Laterne im Hafen. Sie dient dem betrunkenen Seemann mehr zum Halt als zur Erleuchtung Herrman Joseph Abs, dt Bankier Relative Häufigkeit ist etwas, daß relativ häufig passiert Medizinische Statistik – Hans J. Trampisch,…

Quantitativ stetiges Merkmal Beispiel 2.3. Tabelle 2.4: Häufigkeitsverteilung des klassierten stetigen Merkmals Alter in Jahren Klasse Alter in Jahren Klassenmitte Häufigkeiten (absolut/relativ) 1 (45,55] 50 2 2/24=.08 (55,65] 60 8 8/24=0.33 3 (65,75] 70 11 11/24=0.46 4 (75,85] 80 2/24=0.08 5 (85,95] 90 1/24=0.04 Summe ----- ------ 24

Statistische Maßzahlen Lagemaß Empirische Median Urliste mit Daten (Am Beispiel Körpergröße [cm]) Ordnen der Daten Falls n gerade oder

Statistische Maßzahlen Lagemaß Falls n ungerade Verteilungsfunktion Fn

Statistische Maßzahlen Lagemaß Empirische Median (Quartil) Median vs Mittelwert: CK-Wert 1.Quartil 3.Quartil x0.25 x0.75

Statistische Maßzahlen Lfd. Nr. i Größe (cm) emp. Verteilungsfunktion 1 155 1/16 = 0.0625 2 158   3 3/16 = 0.1875 4 159 4/16 = 0.2500 5 162 5/16 = 0.3125 6 165 7 8 8/16= 0.5000 9 9/16 = 0.5625 10 166 11 11/16 = 0.6875 12 167 12/16=0.7500 13 170 14 14/16=0.8750 15 176 16 16/16=1.0000 Summe 2643 Beispiel 2.4 1. Quartil 2. Quartil empirische Median 3. Quartil

Statisische Maßzahlen Lfd. Nr. i Größe (cm) emp. Verteilungsfunktion 1 155 1/14 = 0,0714 2 158   3 3/14 = 0.2143 4 159 4/14 = 0.2857 5 162 5/14 = 0.3571 6 165 6/14= 0.42857 7 7/14 = 0.5000 8 166 9 9/14 = 0.64286 10 167 10/14= 0.71429 11 170 11/14= 0.7857 12 12/14=0.85714 13 176 14 14/14=1.0000 Summe 2643 1. Quartil 2. Quartil empirische Median 3. Quartil

Statistische Maßzahlen Lagemaß Lagemaße empirisches Minimum xmin = 155 empirisches 0.25-Quantil (1. Quartil) x0.25 = 159 alternativ 0.5*(x(4) + x(5)) =160.5 empirischer Median (2. Quartil) : 165 alternativ x0.5 =165 empirisches 0.75-Quantil (3. Quartil) x0.75 = 167 alternativ 0.5*(x(12) + x(13)) =168.5 empirisches Maximum xmax = 176 Mittelwert : 165

Spruch des Tages Mittelwert und Streuung Ein Mensch, der von Statistik hört, denkt dabei nur an Mittelwert. Er glaubt nicht dran und ist dagegen, ein Beispiel soll es gleich belegen: Ein Jäger auf der Entenjagd hat einen ersten Schuß gewagt. Der Schuß, zu hastig aus dem Rohr, lag eine gute Handbreit' vor. Der zweite Schuß mit lautem Krach lag eine gute Handbreit' nach. Der Jäger spricht ganz unbeschwert voll Glauben an den Mittelwert: Statistisch ist die Ente tot! Doch wär er klug und nähme Schrot - dies sei gesagt ihn zu belehren - er würde seine Chancen mehren: Der Schuß geht ab, die Ente stürzt, weil Streuung ihr das Leben kürzt! Unbekannt

Statistische Maßzahlen Streumaß Varianz Standartabweichung

Statistische Maßzahlen Lfd. Nr. i Größe (cm) 1 155 -10.1875 103.785 2 158 -7.1875 51.660 3 4 159 -6.1875 38.285 5 162 -3.1875 10.160 6 165 -0.1875 0.035 7 8 9 10 166 0.8125 0.660 11 12 167 1.8125 3.285 13 170 4.8125 23.160 14 15 176 10.8125 116.910 16 Summe 2643 0.0000 540.437 Beispiel 2.4

Statistische Maßzahlen Streumaß Streuungsmaße empirische Spannweite (Range) R = xmax-xmin = 21 empirischer Interquartilsabstand q = x0.75-x0.25 = 8 empirische Varianz: empirische Standardabweichung:

Deskriptive Statistik II - Kontingenztafel B A B1 B2 ... Bj Bq Zeile summe A1 n11 n12 n1j n1q n1. A2 n21 n22 n2j n2q n2. . . . Ai ni1 ni2 nij niq ni. Ap np1 np2 npj npq np. Spalten n.1 n.2 n.j n.q n=n..

Kontingenztafel Beispiel 3.1 Ergebnis Therapie CR PR NR ED Zeilensumme n = 20 Patienten Merkmalen Therapie (TAD/TAD, TAD/HAM), Therapieergebnis (PR=Partial Remission, ED = Early Death, NR= Non Responder, CR= Complete Remission), Geschlecht und Alter.   Ergebnis Therapie CR PR NR ED Zeilensumme TAD/TAD Zeilenprozent 8 80 1 10 0 0 10 100 TAD/HAM Zeilenprozent 5 50 3 30 Spaltensumme Zeilenprozent 13 65 2 10 3 15 20 100

Kontingenztafel Zum Vergleich n = 140 Ergebnis Therapie CR PR NR ED   Ergebnis Therapie CR PR NR ED Zeilen summe TAD/TAD Zeilenprozent 48 65.75 5 6.85 13 17.81 7 9.59 73 100 TAD/HAM 47 70.15 3 4.48 12 17.91 5 7.46 67 100 Spaltensume 95 67.86 8 5.71 25 17.86 12 8.57 140 100

Regression und Korrelation Beispiel 3.2 N=15 Patienten

Regression und Korrelation

Nr. RRdias (X) RRsys (Y) x2 xy y2 1 80 120 6400 9600 14400 2 70 115 4900 8050 13225 3 125 10000 15625 4 110 7700 12100 5 6 130 10400 16900 7 85 140 7225 11900 19600 8 75 5625 9000 9 9375 10 90 150 8100 13500 22500 11 11200 12 135 9450 18225 13 95 9025 13300 14 9750 15 145 13050 21025 S 1185 1940 94525 154325 252950 ./n 79 129.33 6301.67 10288.33 16863.33

Regression und Korrelation

Regression und Korrelation

Regression und Korrelation

Regression und Korrelation

Analytische Statistik Wahrscheinlichkeit p, Gegenwahrscheinlichkeit q Zufallsvariable x Wahrscheinlichkeitsfunktion f(x) Verteilungsfunktion F(x) Erwartungswert µ Varianz σ2

Kombinatorik Baumdiagramm Multinomialkoeffizient Binomialkoeffizient

Binomialverteilung Wie hoch ist die Wahrscheinlichkeit, dass bei 10 mal Würfeln 3 mal eine 6 erscheint? Die Einzelwahrscheinlickeit ist p=1/6 Die Anzahl der Möglichkeiten um 3 mal eine 6 bei 10 Versuchen ist Die Gesamtwahrscheinlichkeit ist = 0,155 120 0,00463 0,279

Binomialverteilung

Binomialverteilung Erwartungswert und Varianz

Poissonverteilung Voraussetzung: λ=n*p, n sehr groß, p sehr klein

Poissonverteilung Beispiel 4.4 Die mittlere Anzahl dem Kinderkrebsregister in Mainz gemeldeter Malignome betrug in den letzten zehn Jahren etwa 12 Fälle pro Jahr auf 100000 Kinder. Die Binomialverteilung mit n=100000 und p=12/100000 gibt an, wie groß die Wahrscheinlichkeit ist, daß z.B. im kommenden Jahr k=0,1,2,... Fälle pro 100000 Kinder gemeldet werden. Die Wahrscheinlichkeit für z.B. k=12 Fälle beträgt nach der Formel für die Binomialverteilung 0.11437478. Für die Poissonverteilung mit dem Parameter l = (12/100000)*100000 = 12 ergibt sich mit 0.11436792 nahezu der gleiche Wert.