Statistik und Biometrie Deskriptive Statistik I
angebl. Winston Churchill Spruch des Tages Traue keiner Statistik, die du nicht selbst gefaelscht hast angebl. Winston Churchill
Wiederholung Merkmale Beobachtungseinheiten sind Träger von Merkmalen
Wiederholung Die Aufgaben von Merkmalen
Deskriptive Statistik: qualitative Merkmale n = Umfang der Stichprobe (Z.B.: Anzahl der Personen) Ai = Ausprägung des Merkmals (i=1,2,.,k) Absolute Häufigkeit ni Relative Häufigkeit hi = ni/n Adjustierte Häufigkeit hi = ni/(n-no)
Deskriptive Statistik: qualitative Merkmale Beispiel 2.1 Tabelle 2.1: Urliste für das Merkmal Besserung nach Salbenbehandlung Patient Besserung 1 Gering 7 Deutlich 13 19 2 8 14 20 3 9 Keine Angabe 15 Keine 21 4 10 16 22 5 11 17 23 6 keine 12 18 deutlich 24
Deskriptive Statistik: qualitative Merkmale Tabelle 2.2: Häufigkeiten für das Merkmal Besserung nach Salbenbehandlung Besserung Absolute Häufigkeit Relative Häufigkeit Adjustierte relative Häufigkeit Keine 3 12.5% 15% Gering 10 41.7% 50% Deutlich 7 29.2% 35% Keine Angabe 4 16.6% - Gesamt 24 100%
Quantitativ diskretes Merkmal Beispiel 2.2. Tabelle 2.3: Häufigkeiten für das quantitativ diskrete Merkmal Anzahl der Nebenwirkungen Anzahl der Nebenwirkungen absolute Häufigkeit relative Häufigkeit (%) absolute Häufigkeitssumme relative Häufigkeitssumme 209 41.8% 1 122 24.4% 331 66.2% 2 108 21.6% 439 87.8% 3 44 8.8% 483 96.6% 4 13 2.6% 496 99.2% 5 0.0% 6 0.8% 500 100.0%
Graphische Darstellung eines quantitativ diskreten Merkmals Abbildung 2.4: Stabdiagramm für das Merkmal Anzahl gemeldeter Nebenwirkungen
Herrman Joseph Abs, dt Bankier Spruch des Tages Die Statistik ist wie eine Laterne im Hafen. Sie dient dem betrunkenen Seemann mehr zum Halt als zur Erleuchtung Herrman Joseph Abs, dt Bankier Relative Häufigkeit ist etwas, daß relativ häufig passiert Medizinische Statistik – Hans J. Trampisch,…
Quantitativ stetiges Merkmal Beispiel 2.3. Tabelle 2.4: Häufigkeitsverteilung des klassierten stetigen Merkmals Alter in Jahren Klasse Alter in Jahren Klassenmitte Häufigkeiten (absolut/relativ) 1 (45,55] 50 2 2/24=.08 (55,65] 60 8 8/24=0.33 3 (65,75] 70 11 11/24=0.46 4 (75,85] 80 2/24=0.08 5 (85,95] 90 1/24=0.04 Summe ----- ------ 24
Statistische Maßzahlen Lagemaß Empirische Median Urliste mit Daten (Am Beispiel Körpergröße [cm]) Ordnen der Daten Falls n gerade oder
Statistische Maßzahlen Lagemaß Falls n ungerade Verteilungsfunktion Fn
Statistische Maßzahlen Lagemaß Empirische Median (Quartil) Median vs Mittelwert: CK-Wert 1.Quartil 3.Quartil x0.25 x0.75
Statistische Maßzahlen Lfd. Nr. i Größe (cm) emp. Verteilungsfunktion 1 155 1/16 = 0.0625 2 158 3 3/16 = 0.1875 4 159 4/16 = 0.2500 5 162 5/16 = 0.3125 6 165 7 8 8/16= 0.5000 9 9/16 = 0.5625 10 166 11 11/16 = 0.6875 12 167 12/16=0.7500 13 170 14 14/16=0.8750 15 176 16 16/16=1.0000 Summe 2643 Beispiel 2.4 1. Quartil 2. Quartil empirische Median 3. Quartil
Statisische Maßzahlen Lfd. Nr. i Größe (cm) emp. Verteilungsfunktion 1 155 1/14 = 0,0714 2 158 3 3/14 = 0.2143 4 159 4/14 = 0.2857 5 162 5/14 = 0.3571 6 165 6/14= 0.42857 7 7/14 = 0.5000 8 166 9 9/14 = 0.64286 10 167 10/14= 0.71429 11 170 11/14= 0.7857 12 12/14=0.85714 13 176 14 14/14=1.0000 Summe 2643 1. Quartil 2. Quartil empirische Median 3. Quartil
Statistische Maßzahlen Lagemaß Lagemaße empirisches Minimum xmin = 155 empirisches 0.25-Quantil (1. Quartil) x0.25 = 159 alternativ 0.5*(x(4) + x(5)) =160.5 empirischer Median (2. Quartil) : 165 alternativ x0.5 =165 empirisches 0.75-Quantil (3. Quartil) x0.75 = 167 alternativ 0.5*(x(12) + x(13)) =168.5 empirisches Maximum xmax = 176 Mittelwert : 165
Spruch des Tages Mittelwert und Streuung Ein Mensch, der von Statistik hört, denkt dabei nur an Mittelwert. Er glaubt nicht dran und ist dagegen, ein Beispiel soll es gleich belegen: Ein Jäger auf der Entenjagd hat einen ersten Schuß gewagt. Der Schuß, zu hastig aus dem Rohr, lag eine gute Handbreit' vor. Der zweite Schuß mit lautem Krach lag eine gute Handbreit' nach. Der Jäger spricht ganz unbeschwert voll Glauben an den Mittelwert: Statistisch ist die Ente tot! Doch wär er klug und nähme Schrot - dies sei gesagt ihn zu belehren - er würde seine Chancen mehren: Der Schuß geht ab, die Ente stürzt, weil Streuung ihr das Leben kürzt! Unbekannt
Statistische Maßzahlen Streumaß Varianz Standartabweichung
Statistische Maßzahlen Lfd. Nr. i Größe (cm) 1 155 -10.1875 103.785 2 158 -7.1875 51.660 3 4 159 -6.1875 38.285 5 162 -3.1875 10.160 6 165 -0.1875 0.035 7 8 9 10 166 0.8125 0.660 11 12 167 1.8125 3.285 13 170 4.8125 23.160 14 15 176 10.8125 116.910 16 Summe 2643 0.0000 540.437 Beispiel 2.4
Statistische Maßzahlen Streumaß Streuungsmaße empirische Spannweite (Range) R = xmax-xmin = 21 empirischer Interquartilsabstand q = x0.75-x0.25 = 8 empirische Varianz: empirische Standardabweichung:
Deskriptive Statistik II - Kontingenztafel B A B1 B2 ... Bj Bq Zeile summe A1 n11 n12 n1j n1q n1. A2 n21 n22 n2j n2q n2. . . . Ai ni1 ni2 nij niq ni. Ap np1 np2 npj npq np. Spalten n.1 n.2 n.j n.q n=n..
Kontingenztafel Beispiel 3.1 Ergebnis Therapie CR PR NR ED Zeilensumme n = 20 Patienten Merkmalen Therapie (TAD/TAD, TAD/HAM), Therapieergebnis (PR=Partial Remission, ED = Early Death, NR= Non Responder, CR= Complete Remission), Geschlecht und Alter. Ergebnis Therapie CR PR NR ED Zeilensumme TAD/TAD Zeilenprozent 8 80 1 10 0 0 10 100 TAD/HAM Zeilenprozent 5 50 3 30 Spaltensumme Zeilenprozent 13 65 2 10 3 15 20 100
Kontingenztafel Zum Vergleich n = 140 Ergebnis Therapie CR PR NR ED Ergebnis Therapie CR PR NR ED Zeilen summe TAD/TAD Zeilenprozent 48 65.75 5 6.85 13 17.81 7 9.59 73 100 TAD/HAM 47 70.15 3 4.48 12 17.91 5 7.46 67 100 Spaltensume 95 67.86 8 5.71 25 17.86 12 8.57 140 100
Regression und Korrelation Beispiel 3.2 N=15 Patienten
Regression und Korrelation
Nr. RRdias (X) RRsys (Y) x2 xy y2 1 80 120 6400 9600 14400 2 70 115 4900 8050 13225 3 125 10000 15625 4 110 7700 12100 5 6 130 10400 16900 7 85 140 7225 11900 19600 8 75 5625 9000 9 9375 10 90 150 8100 13500 22500 11 11200 12 135 9450 18225 13 95 9025 13300 14 9750 15 145 13050 21025 S 1185 1940 94525 154325 252950 ./n 79 129.33 6301.67 10288.33 16863.33
Regression und Korrelation
Regression und Korrelation
Regression und Korrelation
Regression und Korrelation
Analytische Statistik Wahrscheinlichkeit p, Gegenwahrscheinlichkeit q Zufallsvariable x Wahrscheinlichkeitsfunktion f(x) Verteilungsfunktion F(x) Erwartungswert µ Varianz σ2
Kombinatorik Baumdiagramm Multinomialkoeffizient Binomialkoeffizient
Binomialverteilung Wie hoch ist die Wahrscheinlichkeit, dass bei 10 mal Würfeln 3 mal eine 6 erscheint? Die Einzelwahrscheinlickeit ist p=1/6 Die Anzahl der Möglichkeiten um 3 mal eine 6 bei 10 Versuchen ist Die Gesamtwahrscheinlichkeit ist = 0,155 120 0,00463 0,279
Binomialverteilung
Binomialverteilung Erwartungswert und Varianz
Poissonverteilung Voraussetzung: λ=n*p, n sehr groß, p sehr klein
Poissonverteilung Beispiel 4.4 Die mittlere Anzahl dem Kinderkrebsregister in Mainz gemeldeter Malignome betrug in den letzten zehn Jahren etwa 12 Fälle pro Jahr auf 100000 Kinder. Die Binomialverteilung mit n=100000 und p=12/100000 gibt an, wie groß die Wahrscheinlichkeit ist, daß z.B. im kommenden Jahr k=0,1,2,... Fälle pro 100000 Kinder gemeldet werden. Die Wahrscheinlichkeit für z.B. k=12 Fälle beträgt nach der Formel für die Binomialverteilung 0.11437478. Für die Poissonverteilung mit dem Parameter l = (12/100000)*100000 = 12 ergibt sich mit 0.11436792 nahezu der gleiche Wert.