Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein Bayesianische Statistik für Einsteiger Tutorial 54. Gmds-Jahrestagung.

Ähnliche Präsentationen


Präsentation zum Thema: "Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein Bayesianische Statistik für Einsteiger Tutorial 54. Gmds-Jahrestagung."—  Präsentation transkript:

1 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein Bayesianische Statistik für Einsteiger Tutorial 54. Gmds-Jahrestagung Essen 2009 Jochem König und Reinhard Vonthein Institut für Medizinische Biometrie, Epidemiologie und Informatik und IMBS Lübeck koenig@imbei.uni-mainz.de

2 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 2 Bayes-Inferenz allgemein und abstrakt  Zu Daten X und Parameter  mit Likelihood  Kommt eine Prior  (  ).  Dann erhält man daraus mit dem Satz von Bayes die Posterior  Der Nenner ist ‚konstant‘, d.h.nur von X, nicht von  abhängig.

3 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 3 Einstichproben-Problem unter Normalverteilung  Nehme bekannte Varianz  2 an.  Die Dichte vonist  Prior

4 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 4 Normales Einstichprobenproblem Posterior  Also

5 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 5 Normales Einstichprobenproblem Posterior  Die normale Prior und die normale Likelihood machen eine normale Posterior.  Der a Posteriori-Erwartungswert ist ein Präzisionsgewichtetes Mittel aus a priori Erwartungswert und Stichprobenmittelwert.(Präzision:=1/Varianz)  Wenn Prior und Posterior aus derselben Familie sind heißen Likelihood und Prior konjugiert.  Die Parameter der Prior heißen Hyperparameter.

6 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 6 Normales Einstichprobenproblem Nichtinformative Prior Der Trost für die Objektivisten und die Unentschiedenen  Bisher allgemein  Nun:  Eine nichtnegative messbare Abbildung nach R heißt uneigentliche (improper) Dichte, wenn die Fläche darunter unendlich ist.  Diese Prior ist nicht informativ und uneigentlich  Dennoch ist die Posterior definiert und eigentlich

7 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 7 Warum darf man uneigentliche Priors verwenden?  Nochmal der Satz von Bayes  Nur das Integral im Nenner muss endlich sein, damit diese Posterior eine Dichte wird.  Die Prior muss nur bis auf einen constanten Faktor angegeben werden, kann also eine beliebige nichtnegative messbare Funktion sein.  Das Verhältnis        gibt an, welchen Parameterwert ich a priori für wahrscheinlicher halte.  heißt: Ich bin perfekt unentschieden.

8 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 8 2 Wermutstropfen 1 Nicht immer führt eine improper Prior auf eine proper Posterior. 2 Der Begriff ‚nicht-informativ‘ kann in einer Situation verschiedenen Priors angeheftet werden.  Eine sehr beliebte und fundierte nichtinformative Prior ist Jeoffry‘s Prior.  Sie führt auf maximale Verwandtschaft zu Maximum- Likelihood-Inferenz.

9 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 9 Normales Einstichprobenproblem: Was kommt heraus? - Ergebnis der Bayes-Inferenz Die Posterior und Funktionale davon:  Posterior Mean  Posterior Mode  Posterior Median  95%-credibility interval (credible interval) aus 2,5% und 97,5% - Quantil  95%-HPD-Intervall, HPD=highest posterior density  Überschreitungswahrscheinlichkeit als „Bayes-P-Wert“ für einseitigen Test

10 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 10 Normales Einstichprobenproblem: Was kommt heraus? - Ergebnis der Bayes-Inferenz Die Posterior und Funktionale davon:  Posterior Mean = Posterior Mode = Posterior Median =  95%-credibility interval (credible interval) aus 2,5% und 97,5% -Quantil  = 95%-HPD-Intervall,  Überschreitungswahrscheinlichkeit als „Bayes-P-Wert“ für einseitigen Test

11 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 11 Normales Einstichprobenproblem: Ergebnis Speziell für  dh    Die Posterior und Funktionale davon:  Posterior Mean = Posterior Mode = Posterior Median =  95%-credibility interval (credible interval) aus 2,5% und 97,5% -Quantil  = 95%-HPD-Intervall,  Überschreitungswahrscheinlichkeit als „Bayes-P-Wert“ für einseitigen Test

12 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 12 Bayes-Methoden: Äquivalenzen Ein-Stichproben-Problem bekannte Varianz Punktschätzer, Konfidenzintervall und Test frequentistisch sind identisch mit den Bayesianischen Entsprechungen bei konstanter uneigentlicher Prior Methode FrequentistischBayesianisch, Punktschätzer Konfidenzinterval p-Wert * Modell

13 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 13 Einstichproben-Problem unter Normalverteilung - Zwei Studien in Folge  Beginne mit Prior p(µ)=1  Stichprobe 1 vom Umfang n 1 :  Macht Posterior  Das ist die Prior für Stichprobe 2  Stichprobe 2 vom Umfang n 2 :  Macht Posterior  Bayes-Inferenz zeigt auf natürliche Weise den Zuwachs an Information an.

14 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 14 2. Teil Schätzung eines Anteils

15 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 15 Schätzung eines Anteils  Binomialverteilung  Mit Zähldichte  Dazu konjugiert ist die Beta-Verteilung.  Man entdeckt sie, indem man nicht y sondern  als Zufallsgröße ansieht.

16 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 16 Die Beta-Verteilung  Dichte

17 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 17 Beta-Verteilung

18 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 18 Mehr Beta

19 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 19 Schätzung eines Anteils

20 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 20  Asymptotisch alles gleich  Beta(0,0) ist gleichverteilung auf log(  /(1-  ))  Beta(0,0) führt für y=0,n auf uneigentliche Posterior!  Beta(.5,.5) ist Jeffreys Prior. (Siehe Carlin& Louis) Schätzung eines Anteils Welche Prior?

21 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 21 Beispiel Y=2,n=5 Posterior Beta(  +y,  +n-y) = Beta(  +2,  +3)

22 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 22  Exakte binomiale Konfidenzintervalle nach Pearson-Clopper für k Erfolge bei n Versuchen  Für die Prior Beta(0,1) ist die untere Grenze des credible intervals identisch mit der unteren Konfidenzintervallgrenze nach Pearson Clopper.  Für die Prior Beta(1,0) ist die obere Grenze des credible intervals identisch mit der oberen Konfidenzintervallgrenze nach Pearson Clopper. Schätzung eines Anteils Zusammenhang zu exaktem Konfidenzintervall

23 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 23 Prior uniform auf [0,1]uniform auf Logit-Skala  Exakte 95% Konfidenzintervalle und ML-Schätzer  posterior Intervall und Median  posterior Mean  posterior Mode Ratenschätzung frequentistisch und Bayesianisch

24 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 24 Teil 3. Beispiel Bayesianische Schäzung einer Prävalenz in Abwesenheit eines Goldstandards Results of serologic and stool testing for Strongyloides Infection on 162 Cambodian refugees arriving in Montreal, Canada, between July 1982 and February 1983

25 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 25 Bayesianische Schäzung einer Prävalenz in Abwesenheit eines Goldstandards Stool examination + -total Serology + 3887125 -23537 Total40122162 Results of serologic and stool testing for Strongyloides Infection on 162 Cambodian refugees arriving in Montreal, Canada, between July 1982 and February 1983

26 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 26 Beispiel: Bayesianische Prävalenzschätzung in Abwesenheit eines Goldstandards  Prävalenz?  Stuhlprobe ist hochspezifisch. Also pr > 25%? Stool examination + -total Serology + 3887125 -23537 Total40122162

27 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 27 Beispiel: Bayesianische Prävalenzschätzung in Abwesenheit eines Goldstandards: Das Modell  Bedingte Unabhängigkeit der Tests gegeben der wahre Zustand  Dann haben wir 5 Parameters (Prävalence, 2 Sensitivitäten, 2 Spezifitäten)  Und dazu 5 Binomialverteilungen, welche erklären, wie die Daten entstehen.

28 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 28 Bayesianische Prävalenzschätzung in Abwesenheit eines Goldstandards „Prior-Elicitation“ durch Experten und Literatur

29 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 29 Example: Bayesian estimation of disease prevalence in absence of a gold standard From: Joseph & al. 1995 Bayesian estimation of disease prevalence in absence of a gold standard. Am.J.Epidemiology 141, 263-272.

30 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 30 Zauberei?  Die Daten sind vier Zahlen.  Es gibt 5 Parameter.  Dann müssen die Ergebnisse wesentlich von der Wahl der Priors abhängen!  Sensitivitätsanalysen sind angezeigt (Variation der Prior):  Lästig aber unerlässlich.

31 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 31 Bayesianische Prävalenzschätzung in Abwesenheit eines Goldstandards: Wozu Bayes?  Man könnte doch auch Prävalenzen für eine Reihe von plausiblen Sensitivitäten und Spezifitäten herleiten.  Bayes-Analyse gibt einen formalen Rahmen  Man ist veranlasst die Unsicherheit über unbekannte Parameter zu diskutieren und zu quantifizieren.  Dafür erhält man eine Synthese von getroffenen Annahmen und beobachteten Daten.

32 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein Ausblick: Gemischte Modelle  Das lineare fixed effects Modell mit flacher Prior für die Koeffizienten und flacher Prior für log(  ) ist nahezu identisch zur Kleinste-Quadrate Regression.  Erweiterung um Zufallseffekte in WinBUGS sehr einfach.  Siehe Beispiel 1 ‘Rats’ aus dem Beispiele-Manual  Im Gegensatz zu ML und REML enthalten die a posteriori Standardfehler der Koeffizienten auch die Unsicherheit über die Zufallseffektvarianzparameter.

33 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein Regressoren Zentrieren  WinBUGS ist nicht translationsinvariant  Es wird dringend empfohlen, alle stetigen Regressoren zu zentrieren:  Ersetze x i durch x i -mean  Code-Beispiel  mue[i]<-alpha+beta*(x[i]-3.5)  Die Mittelwerte am besten außerhalb Winbugs bestimmen und als Konstante einfügen. Dann geht es schneller.  Nicht Zentrieren kann die Konvergenz gefährden.

34 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 34 Ausblicke

35 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 35 Fields for Bayesian Analysis in Epidemiology  Hierarchical models (syn: multilevel models)  Spatial epidemiology  Missing values  Meta analysis  Bayesian sensitivity analysis  Errors in variables (exposures measured with uncertainty)  Hybrid designs: inference from several data sources (internal validation study, repeated measurements)  Risk analysis and health technology assessment.

36 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein Fehlende Werte  Die rationaleren Konzepte haben alle eine Bayesianische Komponente.  WinBUGS versteht den Wert NA = not available.  Die Ergebnisse sind valide unter “non-informative missingness”.  Man kann informative missingness modellieren, indem man Vektoren mit missingness-Indikatoren den Daten beifügt und eine Modell dazu spezifiziert.  Die Parameter für das Missingness Modell sind in der Regel sehr schlecht schätzbar und sollten daher  Im Rahmen einer Sensitivitätsanalyse fest gesetzt werden, oder  ((Mit stark informativen Priors belegt werden ))  Siehe z.B. Carpenter Pocock, Stat. Med.

37 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 37 Die AG Bayes-Methodik  der Deutschen Region der Internationalen Biometrischen Gesellschaft  www.imbei.uni-mainz.de/bayes www.imbei.uni-mainz.de/bayes  Abstracts und Slides aller AG-Tagungen  Eine Literatur-Datenbank zu MCMC  Links zu Bayes-Sites.

38 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 38 Bayes-Analyse ohne WinBUGS? Ja.  New procedures in SAS (see references below)  INLA = Approximate Bayesian inference for latent Gaussian models by using integrated nested Laplace Approximations (havard rue)  BayesX (free from the statistics website at LMU München)  GeoBUGS  R2WinBUGS etc.

39 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein Ankündigung und Call for Papers Gemeinsame Arbeitstagung der Arbeitsgruppen Bayes-Methodik, Ökologie und Umwelt und Räumliche Statistik 03. bis 05. 12. 2009 an der Universität Lübeck Tutorium von Håvard Rue, Trondheim: Gaussian Markov Random Fields and Bayesian integration (INLA).

40 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein Gemeinsame Arbeitstagung, Lübeck,3.-5.12.2009  Vorträge aus dem gemeinsamen Interessenbereich der drei Arbeitsgruppen.  Themenbereiche sind:  Hierarchische Modelle,  Kosten-Nutzen-Analyse und Entscheidungsfindung,  Geostatistik, Disease Mapping, Raum-zeitliche Modelle, räumliche Modelle für Waldlandschaften  statistische Analyse von Krebsregister- und Surveillance-Daten, sowie  freie Themen.  Nähere Informationen www.imbei.uni-mainz.de/bayeswww.imbei.uni-mainz.de/bayes  Anmeldungen und Kurzfassungen (max. 1 DIN A4-Seite, 12pt) von Vorträgen bitte bis 15. 09. 2009 zur Begutachtung an einen der folgenden Ansprechpartner:  Dr. Jochem König, Inst. für Med. Biometrie, Epidemiologie und Informatik, Johannes Gutenberg-Univ. Mainz, 55131 Mainz, Tel. 06131-17-3121, Fax -2968, koenig@imbei.uni-mainz.de,koenig@imbei.uni-mainz.de

41 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 41 Literatur  James O. Berger: Statistical Decision Theory and Bayesian Analysis, 2nd Edition. Springer 1985  Gelman, A., Carlin, J. B., Stern, H. S., and Rubin, D. B. (2004), Bayesian Data Analysis, 3rd ed.London: Chapman & Hall.  Gelman et. al http://www.stat.columbia.edu/~gelman/book/http://www.stat.columbia.edu/~gelman/book/  B P Carlin & T A Louis (2000). Bayes and Empirical Bayes Methods for Data Analysis. Chapman & Hall/CRC.  J M Bernardo & A F M Amith (2000). Bayesian Theory. Wiley.  http://support.sas.com/documentation/cdl/en/statugbayesian/61755/PDF/default/statugbay esian.pdf http://support.sas.com/documentation/cdl/en/statugbayesian/61755/PDF/default/statugbay esian.pdf  Und Literatur dort.

42 Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein 42 Literatur – etwas länger  Greenland S. Bayesian perspectives for epidemiological research: I. Foundations and basic methods. Int. J. Epi 2006  Greenland S. Bayesian perspectives for epidemiological research: II.Regression analysis. Int. J. Epi 2007  James O. Berger: Statistical Decision Theory and Bayesian Analysis, 2nd Edition. Springer 1985  Gelman, A., Carlin, J. B., Stern, H. S., and Rubin, D. B. (2004), Bayesian Data Analysis, 3rd ed.London: Chapman & Hall.  Gelman et. al http://www.stat.columbia.edu/~gelman/book/http://www.stat.columbia.edu/~gelman/book/  B P Carlin & T A Louis (2000). Bayes and Empirical Bayes Methods for Data Analysis. Chapman & Hall/CRC.  J M Bernardo & A F M Amith (2000). Bayesian Theory. Wiley.  http://support.sas.com/documentation/cdl/en/statugbayesian/61755/PDF/default/stat ugbayesian.pdf and references there. http://support.sas.com/documentation/cdl/en/statugbayesian/61755/PDF/default/stat ugbayesian.pdf  Approximate Bayesian inference for latent Gaussian models by using integrated nested Laplace Approximations. JRSS B 71, Part 2, pp. 1–35 www.math.ntnu.no/~hrue/RueOct2008.pdf


Herunterladen ppt "Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein Bayesianische Statistik für Einsteiger Tutorial 54. Gmds-Jahrestagung."

Ähnliche Präsentationen


Google-Anzeigen