BAYESianische Statistik für Einsteiger MCMC Verteilungen a priori

Slides:



Advertisements
Ähnliche Präsentationen
Modellierung intraspezifischer Konkurrenz
Advertisements

Zur Schätzung der Wiederkehrzeiten von Starkniederschlägen
Masterstudiengang IE (Industrial Engineering)
Strukturlösung mit Hilfe der Patterson-Funktion
Simulated Annealing Marco Block & Miguel Domingo Seminar : Maschinelles Lernen und Markov KettenSommersemester 2002.
1/21 UNIVERSITY OF PADERBORN Projektgruppe KIMAS – Reinforcement Learning in MAS Projektgruppe KIMAS Reinforcement Learning in MAS Marc Pannenberg.
Stochastik in der Sek. II Sabrina Schultze.
Forschungsstrategien Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Hypothesenprüfung nach Bayes
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Dynamische Programmierung (2) Matrixkettenprodukt
Halbzeit: Kurze Wiederholung
WS Algorithmentheorie 08 – Dynamische Programmierung (2) Matrixkettenprodukt Prof. Dr. Th. Ottmann.
Mixture Regression Modelle
K. Desch - Statistik und Datenanalyse SS05
PG 520 Intelligence Service – gezielte Informationen aus dem Internet
Algorithmen des Internets 2005 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität 1 Klausuraufgaben.
Konfidenzintervalle Intervallschätzung
Statistische Methoden II SS 2008 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Makarenkostraße (Kiste)
Die Student- oder t-Verteilung
Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur - statt Vorlesungen -
Erwartungswert und Varianz I Der endliche Fall Erwartungswert Varianz.
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,
4. Markov-Ketten 4.1. Übergangsmatrizen
Statistische Methoden I SS 2005
Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur nächste Woche - statt Vorlesungen -
Statistische Methoden I WS 2006/2007 Probeklausur Freitag, 26. Januar statt Vorlesung - Nächste Woche Nächste Woche!
Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur - statt Vorlesungen -
Statistische Methoden I WS 2007/2008 Probeklausur Donnerstag, 31. Januar 2008 und Freitag, 1. Februar statt Vorlesungen -
Achtung Vorlesung am Montag, den 21. Juni Zeit: Uhr Ort: Kiste.
II. Wahrscheinlichkeitstheorie
Statistische Methoden II SS 2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Wahrscheinlichkeitstheorie. Statistische Methoden I WS 2009/2010 Einleitung: Wie schätzt man die Zahl der Fische in einem See? Zur Geschichte der Statistik.
III. Induktive Statistik
Statistische Methoden II SS 2003
Statistische Methoden I WS 2009/2010 Probeklausur Montag, 25. Januar statt Vorlesung -
Grundbegriffe der (deskriptiven) Statistikder Wahrscheinlichkeitstheorie.
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Vorlesung: ANOVA II.
Einfache Regressionsgleichung
Multikollinearität Wann spricht man von Multikollinearität?
Wiederholung: Einfache Regressionsgleichung
Histogramm/empirische Verteilung Verteilungen
Ausgleichungsrechnung I
Effiziente Algorithmen
Entscheidung bei Infomationsdefizit: Simultane optimale Alternativensuche und Nutzenpräzisierung o.Univ. Prof. Dkfm. Dr. Wolfgang Janko, WU.
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Statistik: Mehr zur Regression.
Konfidenzintervall und Testen für den Mittelwert und Anteile
Kapitel 18 Dynamische Modelle: Schätzen der Parameter
Kapitel 18 Dynamische Modelle: Schätzen der Parameter.
Zeitreihenanalyse und Prognoseverfahren
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Parallelisierung für Multiprozessor-Maschinen
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
Bitte geben Sie hier den Namen Ihrer Einrichtung über Ansicht/Master/ Folienmaster ein Bayesianische Statistik für Einsteiger Tutorial 54. Gmds-Jahrestagung.
K. Desch - Statistik und Datenanalyse SS05
Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung
K. Desch - Statistik und Datenanalyse SS05
Geoinformationssysteme
 Präsentation transkript:

BAYESianische Statistik für Einsteiger MCMC Verteilungen a priori – – MCMC 1 – 2 – 3 Prior 1 2 3 – – BAYESianische Statistik für Einsteiger MCMC Verteilungen a priori Dr. rer. pol. R. VONTHEIN, Dipl. Statistiker (Univ.) Institut für Medizinische Biometrie und Statistik, Universitätsklinikum Schleswig-Holstein, Campus Lübeck, Universität zu Lübeck Dr. sc. hum. J. KÖNIG, Dipl. Mathematiker Inst. für Med. Biometrie, Epidemiologie und Informatik, Universitätsmedizin Mainz 54. GMDS, Essen 09.09.2009

Inhalt MCMC GIBBS Sampler und METROPOLIS-HASTINGS-Schritte – – MCMC 1 – 2 – 3 Prior 1 2 3 – – Inhalt MCMC GIBBS Sampler und METROPOLIS-HASTINGS-Schritte Reparametrisierung und „Blockbildung“ Konvergenzdiagnose Verteilungen a priori Konjugierte Verteilungen Uneigentliche Verteilungen Elizitieren 54. GMDS, Essen 09.09.2009

MCMC Idee: Aus Vorschlagsverteilungen werden – – MCMC 1 – 2 – 3 Prior 1 2 3 – – MCMC Idee: Aus Vorschlagsverteilungen werden Werte für die Parameter generiert („Monte-Carlo-Methode“). Die Vorschlagsverteilungen werden aufdatiert, so dass die Parameterwerte eine azyklische MARKOV-Kette bilden und die Verteilung der generierten Werte gegen die Verteilung a posteriori konvergiert. Die Startverteilung ist die a-priori-Verteilung. GIBBS Sampler und METROPOLIS-HASTINGS-Schritte Reparametrisierung und „Blockbildung“ Konvergenzdiagnose 54. GMDS, Essen 09.09.2009

GIBBS Sampler Algorithmus – – MCMC 1 – 2 – 3 Prior 1 2 3 – – GIBBS Sampler Algorithmus Vollständig bedingte Verteilungen für die Parameter Q(qj | x,q1, .. ,qj-1, qj+1, .. ,qJ) Iterieren bis zur Konvergenz generiere einen m-ten Wert qj(m) aus Q(qj(m) | x,q1(m), .. ,qj-1(m), qj+1(m-1), .. ,qJ(m-1)) datiere die nächste vollständig bedingte Verteilung auf Simulieren aus der Verteilung a posteriori Parameter schätzen aus der generierten Stichprobe Geman S, Geman, D. Stochastic relaxation, Gibbs distributions, and the Bayesian restoration of images. IEEE-PARMI 1984;6:721-741 Gelfand AE, Smith, AFN. Sampling-based approaches to calculating marginal densities. JASA 1990;85:398-409 54. GMDS, Essen 09.09.2009

METROPOLIS-HASTINGS-Schritte – – MCMC 1 – 2 – 3 Prior 1 2 3 – – METROPOLIS-HASTINGS-Schritte generiere Wert qj(m) aus einfacher Vorschlagsdichte g, welche aber auch aufdatiert wird akzeptiere mit Wahrscheinlichkeit a sonst bleibe bei qj(m) = qj(m-1) a hängt davon ab, ob die vollständig bedingte Dichte ansteigt Metropolis N, Rosenbluth A, Rosenbluth M, Teller A, Teller E. Equation of state calculation by fast computing machines. J Chem Physics 1953;21:1087-92 Hastings WK. Monte Carlo sampling methods using Markov chains and their applications. Biometrika 1970;57:97-109 54. GMDS, Essen 09.09.2009

Reparametrisierung q2 q2* q1 q1* Korrelierte Parameter führen zu – – MCMC 1 – 2 – 3 Prior 1 2 3 – – Reparametrisierung q2 q1 q1* q2* Korrelierte Parameter führen zu Autokorrelation der Iterationen, langsamer Konvergenz, geringem effektivem Stichprobenumfang 54. GMDS, Essen 09.09.2009

– – MCMC 1 – 2 – 3 Prior 1 2 3 – – „Blockbildung“ q2 q2 q1 q1 q1 und q2 werden aus einer gemeinsamen multivariaten Verteilung gleichzeitig generiert 54. GMDS, Essen 09.09.2009

Konvergenzdiagnose q2 q2* q1 q1* – – MCMC 1 – 2 – 3 Prior 1 2 3 – – Konvergenzdiagnose q2 q2* q1 q1* Autokorrelationsfunktion fällt exponentiell Korrelation zwischen Parametern ist gering rapid mixing der MARKOV-Ketten im Graph, per ANOVA Einschwingen (burn in) des Polygonzugs ist beendet 54. GMDS, Essen 09.09.2009

Verteilungen a priori Idee: Vorinformation formulieren – – MCMC 1 – 2 – 3 Prior 1 2 3 – – Verteilungen a priori Idee: Vorinformation formulieren Konjugierte Verteilungen (s. Einleitung) Uneigentliche Verteilungen als nicht-informative Verteilungen Elizitieren Quantile, Momente, mit Elicitor 54. GMDS, Essen 09.09.2009

Konjugierte Verteilungen – – MCMC 1 – 2 – 3 Prior 1 2 3 – – Konjugierte Verteilungen Konjugierte Verteilungen (s. Einleitung) z.B. Exponentialfamilien; s. neuesten TAS Information in Anzahl Beobachtungen messbar, z.B. im Beta-Binomial-Modell die Summe der Parameter der Beta-Verteilung Sichern Existenz der Parameter der a-posteriori-Verteilung 54. GMDS, Essen 09.09.2009

Uneigentliche Verteilungen – – MCMC 1 – 2 – 3 Prior 1 2 3 – – Uneigentliche Verteilungen als nicht-informative Verteilungen: minimiere FISHER-Information (maximiere Varianz), SHANNON-Information (maximiere Entropie) a popsteriori Konstante Dichte bedeutet Unfug: fq(0) = fq(10100) Translations- und Skalen-Invarianz für verschiedene Parameter erfordern verschiedene a-priori-Verteilungen uneigentliche a-posteriori-Verteilung leichter möglich 54. GMDS, Essen 09.09.2009

Elizitieren „Herauslocken“ und formulieren der Vorinformation – – MCMC 1 – 2 – 3 Prior 1 2 3 – – Elizitieren „Herauslocken“ und formulieren der Vorinformation Lange Diskussion der Literatur! Diskontiere historische Kontrollen! Wahl der Verteilung nach Träger und Konjugiertheit Hyperparameter bestimmen über Quantile („unwahrscheinlich“, „gleichwahrscheinlich“) über Momente (Erwartung, Median) mit Programm Elicitor (WinBUGS für logistische Regression) 54. GMDS, Essen 09.09.2009

Beispiel: historische Kontrolle – – MCMC 1 – 2 – 3 Prior 1 2 3 – – Beispiel: historische Kontrolle Fauchére J-C, Dame C, Vonthein R, Koller B, Arri S, Wolf M, Bucher HU. An approach to using recombinant erythropoietin for neuroprotection in very preterm infants. Pediatrics 2008:122:375-82 54. GMDS, Essen 09.09.2009

Beispiel: historische Kontrolle – – MCMC 1 – 2 – 3 Prior 1 2 3 – – Beispiel: historische Kontrolle … 54. GMDS, Essen 09.09.2009