Density Estimation Tim Pfeifle Technische Universität München Fakultät für Informatik Garching, 08. June 2017
What is a probability density? Tim Pfeifle
Why do we need density estimation? Initial investigation Presenting results Intermediate product Tim Pfeifle
Parametric/Nonparametric Non-parametric statistics: + No assumptions of the shape of the distribution. ÷ The estimation of the distribution is uncertain when few data. Parametric statistics: + The estimated distribution converge faster to the true distribution than the non-parametric distribution. ÷ The distribution assumption might be wrong. Tim Pfeifle [https://ned.ipac.caltech.edu/level5/March02/Silverman/Silver1_2.html]
Histogram bin-width 2 Tim Pfeifle
Histogram bin-width 2 bin-width 10 Tim Pfeifle
Histogram Discontinous Starting position x0 = 5 Tim Pfeifle
Kernel Density Estimator sum of „bumps“ placed at the observations B.W.Silverman [University of Western Australia, Intro2KDE] Tim Pfeifle
Different Kernels [http://scikit-learn.org/stable/modules/density.html] Tim Pfeifle
Smoothing KDE Adaptive Methods Tim Pfeifle [University of Western Australia, Intro2KDE] Adaptive Methods [http://scikit-learn.org/stable/modules/density.html] Tim Pfeifle
Thank you for your attention! Questions? Tim Pfeifle
Backup
Curse of dimensionality Fläche zwischen der Wahrscheinlichkeitsdichtefunktion und der x-Achse von einem Punkt a bis zu einem Punkt b der Wahrscheinlichkeit entspricht, einen Wert zwischen a und b zu erhalten. Nicht der Funktionswert der Wahrscheinlichkeitsdichtefunktion ist somit relevant, sondern die Fläche unter ihrem Funktionsgraph, also das Integral. Im diskreten Fall: Wahrscheinlichkeiten von Ereignissen durch Aufsummieren der Wahrscheinlichkeiten der einzelnen Elementarwahrscheinlichkeiten. Im kontiniuerlichen Fall (z.B. Größe von Menschen (ein Haar größer, …)): Wahrscheinlichkeitsdichtefunktionen nützlich. Damit Wahrscheinlichkeit für beliebiges Interval (z.B. Größe 1,80 – 1,90) bestimmen, obwohl unendlich viele Werte dazwischen Tim Pfeifle