Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 1 Hauptseminar Bioinformatik Wintersemester 2003/2004 Pierre Baldi & Soren Brunak: Bioinformatics: The Machine Learning Approach
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 2 Thema Das Hauptseminar diskutiert probabilistische Modelle und Techniken des maschinellen Lernens für Bioinformatik Probleme. Es werden grundlegende Konzepte und Algorithmen sowie aktuelle Anwendungen behandelt. Die Seminarthemen orientieren sich am Buch von Pierre Baldi & Soren Brunak: Bioinformatics, The machine learning approach, Cambridge University Press, 2001.
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 3 Vortragsthemen und Termine Machine Learning Foundations Machine Learning in Bioinformatics Machine Learning Algorithms Neural Networks, Non-linear Class.: Theory and Algorithms Neural Networks: Bioinformatics Applications HMMs: Theory and Algorithms HMMs: Bioinformatics Applications Tree HMMs Probabilistic Graphical Models Phylogenetic Trees Stochastic Grammars Microarrays and Gene Expression Support Vector Machines: Theory and Algorithms Support Vector Machines: Bioinformatics Applications Maximum Likelihood and Bayesian Parameter Estimation Es sind folgende Themen zu folgenden Sitzungen vorgesehen.
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 4 Teilnehmer
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 5 Vortragsthemen und Termine Machine Learning Foundations Machine Learning in Bioinformatics Ostern Machine Learning Algorithms Neural Networks, Non-linear Class.: Theory and Algorithms Neural Networks: Bioinformatics Applications HMMs: Theory and Algorithms HMMs: Bioinformatics Applications Probabilistic Graphical Models Pfingsten Phylogenetic Trees Stochastic Grammars Microarrays and Gene Expression Support Vector Machines: Theory and Algorithms Support Vector Machines: Bioinformatics Applications Es sind folgende Themen zu folgenden Sitzungen vorgesehen.
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 6 Administrativa Teilnehmer: –Bioinformatiker im Hauptstudium. –Informatiker als Vertiefungsgebiet. Vorkenntnisse: –Gute Kenntnisse in Algorithmen. –Algorithmische Bioinformatik. Literatur: –Pierre Baldi & Soren Brunak: Bioinformatics, The machine learning approach, Cambridge University Press, –Jun S. Liu: Bayesian Modeling and Computation in Bioinformatics Research, Chapter 2, 11-44, in T.Jiang, Y.Xu, and M.Q.Zhang (Eds.), Current Topics in Computational Molecular Biology, MIT Press, –David J.C. MacKay, Bayesian Interpolation, Neural Computation 4, , –Jefferys and Berger, Ockham's razor and Bayesian analysis, American Scientist 80:64-72, –Edwin T. Jaynes, Probability Theory – The Logic of Science, –Durbin, Eddy, Krogh, Mitchison: Biological Sequence Analysis - Probabilistic models of proteins and nucleic acids, Cambridge Univ. Press, 1998
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 7 Seminar Bioinformatik Vorbereitung –Reader: Baldi&Brunak, Bioinformatics, The Machine Learning Approach, 2nd Edition, MIT Press Chapter: Introduction Appendix with Introduction to –Statistics, –Information Theory, –Probabilistic Graphical Models, –HMM Technicalities, –Kernel Methods and SVMs –Suche nach zusätzlichem aktuellem Paper zum Thema Referenzen des Kapitels Aktuelle Procedings von ISMB/RECOMB/PSB/GCB/ECCB Konferenzen –Diskussion des Stoffes (Kapitel + zusätzliches aktuelles Paper mit dem Betreuer)
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 8 Seminar Bioinformatik Thema: Worum gehts ? Vorstellungen / Erwartungen ? Sitzungen, Raum + Hilfsmittel Literatur, Bücher (Lehrbücher, Inhalt+Autoren+...), Zeitschriften Gestaltung –Vorträge der Teilnehmer –Handouts –Fragen während der Vorträge –Diskussion –Ausarbeitung Vorstellung der Themen Themenvergabe Aufgabe
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 9 Seminar Bioinformatik 2 stündige Sitzungen während des Semesters: –Mo (Raum ???, Theresienstraße 39) vermutlich im Seminarraum 1 Amalienstr. 17 Sitzung –Vortrag eines Teilnehmers zu festgelegtem Thema –Fragen während der Präsentation –Diskussion nach Präsentation (Inhalt und Vortragsstil) –Seminarteilnehmer beteiligen sich an der Diskussion Verständnisfragen Ergänzungen –Querbezüge zum eigenen Thema im Rahmen des Seminars Organisation und Ablauf des Seminars
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 10 Seminar Bioinformatik Ziel –(Selbständiges) Erarbeiten und Erlernen eines Themas –Didaktische Aufbereitung des Themas für Zuhörer (Fragen und Unterbrechungen durch Zuhörer sind zu erwarten!) –Wissensvermittlung für die anderen Teilnehmer Fragen können zum Verständnis des Stoffes beitragen... auch für andere Teilnehmer ! Keine Sabotage des Vortragenden –Schein Präsentation
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 11 Seminar Bioinformatik 1.Themenauswahl –Angegebene Literatur steckt i.w. nur den Rahmen des Themas ab –... ist nicht vollständig ! 2.Literatursuche ausgehend von angegebener Literatur und Referenzen, für –Ausarbeitung –Präsentation –Fragen der Teilnehmer bezüglich behandeltem Stoff in Vortrag und Ausarbeitung ! 3.Verständnis 4.Entwurf der schriftlichen Ausarbeitung –ca 10 Schreibmaschinenseiten (inkl. Abbildungen) –Referenzen auf verwendete Literatur –Details ! 5.Entwurf der Präsentation –nicht identisch mit Ausarbeitung –weniger Details, Prioritäten setzen ! –didaktische Aufarbeitung Organisation und Vorbereitung der Präsentation
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 12 Seminar Bioinformatik Entwurf der Präsentation –Nicht identisch mit Ausarbeitung –Weniger Details, Prioritäten setzen ! –Didaktische Aufarbeitung Vortrag –ca Minuten Zeit (mit Fragen) –ca. 20 Min Diskussion –Proben Sie den Vortrag ! –Üben Sie die sprachliche Formulierung, insbesondere wenn Deutsch nicht Ihre Muttersprache ist Präsentation Folien –Lesbar ! (max 12 Zeilen pro Folie) –nicht zuviel Text / Formeln pro Folie –Nur das was auch besprochen wird (z.B. keine Formeln und Beweise, die dann nicht erläutert werden) –konsistente Nutzung von Schriften, Typen, Symbolen, Farben –max 20 Folien, die durchgesprochen werden sollen –Anschaulich ! Formale Diskurse in die Ausarbeitung ! –Tafel – Folien - Beamer
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 13 Seminar Bioinformatik 1.Entwurf der Ausarbeitung (Text) 2.Entwurf der Präsentation (Folien) 3.Vorbesprechung (Probevortrag, Folien, Handout) 1 Woche vor dem Vortrag, (bei Fragen oder Problemen vorher !) Handout: knappe Zusammenfassung des Themas mit den wichtigsten Fakten und Referenzen Ausarbeitung 4.Vortrag (Folien, Handout) 5.(aktive) Teilnahme (Diskussion !) an allen Sitzungen Ablauf
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 14 Seminar Bioinformatik Ist der Vortrag auch für andere Teilnehmer nützlich ? –Ist die Gliederung nachvollziehbar, klar und verständlich ? –Wieviele Teilnehmer erinnern sich nach dem Seminar an meinen Vortrag ? –Wieviele können dann noch das Thema und Hauptergebnis nennen (z.B. bei einer Prüfungsfrage ?) –Ist die Ausarbeitung nützlich zum Einstieg in das Thema und/oder zur Prüfungsvorbereitung ?... im Vergleich zur Original-Literatur ? Bewertung Wie kommt der Vortrag bei den Teilnehmern an ? –Spannend, interessant, langweilig ? –Gab es Fragen während des Vortrags ? –War die Diskussion aktiv und interessant ? –Wieviele Fragen konnte ich beantworten ?
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik: Hauptseminar Bioinformatik WS2003/04 15 Seminar Bioinformatik Nichterscheinen bei Vorbesprechung Grobe Verletzung der zeitlichen Organisation des Vortrags Grobe Mängel bei: –Folien und/oder Tafelbild –Sprachliche Präsentation –Verständnis des Themas –Beantwortung der Fragen Grobe Mängel bei der Ausarbeitung (Kopie der Folien,...) Nichtabgabe der Ausarbeitung, Handout Schein Mitverantwortung und Teilverpflichtung für das Gelingen der Lehrveranstaltung !