2tes Projekttreffen Januar 2008

Slides:



Advertisements
Ähnliche Präsentationen
Anzahl der ausgefüllten und eingesandten Fragebögen: 211
Advertisements

Business Intelligence Jan Weinschenker
Lösung Problem Z01 Manfred Reichenbächer, Jürgen Popp
im Rahmen der Vorlesung
40 ∙ 1,05 = 42 Der Änderungsfaktor q ∙ 1,05
Daten fließen lassen XML in Microsoft Office 2003 Lorenz Goebel Frank Fischer
Telefonnummer.
Spektroskopische Methoden in der Organischen Chemie (OC IV)
1 Energiebewusste Compilierung für digitale Signalprozessoren Markus Lorenz Peter Marwedel Universität Dortmund Lehrstuhl Informatik XII Projekt Prozessorarchitekturen.
Quantitative RT-PCR an nativen Prostatakarzinom-Biopsien: Etablierung der Technik und erste vergleichende Ergebnisse Medizinische Fakultät Universitätsklinikum.
Gruppe: Karsten Dankesreiter Felix Leibe Betreuender Dozent: Prof. J. Walter Informationstechnik Projekt Ws 2003/04 Audio-SnEYEper
EF: Standards + H2O red = H2O.
ATHOS Benutzertreffen 27.September Report of the Lab Glashütten, 27.September 2007 HighQSoft GmbH, Karst Schaap
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
STREAMDATA 10° 8° E N 48° 50° Pforzheim Stuttgart Nagold Enz Neckar Höhe [m] Rhein Schwäbische Alb Schwarzwald STREAMDATA Titel: Streamflow data.
Computerkurs: Quantitative Auswertung biochemischer Experimente
Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.
Modellvergleich.
Anwendungsseminar: Kausale Modellbildung
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Entwicklung von Simulationsmodellen WS 2007/08 Dr. Falk-Juri Knauft Mittwoch 9.15 Uhr – Uhr S25 Praktikum zur Entwicklung von Simulationsmodellen:
Visuelle Analyse der Mathetests
Programmiermethodik SS2007 © 2007 Albert Zündorf, University of Kassel 1 5. Test-First Prinzip Gliederung: 1. Einführung 2. Objektdiagramme zur Analyse.
PowerPoint-Folien zur 5. Vorlesung „Bionik II / Biosensorik“
Classification of Credit Applicants Using Data Mining. Thema.
Prof. Dr. Bernhard Wasmayr VWL 2. Semester
AWA 2007 Natur und Umwelt Natürlich Leben
Kathrin Egberts Max-Planck-Institut für Kernphysik, Heidelberg
Programmiermethodik SS2007 © 2007 Albert Zündorf, University of Kassel 1 5. Test-First Prinzip Gliederung: 1. Einführung 2. Objektdiagramme zur Analyse.
Programmiermethodik SS2007 © 2007 Albert Zündorf, University of Kassel 1 5. Test-First Prinzip Gliederung: 1. Einführung 2. Objektdiagramme zur Analyse.
Konzeption und Realisierung von DSS
INSTITUT FÜR DATENTECHNIK UND KOMMUNIKATIONS- NETZE 1 Harald Schrom ViEWcon08.
Technische Universität München Lehrstuhl für Kommunikationsnetze Prof. Dr.-Ing. W. Kellerer Diplomarbeits-/Studienarbeits-/Bachelors Thesis Abschlussvortrag.
Technische Universität München Lehrstuhl für Kommunikationsnetze Prof. Dr.-Ing. W. Kellerer Diplomarbeits-/Studienarbeits-/Bachelors Thesis Zwischenvortrag.
Abschlusspräsentation Semesteraufgabe 2007
20:00.
Christian Schulz, Marc Thielbeer, Sebastian Boldt
Klicken Sie auf die Felder für weitere Informationen!
Anwendungsinformationen für Kabelmessungen mit ET 91
WLAN-Antennen selbstgebaut
Eine Einführung in die CD-ROM
Referent: Ralf Wollenberg 06/2009
1 Semiautomatische Medienresonanz- und Diffusions-Analyse Waltraud Wiedermann, GF APA-DeFacto und APA-MediaWatch Michael Granitzer, Know-Center.
55 Cnc hat 5 Planeten! Vera Steinecker.
mathe online und Medienvielfalt im Mathematikunterricht
Einführung in die Bearbeitung und Auswertung von 2D-NMR-Spektren
Technische Universität München Dr. Andreas Bauer – Lehrstuhl für Organische Chemie I – Praxisseminar III1 Organisch-Chemisches Grundpraktikum Praxisseminar.
Die Fourier-Analyse Durch die Fourier-Analyse wird ein Sprachsignal in Sinusoiden zunehmender Frequenz zerlegt, sodass wenn diese summiert werden, das.
Peter Grzybek Projekt # (FWF) Projekt # 43s9 (OEAD/SAIA) Graphem-Häufigkeiten.
NDK Enterprise Technologien Informationen Infrastruktur und Fallstudie Daniel Nydegger Studienleiter Enterprise System Entwicklung.
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
GAUSS – Promotionsprogramm für Umweltinformatik Georg-August-Universität Göttingen Wissenschaftliches Rechnen Robert Schaback Institut für Numerische und.
Verbundprojekt OUTSHORE Studie und Methodikentwicklung zur Beurteilung der Erfolgsfaktoren bei der Vergabe von Softwareprojekten an Niedriglohnländer.
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
Vienna University of Technology Pirker Simon 1. Überblick Definition Motivation Vorteile Entwurf von VP Pirker Simon 2.
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
Klassifikation und Regression mittels neuronaler Netze
So rechnet Deutschland
Forschungsprojekt Statistik 2013 „Jugend zählt“ – Folie 1 Statistik 2013 „Jugend zählt“: Daten zur Arbeit mit Kindern und Jugendlichen.
Projekt Messendorferstraße Graz TOP 1-33 /EG Wohnhaus 1 Grundstück 2 Schlafen10,28 m² Wohnen /Kochen 15,35 m² Diele 2,50 m² Bad mit WC 4,40m² Terrasse.
Folie Einzelauswertung der Gemeindedaten
1 Eagle I. 2 ● Videoformat:AVI, 30 fps ● Auflösung-Video:1280 x 720 Pixel ● Speicher:Micro-SD Karten Slot bis zu 16 GB, ab Class 4, besser Class 6 ● Speicherbedarf:ca.
Migration der HLA aus militärischen in zivile Domänen Steffen Straßburger, Uni MD Übersicht Die Vergangenheit Die Gegenwart Die Zukunft (?)
Informatik und Gesellschaft Andrea Kienle / Gabriele Kunau ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List.
Möglichkeiten der Visualisierung
EEG-Korrelate der Aktivierung kortikaler Objektrepräsentationen-1
Strukturmodelle: Systematik, State of the Art bearbeitet von: Dr. Gerhard Buck-Sorlin Institut für Pflanzengenetik und Kulturpflanzenforschung Gatersleben.
K. Desch - Statistik und Datenanalyse SS05
Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.
 Präsentation transkript:

2tes Projekttreffen Januar 2008 MetaSTEM 2tes Projekttreffen Januar 2008

Die Menschen des Datenanalyse-Teils im METASTEM-Projekt Thomas Villmann Frank-Michael Schleif Arbeitsgruppe Computational Intelligence Medizinische Fakultät Universität Leipzig {villmann,schleif}@informatik.uni-leipzig.de

Projektzeitplan – aktueller Stand

Automatische Analyse von NMR-Metabolitenspektren Fouriertransformation Phasenkorrektur Wasserpeakentfernung 1 Basislinienkorrektur Alignierung per DSS – Referenzsignals Peaklistenbestimmung 2 Simulationsspektren + Peaklisten Metabolitenidentifikation über passende Peaks oder Differenzspektren Quantifizierung 3

NMR-Analysis – Prototypisches Tool

Spektrendarstellung Fouriertransformiert ohne H2O Signal Einzelspektrum Basislinienkorrigiert mit gepickten Peaks Mehrspektrensicht

Automatisch annotierte Peaks (Farbe), Untergrund (blau) DSS Zoom in prozessiertes Signal im Frequenzbereich von 2200 – 3400 Hz

Automatische Metabolitenidentifikation Myo Inositol (gemessen) Myo Inositol (simuliert)

Automatische Metabolitenidentifikation - Fit

Automatische Metabolitenidentifikation Laktat-Signale, die in der FDCPMix-Messung (wahrscheinlich) wieder gefunden wurden Messung bzw. Simulation Peakliste FDCPMix - Messung (5 mM Glucose) Simulationsmessung (Lacktat)

Zusammenfassung – NMR Tool Vollautomatische Vorverarbeitung – H1 + DSS (FFT, Phasing, Wasserpeakentfernung, Smoothing, Baseline, Peakdetektion) Verschiedene Visualisierungsmöglichkeiten Identifikation der Metabolite ueber Peaklisten oder Shape (reine Quantifizierung) Manuell : geführt via Ident-Dialog Automatisch: Durchsatzprozessierung Elementare Peakshape-Modellierung möglich Exports (als txt oder xml): Roh / prozessiertes Spektrum Peaklisten – Single Spektrum Identifikationsergebnisse

Glucose-Test (Peak basiert) - Beispiel Mess Metabolit Konz. Kommentar M11 Citric-Ac ~2 Peakmatch, aber in Multiplet Lactate ~6 Quartet hat falsche Ratios M12 ~3 Wie f. M11 / 1 Peak fehlt Glutamine ?? 71% match – sieht gut aus Glycine ~7 Peakmatch – aber einf. Met. ~9 Quartet besser als bei M11 M13 ~5 Extrem schmale Peaks Schlechte Auflösung der Peaks Succinate

Sparse-Coding f. NMR Analyse Identifikation von Metaboliten möglich durch Differenzspektrenanalyse aller Kombinationen (i.A. manuell) durch Peakbasierte Identifikation auf Linienspektren Aufwendige Vorverarbeitung Differenzspektren mühsam (Peakshape) Peaklisten: Codierung-Peaklisten schwierig – „keine“ Shape nötig Alternative – Sparsecoding* (Ähnlichkeiten zu PCA) (Codierung mit wenig „Basisfunktionen“) Generiere erzeugenden System (Modellierung aus gemessenen und simulierten Daten) „Basisfunktionen“ aus Metaboliten Lerne Modell für Koeffizienten d. Basisfunktionen (Klassifikation) Mischkonzentrationen – durch Fuzzyassignments zwischen Basisklassen detektierbar *Details siehe Olshausen et al. Letters to Nature, 381, 1996

Erste Ergebnisse – auf Synthesen Trainingsdaten (D) 4 Metabolite (Alanine, Glutamine, Glycine, Serine) ~160 Spek Testdaten (T) Reine Metabolite (Ala, Glu, Gly, Ser) und paarweise Mischungen 10 Gruppen – insgesamt ca. 400 Spektren Prozedure Trainingsdaten für Sparse-Coding-Modell-Gen. D / T werden sparse kodiert (Koeffizienten) D für Lernen eines Klassifikationsmodells D / T zum Testen des Klassifikationsmodells = Metabolitenidentifikation

Schema für Sparsecoding in NMR Basic Prep D D* Sparse Coding Model-Gen D* SC-Model SC-Model C Sparse coder D* DTest* CTest

Schema für SC-Identifikation Classifier C M Modell C Modell applier M R Results CTest Klassifikationsmatrix für C R Fuzzyassignments für C,CTest Toplogische Visualisierung (Klassenähnlichkeiten)

Sparse-Coding – Ergebnisse 1 Hohe Zuordnung für Alanin (4) M: FLSOM Abbildung von D und T  M Fuzziness für Alanin – Klasse 1 Fuzziness für Glutamine (2) Fuzziness für Glycine (3) Fuzziness für Serine (4)

Sparse-Coding – Ergebnisse 2 Ala Gln Gly Ser 1/2 1/3 1/4 2/3 2/4 3/4 0.74 1.0 0.4 0.95 0.77 0.03 XXX 0.25 0.05 0.7 0.3 0.23 0.97 0.6 87% korrekt 4 bek. Klassen Unbek. (47% korr – 6 unbek. Klassen)

Peak-Coding – Ergebnisse 3 Ala Gln Gly Ser 1/2 1/3 1/4 2/3 2/4 3/4 0.9 0.03 0.1 0.82 1.0 0.18 0.92 0.97 Keine Fehlklassifikation bei Ala,Gln,Gly,Ser – nur missing classification (no match) Fehler primär wegen niedriger Intensitäten ca unter 5 selten korrekt 91% korrekt 4 bek. Klassen Unbek. (90% korr – 6 unbek. Klassen)

Zusammenfassung 1te Analyse (sehr w. Proben) – Vorgehen so machbar Plausibilität der Ergebnisse schwierig Peakverhältnisse beachten – aber dafür exakte Messungen / Mehrfachmessungen nötig Sehr niedrige Intensitäten – Peakpicking schwierig / Rauschprobleme Standardisierte Messung + hohe Messqualität + Mehrfachmessungen wichtig Shape basierter Match alternativ möglich (liefert prinzipiell einen Quantiätswert) Sparsecoding interessante Alternative – aber noch sehr experimentell + offene Probleme

Danke für die Aufmerksamkeit