Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

MetaSTEM 2tes Projekttreffen Januar 2008. Die Menschen des Datenanalyse-Teils im METASTEM-Projekt Thomas VillmannFrank-Michael Schleif Arbeitsgruppe Computational.

Ähnliche Präsentationen


Präsentation zum Thema: "MetaSTEM 2tes Projekttreffen Januar 2008. Die Menschen des Datenanalyse-Teils im METASTEM-Projekt Thomas VillmannFrank-Michael Schleif Arbeitsgruppe Computational."—  Präsentation transkript:

1 MetaSTEM 2tes Projekttreffen Januar 2008

2 Die Menschen des Datenanalyse-Teils im METASTEM-Projekt Thomas VillmannFrank-Michael Schleif Arbeitsgruppe Computational Intelligence Medizinische Fakultät Universität Leipzig

3 Projektzeitplan – aktueller Stand

4 Automatische Analyse von NMR-Metabolitenspektren Fouriertransformation Phasenkorrektur Wasserpeakentfernung Basislinienkorrektur Alignierung per DSS – Referenzsignals Peaklistenbestimmung 1 2 Simulationsspektren + Peaklisten Metabolitenidentifikation über passende Peaks oder Differenzspektren Quantifizierung 3

5 NMR-Analysis – Prototypisches Tool

6 Spektrendarstellung Einzelspektrum Mehrspektrensicht Fouriertransformiert ohne H 2 O Signal Basislinienkorrigiert mit gepickten Peaks

7 Zoom in prozessiertes Signal im Frequenzbereich von 2200 – 3400 Hz Automatisch annotierte Peaks (Farbe), Untergrund (blau) DSS

8 Myo Inositol (gemessen) Myo Inositol (simuliert) Automatische Metabolitenidentifikation

9 Automatische Metabolitenidentifikation - Fit

10 Automatische Metabolitenidentifikation Simulationsmessung (Lacktat) Messung bzw. Simulation Peakliste FDCPMix - Messung (5 mM Glucose) Laktat-Signale, die in der FDCPMix- Messung (wahrscheinlich) wieder gefunden wurden

11 Zusammenfassung – NMR Tool Vollautomatische Vorverarbeitung – H1 + DSS (FFT, Phasing, Wasserpeakentfernung, Smoothing, Baseline, Peakdetektion) Verschiedene Visualisierungsmöglichkeiten Identifikation der Metabolite ueber Peaklisten oder Shape (reine Quantifizierung) – Manuell : geführt via Ident-Dialog Automatisch: Durchsatzprozessierung Elementare Peakshape-Modellierung möglich Exports (als txt oder xml): – Roh / prozessiertes Spektrum – Peaklisten – Single Spektrum – Identifikationsergebnisse

12 Glucose-Test (Peak basiert) - Beispiel MessMetabolitKonz.Kommentar M11Citric-Ac~2Peakmatch, aber in Multiplet M11Lactate~6Quartet hat falsche Ratios M12Citric-Ac~3Wie f. M11 / 1 Peak fehlt M12Glutamine??71% match – sieht gut aus M12Glycine~7Peakmatch – aber einf. Met. M12Lactate~9Quartet besser als bei M11 M13Glycine~5Extrem schmale Peaks M13Lactate~6Schlechte Auflösung der Peaks M13Succinate~2Extrem schmale Peaks

13 Sparse-Coding f. NMR Analyse Identifikation von Metaboliten möglich – durch Differenzspektrenanalyse aller Kombinationen (i.A. manuell) – durch Peakbasierte Identifikation auf Linienspektren Aufwendige Vorverarbeitung – Differenzspektren mühsam (Peakshape) – Peaklisten: Codierung-Peaklisten schwierig – „keine“ Shape nötig Alternative – Sparsecoding* (Ähnlichkeiten zu PCA) (Codierung mit wenig „Basisfunktionen“) – Generiere erzeugenden System (Modellierung aus gemessenen und simulierten Daten) – „Basisfunktionen“ aus Metaboliten – Lerne Modell für Koeffizienten d. Basisfunktionen (Klassifikation) – Mischkonzentrationen – durch Fuzzyassignments zwischen Basisklassen detektierbar *Details siehe Olshausen et al. Letters to Nature, 381, 1996

14 Erste Ergebnisse – auf Synthesen Trainingsdaten (D) 4 Metabolite (Alanine, Glutamine, Glycine, Serine) ~160 Spek Testdaten (T) Reine Metabolite (Ala, Glu, Gly, Ser) und paarweise Mischungen 10 Gruppen – insgesamt ca. 400 Spektren Prozedure – Trainingsdaten für Sparse-Coding-Modell-Gen. – D / T werden sparse kodiert (Koeffizienten) – D für Lernen eines Klassifikationsmodells – D / T zum Testen des Klassifikationsmodells = Metabolitenidentifikation

15 Schema für Sparsecoding in NMR D NMR Basic Prep Sparse Coding Model-Gen D* C SC-Model D*D Test * Sparse coder C Test

16 Schema für SC-Identifikation Classifier Modell applier M R C Modell C C Test M Results R Klassifikationsmatrix für C Fuzzyassignments für C,C Test Toplogische Visualisierung (Klassenähnlichkeiten)

17 Sparse-Coding – Ergebnisse 1 Fuzziness für Alanin – Klasse 1 Fuzziness für Glutamine (2) Fuzziness für Glycine (3) Fuzziness für Serine (4) Hohe Zuordnung für Alanin (4) M: FLSOM Abbildung von D und T  M

18 Sparse-Coding – Ergebnisse 2 AlaGlnGlySer1/21/31/42/32/43/4 Ala0.74 Gln Gly0.95 Ser /2XXX 1/ /40.3 2/ /40.6 3/4XXX 87% korrekt 4 bek. Klassen Unbek. (47% korr – 6 unbek. Klassen)

19 Peak-Coding – Ergebnisse 3 AlaGlnGlySer1/21/31/42/32/43/4 Ala Gln0.82 Gly Ser / /30.9 1/40.9 2/ / / % korrekt 4 bek. Klassen Unbek. (90% korr – 6 unbek. Klassen)

20 Zusammenfassung 1te Analyse (sehr w. Proben) – Vorgehen so machbar Plausibilität der Ergebnisse schwierig – Peakverhältnisse beachten – aber dafür exakte Messungen / Mehrfachmessungen nötig – Sehr niedrige Intensitäten – Peakpicking schwierig / Rauschprobleme – Standardisierte Messung + hohe Messqualität + Mehrfachmessungen wichtig Shape basierter Match alternativ möglich (liefert prinzipiell einen Quantiätswert) Sparsecoding interessante Alternative – aber noch sehr experimentell + offene Probleme

21 Danke für die Aufmerksamkeit


Herunterladen ppt "MetaSTEM 2tes Projekttreffen Januar 2008. Die Menschen des Datenanalyse-Teils im METASTEM-Projekt Thomas VillmannFrank-Michael Schleif Arbeitsgruppe Computational."

Ähnliche Präsentationen


Google-Anzeigen