Genexpressionsanalyse

Slides:



Advertisements
Ähnliche Präsentationen
Eulerscher Polyedersatz
Advertisements

Rekursion: Rekurrenz: Algorithmen rufen sich selbst (rekursiv) auf.
Falls Algorithmen sich selbst rekursiv aufrufen, so kann ihr Laufzeitverhalten bzw. ihr Speicherplatzbedarf in der Regel durch eine Rekursionsformel (recurrence,
Eine dynamische Menge, die diese Operationen unterstützt,
Vom graphischen Differenzieren
Indizierung von Graphen durch häufige Subgraphen (2)
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Suche in Texten (Stringsuche )
Dr. Roland Keilhoff HIS GmbH
Individualisierte Medizin am Inselspital Genetik und Perioperative Medizin.
Sortierverfahren Richard Göbel.
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Heuristiken Automatic Problem Solving Institut für Informatik
Algorithmentheorie 04 –Hashing
WS Algorithmentheorie 02 - Polynomprodukt und Fast Fourier Transformation Prof. Dr. Th. Ottmann.
1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (02 – Funktionenklassen) Prof. Dr. Th. Ottmann.
Prof. Dr. S. Albers Prof. Dr. Th. Ottmann
Bestimmung des Next-Arrays im KMP-Algorithmus
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (02 – Funktionenklassen) Tobias Lauer.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen Halbzeit: Was haben wir bisher gelernt? Prof. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (21 – Kürzeste Wege) T. Lauer.
Geometrisches Divide and Conquer
Computerkurs: Quantitative Auswertung biochemischer Experimente
Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.
PG 520 Intelligence Service – gezielte Informationen aus dem Internet
Anwendungen der PCR und von Hybridisierungstechniken
DNA - Sequenzierstrategien
Wir suchen ‘ mit m = m    ‘ c  ‘ mod 26
Normalformen Normalisieren Schlüssel
6 Normalformen Normalisieren Schlüssel
Experimentaufbau und -design
Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.
Univariate Statistik M. Kresken.
Lohnentwicklung im Lebenszyklus
Ralf KüstersDagstuhl 2008/11/30 2 Ralf KüstersDagstuhl 2008/11/30 3.
Das wars!.
Vorlesung: ANOVA II.
Vorlesung: Vorverarbeitung von Affymetrix-Daten
Termin Thema 20. Okt Microarray-Technologien, Grundlagen der Datenanalyse 27. Okt Normalisierung von Microarrays I Normalisierung von Microarrays II 3.
Die Zelle – ein komplexes Ding. RNA-Polymerasen PM MM FeatureProbe Pair Wilcoxon test nicht-parametrisch gepaart Testet PM > MM Gesättigter Wert Berechnung.
Real Time Analysis in Real Time
Daten auswerten Boxplots
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Polynome und schnelle Fourier-Transformation
Kennwerte und Boxplots
Auslegung eines Vorschubantriebes
STATISIK LV Nr.: 0028 SS Mai 2005.
Modul Statistische Datenanalyse
Affymetrix GeneChips ® Ein bis ins Detail patentiertes Produkt Kurzvortrag Marion Koch, Philipp Stiefel Patent- und Lizenzvertragsrecht.
Translation und Transkription
Ein Überblick über verschiedene Verfahren
Prof. Dr. Helmut Erdmann Flensburg University of Applied Sciences
Fließbandarbeit in der Zelle – oder – Die Geburt eines Proteins
Statistische Methoden in der Wirtschafts- und Sozialgeographie
SOTA Andrej Gisbrecht
Verteilung demethylierter (a) bzw. methylierter (b) CpGs von Genen mit
Statistik – Regression - Korrelation
Analyse der Laufzeit von Algorithmen
Was muss der Nutzer tun? Für die Projektplanung ist es essentiell, sich vorher Gedanken über folgende Punkte zu machen: experimentelles Design RNA-Isolation.
Erheben, berechnen und darstellen von Daten
Die identische Reduplikation
Computer Algebra für Brüche --- angepasst an Ausbildungszwecke
The PicSOM Retrieval System 1 Christian Steinberg.
Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung.
Gene Prediction Marco Block Jonas Heise Nima Keshvari Michael Schreiber.
Focusing Search in Multiobjective Evolutionary Optimization through Preference Learning from User Feedback Thomas FoberWeiwei ChengEyke Hüllermeier AG.
Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.
Das Problem des Handlungsreisenden
 Präsentation transkript:

Genexpressionsanalyse Diplomarbeit 1. Referat Mohammad Esad-Djou

Genexpressionsanalyse Ziele Beschreibung der Probleme Überblicke: Biologischer Hintergrund Pre-Processing Stand der Forschung Zielsetzung der Diplomrbeit 04.11.2005 Genexpressionsanalyse

Genexpressionsanalyse Gliederung Problemstellung Biologischer Hintergrund Biologische Datenbanken Pre-Processing Backgrund-Korrektion Normalisierung PM Korrektion Summarization/ Aggregation Stand der Forschung: GeWare Ziel der Diplomarbeit Zusammenfassung Literatur 04.11.2005 Genexpressionsanalyse

Genexpressionsanalyse Einführung Genexpressionsanalyse Grosse Bedeutung in vielen Bereichen biomedizinischer Forschung Ausbildung der einem Gen inhärenten Eigenschaften GeneChip-Technologie: Hybridisierung von Nukleinsäurefragmenten an immobilisierten Probes Probe: 25mere Oligonukleotide 04.11.2005 Genexpressionsanalyse

Problemstellung: Messung und Analyse 04.11.2005 Genexpressionsanalyse

Genexpressionsanalyse Problemstellung Messung der Genexpression: Suche nach Genen mit gleicher Expression bzw. differenzieller Expression Techniken: Northern Blotting, SAGE, Microarray,… Vorhandene Verfahren zur Messung und Analyse sind nicht zufridend! Optimierung vorhandener Verfahren, um präzise und effektive Genexpressionsanalyse möglich zu sein. 04.11.2005 Genexpressionsanalyse

Überblicke: Biologische Hintergrund Grundbegriffe: Gen, Protein, Nukleotide, Codon, DANN, RNA, Basenpaar… Entstehung der Proteine Replikation: Verdoppelung der DNA Transkription: umschreiben der DANN in RNA während der Genexpression Translation: Übersetzung der mRNA in Proteine. Synthese eines Proteins an einer mRNA während der Genexpression 04.11.2005 Genexpressionsanalyse

Überblicke: „Materielle Verarbeitung“ Weg des Experimentes von der Probenentnahme bis zum Scannen eines Chips Kombination der Photolithographie und kombinatorischen Chemie 04.11.2005 Genexpressionsanalyse

Überblicke: „Materielle Verarbeitung“ Entstehung der Proben, die an einem Silizium-Wafer festgelegt ist Proben: 25mere Oligonukleotide 04.11.2005 Genexpressionsanalyse

Überblicke: „Materielle Verarbeitung“ Fragmentierung der cRNA mit Hilfe von Metallsalzen und Hitze Hybridisierung: Doppelstrangbildung von komplementären einzelsträngigen DNA- und/oder auch RNA-Molekülen. Waschen, Färben, Scannen: letzte Schritte vor „Imageanalyse“ GeneChip Probe Array 04.11.2005 Genexpressionsanalyse

Überblicke: „Materielle Verarbeitung“ 04.11.2005 Genexpressionsanalyse

Überblicke: Datenanalyse Übergang von materielle Ebene zur Pre-Processing Image Analyse: gespeicherte Informationen wird durch Computer analysiert und eine optimierte Image erstellt Grund: Probleme bei Vorbereitung in materielle Ebene, z.B. Räumliche Effekte, wie die geschmierten Fläche durch Staub auf den Dia usw. 04.11.2005 Genexpressionsanalyse

Überblicke: Biologische Datenbanken 04.11.2005 Genexpressionsanalyse

Überblicke: Biologische Datenbanken 04.11.2005 Genexpressionsanalyse

Pre-Processing: Backgrundkorrektion - MAS 4.0 Average Difference: PM – MM Betrachte alle Differenzen ohne Minimum und Maximum. Berechne das getrimmte Mittel y und Standardabweichung sy aus verbleibenden Differenzen. Eliminiere nun aus allen Differenzen die, die außerhalb von liegen. 04.11.2005 Genexpressionsanalyse

Pre-Processing: Backgrundkorrektion - MAS 5.0 Micro Array Suite: Standard Pre-Processings- verfahren in Affymetrix MAS 5.0: Verwendet beide PM und MM Proben Pre-Processing der Probe-Zelle-Intensitäten: Background Subtraction und Noise Correction. Justierung Tukey’s Biweight Estimator-Algorithmus Chip: k-dimentionale Array (Default = 16) Berechnung des Hintergrundes bk und Noise-Value nk Erhalten des probespezifischen Hintergrundes B(x,y) bzw. einer Noise-Value n(x,y) durch Berechnen einer bewerteten Summe alles bk und nk B(x,y) ist subtrahiert von der roh Intensität: Falls < n(x,y), dann ersetzte die Probe-Intensität durch n(x,y) 04.11.2005 Genexpressionsanalyse

Genexpressionsanalyse MAS 5.0: Ideal Mismatch Problem: Falls physische Schätzung für BG möglich, sonst unmöglich Abschätzung IM: auf Basis unserer Kenntnis vom ganzen Probe-Mengen oder auf dem Benehmen von Untersuchungen im Allgemeinen Diese Schätzung kann auch auf dem durchschnittlichen Verhältnis zwischen PM und MM, oder (wenn dieses Maß selbst zu klein ist) ein Wert, leicht kleiner als PM basiert werden. Bestimmung des Hintergrundbruchvertreters: One-Step Biweight Algorithmus (Tbi) Biweight Specific Background (SB) für Probe-Paar j in Probe-Menge i: 04.11.2005 Genexpressionsanalyse

Genexpressionsanalyse MAS 5.0: Ideal Mismatch Drei Fälle: 04.11.2005 Genexpressionsanalyse

Genexpressionsanalyse MAS 5.0: Ideal Mismatch Probe-Wert und Signal Log Value Berechnung der idealen Abweichungswert: Probe-Wert: Schätzung der absoluten Expressionswert für Probe-Menge: Skalierte Probe-Wert: Wenn die Algorithmeneinrichten alle oder gewählte skalierte Probe-Mengen auf ein Ziel indizieren, wird ein gewicht Faktor (sf ) berechnet: 04.11.2005 Genexpressionsanalyse

Genexpressionsanalyse MAS 5.0: Ideal Mismatch Der berichtete Wert der Probe-Menge i ist: Normalisierungsfaktor (nf): mit Scaled Probe Value: 04.11.2005 Genexpressionsanalyse

MAS 5.0: One-Step Tukey’s Biweight Algorithm eine Methode, um ein robustes Mittel unbeeinflusst von Outlier zu bestimmen. Bestimmung des Zentrum die Median der Daten Bestimmung des Abstandes von jedem Datenpunkt von der Median, um zu bestimmen, wie viel jeder Wert zum Mittel beitragen sollte Berechnung der Gewichte: korrigierten Werte können jetzt durch Verwenden der One-Step w-schätzen berechnet werden: 04.11.2005 Genexpressionsanalyse

MAS 5.0: Nachteil - Verrechnung Hauptnachteil: Man kann gleichzeitig nur zwei Proben vergleichen! Dies kommt schnell aus Hand heraus (ausarten, ausufern), wenn man komplexe Versuche durchführt. Die Analyse basiert auf PM-MM Modell MAS 5.0 (Siehe Folie 17): log (PMij – CTij) = log (qi) + eij, j = 1, …, J CT: replaces MM when MM>PM (avoid log of neg. numb.) qi: expression quantity on array eij: error i: arrays j: probe pairs Problem: error does not have equal variance for j = 1, …, J >> larger mean intensities have larger variances! Signal wird mit Gewalt positiv gestellt. Der „Ideal Match“ ist Mismatch plus . Dadurch viele sehr kleine Signale. 04.11.2005 Genexpressionsanalyse

MAS 5.0: Consequences for Datanalyse 04.11.2005 Genexpressionsanalyse

MAS 5.0: Consequences for Datanalyse 04.11.2005 Genexpressionsanalyse

Genexpressionsanalyse Fragen? Fragen? 04.11.2005 Genexpressionsanalyse