“Visualisierung in der Bioinformatik” Genom – Visualisierung

Slides:



Advertisements
Ähnliche Präsentationen
Identifizierung und Ausbildung von Führungskräften
Advertisements

Powerpoint-Präsentation
Fast Fourier Transformation
DNA Allgemeine Informationen zur DNA Aufbau der DNA
Proteinbiosynthese Demo-Version e-book von S.Heim.
CPCP Institute of Clinical Pharmacology AGAH Annual Meeting, 29. Februar 2004, Berlin, Praktischer Umgang mit den Genehmigungsanträgen gemäß 12. AMG Novelle.
Vorlesung Biologie für Mediziner (Bölker FB17)
Die DNA und ihr Aufbau.
Pflege der Internetdienste
Ontologien- Query 1 Teil2
Zentrales Dogma DNA-Replikation DNA Transkription Reverse
Proteinbiosynthese.
Stefanie Selzer - Pascal Busch - Michael Kropiwoda
Scratch Der Einstieg in das Programmieren. Scatch: Entwicklungsumgebung Prof. Dr. Haftendorn, Leuphana Universität Lüneburg,
© 2006 W. Oberschelp, G. Vossen Rechneraufbau & Rechnerstrukturen, Folie 2.1.
EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido
Technik Gestaltung Navigation Daten. Übersicht Client Webbrowser InternetServer.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik I Vorlesung Listen-
PKJ 2005/1 Stefan Dissmann Rückblick auf 2005 Was zuletzt in 2005 vorgestellt wurde: Klassen mit Attributen, Methoden und Konstruktoren Referenzen auf.
PKJ 2005/1 Stefan Dissmann Zusammenfassung Bisher im Kurs erarbeitete Konzepte(1): Umgang mit einfachen Datentypen Umgang mit Feldern Umgang mit Referenzen.
Rigi und Web2Rsf vorgestellt von Tobias Weigand. Inhalt Ziel von Web2Rsf und Rigi Vorstellung des Parsers Web2Rsf Vorstellung des Werkzeugs Rigi Analyse.
DNA - Sequenzierstrategien
Vorlesung 3: Verschiedenes Universität Bielefeld – Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin
Analyse von DNA-Sequenzen
Inhalte und Maßnahmen eingegeben haben,
Kennlinie Lichtregelung in JavaNNS Version 1.1
Ralf KüstersDagstuhl 2008/11/30 2 Ralf KüstersDagstuhl 2008/11/30 3.
Biologische Datenbanken
Bild 1.1 Copyright © Alfred Mertins | Signaltheorie, 2. Auflage Vieweg+Teubner PLUS Zusatzmaterialien Vieweg+Teubner Verlag | Wiesbaden.
20:00.
Inhalt Was ist A-Plan? Einsatzgebiete Organisation der Daten
SK / , , in Hochkössen und der Wildschönau flow Ski- und Snowboardschule Intersport Menzel.
TWS/Graph HORIZONT Produkt-Präsentation Software für Rechenzentren
1 Fachtagung am Seniorenorientiertes Design und Marketing ThyssenKrupp Immobilien Design for all - Anpassungen im Wohnungsbestand 1.Demographie.
MOL.504 Analyse von DNA- und Proteinsequenzen
Solikamsker pädagogisches College von Ramenskij
...ich seh´es kommen !.
HTML-Editoren Eine Präsentation von Erik Kulisch.
Was soll und kann eine fachdidaktische Vorlesung leisten? Maximilian Selinka.
Sichern und Retten bei Arbeiten in Höhen und Tiefen
Analyse von Ablaufdiagrammen
HORIZONT 1 XINFO ® Das IT - Informationssystem HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 /
HORIZONT 1 XINFO ® Das IT - Informationssystem PL/1 Scanner HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 / 540.
Publikation auf Knopfdruck Judith Riegelnig Michael Grüebler 19. Oktober 2010 / Statistiktage Neuenburg.
Dallinger Georg, 8.A BRG Schloss Wagrain
Translation und Transkription
SK / – in Hochkössen, St. Johann i.Tirol und Hochfügen flow Ski- und Snowboardschule Intersport Menzel.
Managemententscheidungsunterstützungssysteme (Ausgewählte Methoden und Fallstudien) ( Die Thesen zur Vorlesung 3) Thema der Vorlesung Lösung der linearen.
PARTENARIAT ÉDUCATIF GRUNDTVIG PARTENARIAT ÉDUCATIF GRUNDTVIG REPERES KULTURELLER ZUSAMMENHALT UND AUSDEHNUNG DER IDEEN AUF EUROPÄISCHEM.
Das IT - Informationssystem
Großer Altersunterschied bei Paaren fällt nicht auf!
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Gebrauchsanweisung für ein glückliches Zusammenleben
Analyseprodukte numerischer Modelle
Aufbau der DNA Phosphatrest Zucker (Desoxyribose)
Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.
Vortrag von Rechtsanwältin Verena Nedden, Fachanwältin für Steuerrecht zur Veranstaltung Wege zum bedingungslosen Grundeinkommen der Piratenpartei Rhein-Hessen.
1 Proseminar TUM Informatik PalmPilot und Handspring: Technik, Programmierung, Anwendung Hacks Daniel Schweighart
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
Dimension 4 !... nicht zu fassen ? Lange Nacht der Wissenschaft 24. September 2010 Wiland Schmale Institut für Mathematik.
Fragebogen Studierende
Die identische Reduplikation
Das IT - Informationssystem
Genetik.
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Monatsbericht Ausgleichsenergiemarkt Gas – Oktober
Computergrafik-Praktikum Abschlusspräsentation Sierpinski Sarah Voß und Lars Jung Johann Wolfgang von Goethe Universität Frankfurt am Main Institut für.
Joelle, Paul & Philipp RNA- Prozessierung.
 Präsentation transkript:

“Visualisierung in der Bioinformatik” Genom – Visualisierung Johann Wolfgang Goethe-Universität Frankfurt am Main GDV Proseminar “Visualisierung in der Bioinformatik” Genom – Visualisierung FfM., den 05.06.2003 Oleg Rempel und Sven Zöller

Gliederung Proseminar „Visualisierung in der Bioinformatik“ 1 Einleitung 1.1  Exkurs ins menschlichen Genom 1.2  Human Genom Projekt 2 Graphisches Darstellen von Genomen 2.1 Ziele 2.2 Probleme 3 ProtAnnot und Neomorphic GeneViewer 3.1 Hintergrund 3.2  Semantisches Zooming 3.3  Zweidimensionales Zooming 3.4  Einzelne oder doppelte Reihenfolge der Genstruktur 3.5  Umgang mit der Komplexität der Informationen 3.6  Proteinvorhersage 4 Beispiel SeqVISTA 4.1 Hintergrund 4.2 SeqVISTA 4.3 repetitive Elemente 4.4 Proteinstruktur 5 Zusammenfassung Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Genom als der Bauplan des Lebens 1 Einleitung 1.1 Exkurs ins menschliche Genom Genom (Erbgut) ist die Gesamtheit der Erbinformation einer Zelle. Die Erbinformation ist die in der DNA jeder Zelle gespeicherte Information zur Ausbildung von Merkmalen. Unter Merkmalen versteht man die Entwicklung, das Aussehen, das Verhalten, die Gesundheit und die Neigung zu bestimmten Krankheiten. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Sitz des Genoms 1 Einleitung 1.1 Exkurs ins menschliche Genom Jede Zelle des menschlichen Organismus besitzt das komplette Genom. Das meiste menschliche Genom (99,9995%) befindet sich im Zellkern. Rest (0,0005%) in Mitochondrien der Zelle. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

DNA 1 Einleitung 1.1 Exkurs ins menschliche Genom Erbsubstanz der Erbinformation ist die DNA (DesoxyriboNucleid Acid). Die DNA besteht aus Bausteinen (Nukleotiden), die in zwei komplementär angeordneten Strängen miteinander Verknüpft sind. Die beiden DNA-Stränge sind spiralförmig um die eigene Achse gewunden, bilden so genannte Doppelhelix. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Von Doppelhelix zu einem Chromosom 1 Einleitung 1.1 Exkurs ins menschliche Genom Die Doppelhelix ist durch mehrfaches Umwickeln sehr dicht gepackt und bildet zusammen mit HistonProteinen eine Chromatinfaser aus. Die Chromatinfaser ist ihrerseits umgewickelt und bildet Chromosomen aus. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Chromosomen Bei einem Mensch gib es 23 Chromosomen, die normaler 1 Einleitung 1.1 Exkurs ins menschliche Genom Bei einem Mensch gib es 23 Chromosomen, die normaler Weise doppelt vertreten sind. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Chromosomen Ein Chromosom ist ca. 1,4 μm breit und ist unter dem 1 Einleitung 1.1 Exkurs ins menschliche Genom Ein Chromosom ist ca. 1,4 μm breit und ist unter dem Mikroskop sichtbar. Ein Chromosom kann mehrere Gene enthalten. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Gen Gen ist ein bestimmter proteinkodierender DNA Abschnitt. 1 Einleitung 1.1 Exkurs ins menschliche Genom Gen ist ein bestimmter proteinkodierender DNA Abschnitt. Im menschlichen Genom sind ca. 27 000 – 30 000 Gene, davon sind in Mitochondrien 13 Gene. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Codierung Es gibt 4 verschiedene Nukleotide in der DNA: A,C,G und T 1 Einleitung 1.1 Exkurs ins menschliche Genom Es gibt 4 verschiedene Nukleotide in der DNA: A,C,G und T Da jedes Nukleotid immer einen spezifischen Partner in dem zweiten DNA-Strang hat, nennt man die beiden Partner ein Basenpaar. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Codierung 1 Einleitung 1.1 Exkurs ins menschliche Genom Die Abfolge der Besenpaaren kann bei der Expression in die Abfolge der Aminosäuren eines Proteins übersetzt werden. Drei Basen eines DNA-Stranges sind die kleinste Informationseinheit der DNA und wird als Codon oder Basentriplett bezeichnet. Ein Codon kodiert eine bestimmte Aminosäure oder hat eine andere Funktion. Es gibt 64 (43) mögliche Codons und nur 20 Aminosäuren die sie kodieren. Das erschwert die Entzifferung der Codierung. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Sequenz 1 Einleitung 1.1 Exkurs ins menschliche Genom Die Abfolge der Nukleotiden in der DNA bezeichnet man als Sequenz. Bei Menschen insgesamt: 3,2 Milliarden Besenpaaren, nur 1- 5% davon stellen Gene dar. In Mitochondrien: 16 kbp Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Sequenz -Regionen Man unterscheidet verschiedene Regionen der Sequenz: 1 Einleitung 1.1 Exkurs ins menschliche Genom Man unterscheidet verschiedene Regionen der Sequenz: Exon – die proteinkodierende Region Intron – hat keine proteinkodierende Funktion. Promotor – Region, wo die Transkription startet. Terminator – Region, wo die Transkription endet. ORF – offener Leseraster. URF – nichtidentifizierter Leseraster Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Sequenz 1 Einleitung 1.1 Exkurs ins menschliche Genom >gi|16164037:211292-256037 Homo sapiens chromosome Y genomic contig GTTTGTGGCCTGGTCGGCGTCCCGTAGGGCGCCCTCCCGCGCTAGGCCGGCCGGCGTGGCGCTCGGCGCCGAACAGGCCCCGAGGAGGCCGCAGTTAGGCCTAGTGATTATCCAGTTGCCCTGAGCGGCTGCGGAGGTGCGCTCCATAAGCGGGCAGGGTGGGAAAAGTTCGCCCGTTTGTCCGGAAGGCAGTTGATGGACCTGGGGTCGACACCACTGCGGACGCAGGGCACGGCACGGGGGCGAGAAGGCGAAGGCTGCAGGCGTGAGGTGAAGGCCGGAGGCCTGCTGGGCCTATTTTCGCTATGTAAATGTCCGCGAAGGGGAGGAGGGACGGGGGGGCAAGATGGCGGCTGCTAGGCGCCTGCTGCTGGGGAGTATTGAGAGTGTTGTCGGGAGGCGGAGCCGCCATCTTGAAGGCGGTATCTGGAAAAAAAATTCGGTTATGATCCTTGAGGCGGGGATGGGGAAAAGGACGGCGGCGGCGGCGGCAGCGCAGCCTCCGGCGCGACGGCGTGTCTGCGCAACAGGGCGTGCTCGTTCCCTTGGCGGCCCTTGCCTTTGTCGCCATATGCGCGCGTACGTTCCAGACGCCTGCGGCAGCGCCACCTTTCGGCCTTCCCCTCACAGCCCATCCTTGGCTGGGTGCAGTGTCGGCTACGCTTTAGGTGACATGCCGCAGGCGTCCGTTCGGGCGCCGGGGTCATTTCGCCCCTCAGCGCTCCCGGCTCTGTGCCCTTCCGAGAGTCTACAGCCACCCGTTTCAGCAGGTGGCAATTCGGGCATCTAGGCTCACGAGAGCACATAAATTCCAGAAAATTTTATTTTCCCCTAATTAAAGTCATTATGTGGCTGTTCGGGGACCTTCGATGCGCTTATTTTTCAACCATC……………… Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Daten 1 Einleitung 1.2 Human Genom Projekt 1986 – Aufruf des amerikanischen Krebsforschers Renato Dulbecco das komplette menschliche Genom zu entschlüsseln. 1987 – Amerikanische Kongress bewilligt 200 Millionen Dollar jährlich, geplant sind 15 Jahre arbeit. 1997 – Start des Human Genom Projektes in Deutschland. 2000 – Erste Ergebnisse würden veröffentlicht. 2001 – Begann die zweite Phase des Projektes. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Ziel Das Ziel des öffentlich finanzierten Humangenomprojektes ist, 1 Einleitung 1.2 Human Genom Projekt Das Ziel des öffentlich finanzierten Humangenomprojektes ist, aller Wissenschaftler mit einem öffentlichem Verzeichnis der Gensequenz zu versorgen, und dadurch die biomedizinische Forschung zu beschleunigen. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Firmen 1 Einleitung 1.2 Human Genom Projekt Im Jahre1991 wird HUGO (HUman Genom Organisation) gegründet, welche die Durchführung des Projektes koordinieren soll. Wenig später hat aber eine private US-Firma "Celera Genomics" des Genforschers Craig Venter die Führung übernommen. Die deutschen Firmen erhoffen bei der zweiten Phase des Projektes, wo es hauptsächlich um die Erkennung der Genfunktionen geht, die Nase vorne zu halten. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Ergebnisse 1 Einleitung 1.2 Human Genom Projekt Obwohl in der Presse schon mehrmals verkündet wurde, dass das menschliche Genom beinah vollständig entziffert ist und veröffentlicht wurde, Wissenschaftler in der ganzen Welt arbeiten noch heftig daran. Hauptgrunde dafür sind: Die Funktion der meisten Genen ist noch unbekannt. Viele Gene besitzen mehrere Funktionen. Die entzifferten Gensequenz kann Fehler enthalten. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Die Bereitstellung der Sequenz 2 Ziele und Probleme beim graphischen Darstellen von Genomen 2.1 Ziele Wie in Humangenomprojekt ist auch hier das Hauptziel, aller Wissenschaftler mit der öffentlichen Gensequenz zu versorgen. Die entzifferten Daten sind da, aber die sind oft viel zu unübersichtig und komplex, deshalb werden effektive Visualisierungswerkzeuge gebraucht, welche die Wissenschaftler helfen damit zu arbeiten. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Grafische Darstellung 2 Ziele und Probleme beim graphischen Darstellen von Genomen 2.1 Probleme Ein nützlicher und effektiver Weg etwas unübersichtliches sichtbar zu machen ist die grafische Darstellung. Providerswerkzeuge: Das LocusLink von NCBI und der Genomsuch-Browser von UCSC. Beide arbeiten aber in sogenannten „Client-server model“ Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Java-Applets Das „Client-server model“ erschwert viele Manipulationen. 2 Ziele und Probleme beim graphischen Darstellen von Genomen 2.1 Probleme Das „Client-server model“ erschwert viele Manipulationen. Es wird versucht das Problem durch Java-Applets zu lösen, die von dem Server runtergeladen werden können und in einer „Java vitrual machine“ auf dem PC des Benutzers laufen und verändern werden können. Aus Sicherheitsgründen sind die Java-Applets aber etwas problematisch, da die sehr wohl Trojaner seien können. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

ProtAnnot und Neomorphic GeneViewer 3.1 Hintergrund Als Beispiele der alternativen Visualisierungstechnik werden hier als erstes ein Prototyp des Protein-Domain-Viewer ProtAnnot und Neomorphic GeneViewer, ein Genombrowser, der zuerst für das Institut der Genomforschung (TIGR) speziell für das Arabidopsis Genom geschrieben wurde. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Semantisches Zooming 3 ProtAnnot und Neomorphic GeneViewer Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Zweidimensionales Zooming 3 ProtAnnot und Neomorphic GeneViewer 3.3 Zweidimensionales Zooming Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Doppelte Reihenfolge der Genstruktur 3 ProtAnnot und Neomorphic GeneViewer 3.4 Einzelne oder doppelte Reihenfolge der Genstruktur Gen-Finder-Programme. Sequenzen werden in zwei parallelen Reihen dargestellt und so verglichen. Ca. 1/2 - 1/3 der menschlichen Genen enthalten mehrere Transkriptionsvarianten . Erkennung oft nur von einer Transkriptionsvariante. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Einzelne Reihenfolge der Genstruktur 3 ProtAnnot und Neomorphic GeneViewer 3.4 Einzelne oder doppelte Reihenfolge der Genstruktur Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Umgang mit der Komplexität der Informationen 3 ProtAnnot und Neomorphic GeneViewer 3.5 Umgang mit der Komplexität der Informationen EST’s (expressed sequence tags) von SNURF-Gen, das in der Lage ist zwei unterschiedliche Proteine zu kodieren. RT-PCR Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Das alternative Splicing (oder Spleissen) 3 ProtAnnot und Neomorphic GeneViewer 3.6 Proteinvorhersage ARG1 (Arginase – Gen) Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Zwei Formen eines plasminogen Aktivators 3 ProtAnnot und Neomorphic GeneViewer 3.6 Proteinvorhersage Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Hintergrund 4 4.1 alle gefundenen Geninformationen werden in Text basierenden Datenbanken gespeichert kein intuitives Verständnis über die komplexe Struktur von Genen möglich Datenbanken liefern graphische Darstellungen nur zu einer Fragestellung SeqVISTA übernimmt die Aufgabe der graphischen Visualisierung von verschiedenen Datenbankinformationen gleichzeitig Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

SeqVISTA 4 4.2 einfaches Verständnis durch dreigeteilten Bildschirm (tree panel, graphics panel und sequence panel) Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

SeqVISTA Suchfunktionen innerhalb der Sequenz 4 4.2 Suchfunktionen innerhalb der Sequenz Start- und Endsequenz sind bekannt Sequenzfragment ist bekannt durch Markierung einer Region in der Sequenz Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

SeqVISTA Vorteile von SeqVISTA im Bezug auf Datenimport 4 4.2 Vorteile von SeqVISTA im Bezug auf Datenimport Akzeptanz der wichtigsten Datenbankformate (GenBank flat file format [GBFF], GenBank HTML format, FASTA format und meta-based SeqVISTA format.) einfaches Laden der Sequenz durch Eingabe der GI oder durch Laden von der NCBI-Internetseite. durch Pluginentwicklung können externe Analyseprogramme SeqVISTA zur graphischen Visualisierung nutzen. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

repetitive Elemente 4 4.3 Untersuchung der Lage und Eigenschaften repetitiver Elemente im Bezug zur Gesamtsequenz. Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Proteinstruktur 4 4.4 PSIPRED berechnet wahrscheinliche sekundär Strukturen der Proteine anhand der Gensequenz Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung

Zusammenfassung komplexe Gensequenzen werden übersichtlich dargestellt 5 komplexe Gensequenzen werden übersichtlich dargestellt Zugriff auf externe Programme zu vertiefenden Analysen Darstellung externer Ergebnisse Proseminar „Visualisierung in der Bioinformatik“ Genom – Visualisierung