Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

5. Vorlesung Formale Sprachen Erweitertes Backus System DNA-Funktionseinheiten DNA-Sprachbetrachtungen Programmiersprache ? Literatur: Ratner V.A.: Molekulargenetische.

Ähnliche Präsentationen


Präsentation zum Thema: "5. Vorlesung Formale Sprachen Erweitertes Backus System DNA-Funktionseinheiten DNA-Sprachbetrachtungen Programmiersprache ? Literatur: Ratner V.A.: Molekulargenetische."—  Präsentation transkript:

1 5. Vorlesung Formale Sprachen Erweitertes Backus System DNA-Funktionseinheiten DNA-Sprachbetrachtungen Programmiersprache ? Literatur: Ratner V.A.: Molekulargenetische Steurungssysteme. Gustav Fischer Verlag, Stuttgart Atlan, H., Koppel, M.: The Cellular Computer DNA: Program or Data. Bulletin of Mathematical Biology, 52, 335 – 348, Vorlesung Modellierung & Simulation Überblick

2 Erweitertes Backus-System Spezifikation der Basensequenz einer DNA Funktionseinheit erfordert die Berücksichtigung der folgenden Eigenarten: 1.Funktionseinheiten sind durch eine spezifische Länge charakterisiert (z. B. die Pribnow-Box 6 bp, der Promotor hat eine Länge von 64 bp). 2.Es gibt Funktionseinheiten, die durch eine spezifische Häufigkeit von gewissen Basenpaaren bestimmt werden (z.B. Anfangsstück des Promotors besteht aus einer GC-reichen Sequenz, der eine AT-reiche Sequenz folgt). Vorlesung Modellierung & Simulation Sprachen

3 Zu 1.) Erweiterung des Backus-Systems Schreibweise: k  x  k'. x-mal Anwendung einer Backus-Regel. Es gelte i = 1..p, j = 1..q,  i,ß i,  j  (θ-{A}   ) * und k  k' mit k,k',p,q  IN. Backus-System erweitert: (k:k') ::=  1 ß 1 |... |  p ß p ::=   q Vorlesung Modellierung & Simulation Sprachen

4 Semantik: - ::= | |... | wobei für i = k..k' neue Variable sind und - ::=  1 ß 1 |... |  p ß p ::=  1 |... |  q wobei für i = 0..k neue Variable sind. Vereinbarung: Steht zu Beginn der erweiterten Regel statt (k:k') nur (k), so bedeutet dies (k:k). Vorlesung Modellierung & Simulation Sprachen

5 Beispiel: Gegeben seien die folgenden Regeln: (2) ::= a | b ::= ::= | diese Regeln bedeuten bezüglich der festgelegten Interpretation: ::= ::= a | b ::= ::= | Mögliche Ableitung:   a  aa  aa  aa ... Vorlesung Modellierung & Simulation Sprachen

6 2. Erweiterung des Backus-Systems Sei p,p',q,q'  IN + und gelte p/q  p'/q'. Zusätzliche Regel: ::= | (p/q,p'/q') Semantik: Wird diese Regel in einer Ableitung verwendet, dann liegt die Häufigkeit der Anwendung von  zwischen p/q und p'/q'. Vorlesung Modellierung & Simulation Sprachen

7 Beispiel: Sequenzierung  Identifikation der charakteristischen Nukleotidsequenz (naïve): “GC-reiche Sequenz gefolgt von einer AT-reichen Sequenz und der Pribnow-Box” Spezifikation der Nukleotidsequenz: G(Promotor) = ( { Promotor, AT_P, GC_P, AT, GC }, { A, T, G, C, Sequenz, Pribnow-Box }, R, Promotor) mit R: Vorlesung Modellierung & Simulation Sprachen

8 ::= Pribnow-Box Sequenz (10:15) ::= | (6/7,1) ::= A | T (10:15) ::= | (6/7,1) ::= G | C ::= A | T ::= G | C Vorlesung Modellierung & Simulation Sprachen

9 Anwendungsbeispiel: Komplexität von Organismen Definition: Wert einer Regel Der Wert einer Regel ist durch die Multiplikation des Wiederholungs- parameters (1, wenn kein Wert spezifiziert ist) mit der Anzahl der Substrings der rechten Seite der Regel gegeben. Definition: Komplexität eines erweiterten Backus Systems Die Summe aller Werte der zu einer Grammatik gehörenden Regeln spezifiziert die Komplexität des Backus Systems. Vorlesung Modellierung & Simulation Sprachen

10 ::= 1 (19) ::= T | A38 ::= T | A2 (9) ::= G | C18 ::= G | C2 (3) ::= A | T | C | G 12 ::= A | T | G | C4Summe 77 Vorlesung Modellierung & Simulation Sprachen

11 Interpretation: DNA als Sprache DNA: - Steuerungselement des Zellstoffwechsels. - Lineare Verkettung von Grundelementen. Grundelemente A = {A,T,G,C} oder {A,U,G,C} := Alphabet der Sprache. Gesucht: Spezifische Sprache S  A *. Vorlesung Modellierung & Simulation Sprachen

12 Interpretation: DNA als Sprache Es lassen sich zwei Ebenen der genetischen Sprache erkennen: - Polynukleotide (Alphabet = { A,G,C,T,U }) und - Polypeptide (Alphabet besteht aus den 20 Aminosäuren). Vorlesung Modellierung & Simulation Sprachen

13 Interpretation: DNA als Sprache Genetische Sprache besitzt mindestens sechs Ebenen: - Codon, - Cistron, - Scripton, - Replicon, - Segregon und - Genom. Vorlesung Modellierung & Simulation Sprachen

14 DNA-Strukturen Frage: Mehrzahl der real existierenden Strukturen erfasst ? - Annahme: Für Viren und Bakterien ist dies der Fall. - Annahme:DNA-Strukturen sind universell, d.h. sie treten in allen Organismen auf.  Neben der “Universalität” des genetischen Codes ist von einer “Universalität” der DNA-Strukturen und somit der DNA-Sprache auszugehen. Vorlesung Modellierung & Simulation Sprachen

15 Idee: DNA-Strukturen als Programmiersprache interpretierbar ? Diskussion: 1.Spezifikation der Funktionseinheiten, indem die Basensequenzen und ihre Funktion beschrieben werden. 2.Anforderungen einer Programmiersprache überprüfen. Vorlesung Modellierung & Simulation Sprachen

16 DNA-StrukturBemerkung IntronTeilstruktur des Strukturgens ExonTeilstruktur des Strukturgens LeaderTeilstruktur spezieller Strukturgene Strukturgendurchläuft die Proteinsynthese Spacergilt als Trennstruktur Repetitive Sequenzwiederholende Anordnung spezifischer Sequenzen Palindromgegenläufige DNA-Sequenz Terminatorsignalisiert das Ende der Transkriptionseinheit Pribnow-BoxTeilstruktur des Promotors Promotorsignalisiert den Beginn der Transkriptionseinheit OperatorSequenz der Genregulation Regulatorspezifisches Strukturgen Shine-DalgarnoSequenz der Genregulation OperonEinheit der Proteinsynthese CentromerErkennungssequenz der Kernspindel Telomerspezifische Endsequenzen

17 DNA-StrukturBemerkung OriginErkennungssequenz der DNA-Polymerase SegregonVererbungseinheit LTRlong terminal repeat IS-Elementedynamische Struktur des Genoms Transposondynamische Struktur des Genoms Viren-DNA-RNAdynamische Struktur Genfähredynamische Struktur Enhancerbeeinflusst die benachbarten Promotoren Mutatorgenbeeinflusst die Mutabilität spezifischer Sequenzen OnkogeneAuslösung von Krebs Sonkogenesteuern die Onkogene Historische Geneevolutionär stabile Sequenzen Stumme Genespezifische Strukturgene Pseudogenspezifisches Strukturgen überlappende Genespezifische Strukturgene HomöogenOperon, belegt die Modularität des Genoms ChronogenOperon, belegt die Modularität des Genoms

18 Eigenschaften der DNA-Sprachstrukturen 1.Minimale Anforderungen einer Programmiersprache festlegen. 2.Anforderungen werden von spezifischen DNA-Strukturen erfüllt. Charakteristiken der DNA-Sprachstrukturen im Rahmen der genetischen Prozesse erarbeitet.  Basis, für die Genetische Grammatik. Regelsystem (Syntax) Erzeugung syntaktisch korrekter DNA-Programmsequenzen. Vorlesung Modellierung & Simulation Sprachen

19 Vorbemerkungen Das von Neumannsche Konzept der Datenverarbeitung  Paralleler 'Universalrechner‘ ? Von Neumann Rechner: Programm ist eine lineare Kette von Instruktionen, die sequentiell abgearbeitet werden. Datentypen bzw. Datenstrukturen sind in Abhängigkeit von der benutzten Programmiersprache vordefiniert. Vorlesung Modellierung & Simulation Sprachen

20 Strukturelemente einer Programmiersprache B1:Datentypen ( definierbare Datentypen oder Standardtypen ) Bemerkung: Theoretisch ist ein Datentyp ausreichend. B2:Operationen (Anweisungen) Standardoperationen oder definierbare Operationen B3:Kontrollanweisungen Bemerkung: Ablauf des Programms steuern B4: Interpunktionszeichen (Trennzeichen) Vorlesung Modellierung & Simulation Sprachen

21 Kontrollanweisungen Semantik: Äquivalente Flussdiagramme. K1: Komposition von Anweisungen S 1 ; S 2 ;...; S n Semikolon wird als Folgeoperator interpretiert; er besagt, dass die nachfolgende Anweisung erst ausgeführt wird, wenn die vorangehende beendet ist. S1S1 S2S2 SnSn...

22 K2: Bedingte Anweisung (If-Anweisung) If B then S S sei eine Anweisung und B eine Bedingung, die den Wert WAHR oder FALSCH annehmen kann. B S Falsch Wahr

23 K3: Wiederholungsanweisung (While-Anweisung) While B do S S sei eine Anweisung und B eine Bedingung, die den Wert WAHR oder FALSCH annehmen kann. BS Falsch Wahr

24 Außerdem zählt die For-Anweisung For i=1 to n do S und die Repeat-Anweisung Repeat S until B zur Klasse der Wiederholungsanweisungen. Simulierbar:Spezifische While-Anweisungen. Vorlesung Modellierung & Simulation Sprachen

25 K4: Beginn- und Endmarkierung des Programms Begin S 1 ;...; S n End Bemerkung: Wiederholungsanweisungen (While, For und Repeat) sind durch bedingte Anweisungen / Sprungbefehl simulierbar. Vorlesung Modellierung & Simulation Sprachen

26 Interpretationsversuch als Pogrammiersprache DNA = Genetisches Programm einer Zelle. Datentypen =Zellplasma bzw. lokale Zellumgebung.  Datentypen (Metabolitklassen) vorhanden/definierbar (B1). Bemerkung:Geeignete Kodierung erlaubt die Einschränkung auf einen Datentyp. Somit wollen wir die weitere Diskussion auf die Substanzen (S) beschränken. Vorlesung Modellierung & Simulation DNA-Programmiersprache

27 Interpretationsversuch als Pogrammiersprache Operationen (Aktionen) Substanzklasse: Chemische Wechselwirkungen, die durch Enzyme katalysiert werden. Operatoren Enzyme: Im Genom durch Strukturgene repräsentiert (B2). ‘Elementare Anweisungen' DNA-Strukturen: Operationen auf Substanzen etc.. Vorlesung Modellierung & Simulation DNA-Programmiersprache

28 Bemerkung Verschiedene Strukturgene repräsentieren neben den 'elementaren Anweisungen' Baupläne für zelluläre Betriebsmittel und werden 'elementare Anweisungen im erweiterten Sinn' genannt. Definition: Zelluläre Betriebsmittel Moleküle bzw. Makromoleküle, die die genetischen Prozesse ausführen oder an der Ausführung beteiligt sind (z.B. rRNA, tRNA, RNA-Polymerase, DNA-Polymerase, Ligase, Topoisomerase, etc.). Vorlesung Modellierung & Simulation DNA-Programmiersprache

29 Definition: Elemenar anwendbare Anweisung Eine 'elementare Anweisung' heißt 'elementar anwendbare Anweisung', wenn 1. mindestens eine Erkennungsstelle (Promotor) vorgeschaltet und 2. mindestens eine Terminatorsequenz nachgeschaltet ist. Durchläuft eine 'elementar anwendbare Anweisung' den Proteinsyntheseprozeß, so wird dies Aktivierung genannt. Beispiel: Operon Vorlesung Modellierung & Simulation DNA-Programmiersprache

30 Strukturgen Substrat Enzym Produkt Elementare Anweisung Aktivierung Operator Operation Operon Expression Syntheseprodukt BiochemischeReaktion Promotor Strukturgen Terminator Substrat Enzym Produkt Elementar anwendbare Anweisung

31 Komposition von elementaren Anweisungen: - Operon mit mehreren Strukturgenen, - Sequentielle Verkettung von 'elementar anwendbaren Anweisungen' möglich (zu K1). Spacer trennt diese Einheiten (Interpunktionszeichen (zu B4). Beispiel: Das Lactose-Operon enthält die drei Strukturgene ß-Galactosidase (S 1 ), Galactosid-Permease (S 2 ) und Thiogalactosid-Transacetylase (S 3 ). Promotor S 1 S 2... S n Terminator A 0  A 1  A n-1  A n Promotor S 1 Terminator Spacer... Promotor S n Terminator Spacer... A 0 ... A n-1  A n

32 Bedingte Anweisung: Ein spezifisches Operon Operon umfaßt einen Operator und zwei oder mehrere Strukturgene. Eines dieser Strukturgene wirkt als Repressor des Operators, so dass die 'elementar anwendbare Anweisung' nur eine definierte Operation durchführt (zu K2). Beispiel: Operon L14 von Escherichia coli reguliert eigene Synthese. Promotor Operator_X Regulator_X Strukturgen S Terminator A 0  A n

33 Der boolesche Wert der Bedingung B wird durch den Zustand des Operators wie folgt festgelegt: WAHR ::= wenn der Operator geöffnet ist und FALSCH ::= wenn der Operator geblockt ist. Operator-X geöffnet  Aktivierung (Regulator-X und Strukturgen-S) Dabei sorgt der Regulator-X für die 'einmalige' Operation, indem er den spezifischen Operator-X blockiert. Strukturgen-S repräsentiert die auszuführende Operation S. Unter dieser Interpretation gilt: If B then S. Vorlesung Modellierung & Simulation DNA-Programmiersprache

34 Wiederholungsanweisungen For-Anweisung:Durch repetitive Sequenzen oder durch einen Zählermechanismus realisierbar. While-Anweisung:Spezifisches Operon. Beispiel: Das Tryptophan-Operon besteht aus: Promotor, Operator und den Strukturgenen trpE, trpD, trpC, trpB, trpA sowie dem Terminator. Promotor Operator Strukturgen Terminator A  B

35 Der boolesche Wert der Bedingung B wird durch den Zustand des Operators wie folgt festgelegt: WAHR ::=Operator ist geöffnet und FALSCH ::=Operator ist geblockt ist. Das Strukturgen repräsentiert die auszuführende Operation S. Operator geöffnet  Strukturgen in Aktion, bis Operator geblockt (zu K3). Unter dieser Interpretation gilt: While B do S Vorlesung Modellierung & Simulation DNA-Programmiersprache

36 Beginn- und Endmarke einer Vererbungseinheit, somit eines DNA- Programms, repräsentieren die Telomer-Sequenzen (zu K4). Ergebnis:Die DNA erfüllt auf der Ebene der analysierten Strukturen die Anforderungen einer Programmiersprache und ist als Programmiersprache interpretierbar. Klassifikation der DNA-Strukturen: Strukturgen ist die 'elementare Anweisung'. Es gibt drei Klassen von 'elementaren Anweisungen': - Datenmanipulation (Katalyse), - Zelluläre Betriebsmittelerstellung und - Synthese von anderen Zellbausteinen. Vorlesung Modellierung & Simulation DNA-Programmiersprache

37 Operon ist die 'elementar anwendbare Anweisung‘. Spacer ist das Interpunktionszeichen. Kontrollanweisungen sind: Promotor tritt mit den zellulären Betriebsmitteln in Wechselwirkung und leitet die Transkription ein. Enhancer beeinflusst die Promotoraffinität. Terminator tritt mit den zellulären Betriebsmitteln (RNA- Polymerase) in Wechselwirkung und beendet die Transkription. Operator tritt mit Regulator-Molekülen (Daten bzw. Anweisungen) in Wechselwirkung und steuert dadurch den Transkriptionsprozess. Vorlesung Modellierung & Simulation DNA-Programmiersprache

38 Regulator tritt über das Regulatorprotein mit der spezifischen Operatorsequenz in Wechselwirkung und steuert dadurch den Transkriptionsprozeß. Origins, Palindrome und Shine-Dalgarno Sequenzen treten mit Betriebsmitteln in Kontakt, so dass auch sie zur Klasse der Kontrollanweisungen zählen. Chronogene nehmen die Auswahl von verschiedenen Differenzierungsprogrammen vor. Homöogene aktivieren über ihre Syntheseprodukte die homöotischen Strukturgene. Transposonen, Viren-RNA und Genfähren enthalten Kontrollanweisungen sowie 'elementar anwendbare Anweisungen‘. Vorlesung Modellierung & Simulation DNA-Programmiersprache

39 DNA-Sprachstrukturen zeigen folgende Charakteristiken: a) Segregon, Chronogene und Homöogene dokumentieren die Modularität des Genoms. b) Die Aktionsstärke einer 'elementar anwendbaren Anweisung‘ ist probabilistisch (Promotoraffinität, freie Betriebsmitteln, Shine- Dalgarno Sequenz, Lebenszeit der mRNS und der Lebensdauer des Syntheseproduktes). c) Dynamische DNA-Strukturen. d) Überlappende Gene (z.B. SV40-Virus). e) Alle geöffneten 'elementar anwendbaren Anweisungen‘ sind simultan aktivierbar (parallele Abarbeitung). f) Operationen werden in Abhängigkeit von Daten gesteuert, da die Operatoren von anderen Daten (Induktoren bzw. Repressoren) 'geöffnet' bzw. 'geblockt' werden (Datenfluss).

40 Ergebnis:Die DNA zeigt auf der Ebene der analysierten Strukturen komplexe Sprachkonstrukte. Zusammenfassende Darstellung der Eigenschaften: 1. Genom ist modular organisiert, Anweisungen und Module können überlappen. 2.Operationsstärke einer 'elementar anwendbaren Anweisung' ist probabilistisch. 3. Genom (DNA-Programm) ist dynamisch (Transposon, Genfähre, Rekombination und Mutation). Vorlesung Modellierung & Simulation DNA-Programmiersprache

41 4.Simultane Aktivierung der 'elementar anwendbaren Anweisungen' in Abhängigkeit von den vorhandenen Betriebsmitteln und Kontrollanweisungen. 5. Das Betriebsmittelreservoir ist variabel und vom Programmablauf steuerbar, d.h. die Granularität der genetischen Prozesse und Biosyntheseprozesse (Abarbeitung des genetischen Programms) ist steuerbar. 6. Daten und Kontrollanweisungen steuern den Programmfluß. 7. Der genetische Speicher ist kein adressierbarer Raum. (Fast) jede Körperzelle besitzt das gesamte genetische Programm. Genom repräsentiert auch evolutionärer Redundanz.

42 Regelsystem zur Erzeugung syntaktisch korrekter DNA-Programmsequenzen DNA-Programm ~ eine lineare Verkettung von Funktionseinheiten.  DNA-Programme sind Worte über dem Alphabet A, das sich aus den DNA-Strukturen zusammensetzt. Frage: Gibt es eine Regelgrammatik, die syntaktisch korrekte DNA- Programme erzeugt ? Vorlesung Modellierung & Simulation DNA-Programmiersprache


Herunterladen ppt "5. Vorlesung Formale Sprachen Erweitertes Backus System DNA-Funktionseinheiten DNA-Sprachbetrachtungen Programmiersprache ? Literatur: Ratner V.A.: Molekulargenetische."

Ähnliche Präsentationen


Google-Anzeigen