Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
1
7. Regelbasierte Modellierung
12. Vorlesung 7. Regelbasierte Modellierung Analytisch Metabolisches System Eigenschaften Theoretische Betrachtungen 8. Datenbanken und Integration Vorlesung WS 06/07 Modellierung & Simulation Überblick
2
Definition: Analytisch-metabolisches System
Das 3-Tupel G = (Z,R,k0) mit Z Menge der Metabolitgemische, k0 eine positive Mulitmenge über Z und R eine endliche Menge von analytisch-metabolischen Regeln heisst analytisch-metabolisches System. Jede Multimenge k über Z heißt Konfiguration des analytisch-metabolischen Systems. k0 heißt Start-Konfiguration von G. Vereinbarung: K = Menge aller Konfigurationen des Systems. Vorlesung Modellierung & Simulation 7. Regelsystem
3
Einschritt-Ableitung: ‚Quasi' gleichzeitige Aktion aktivierter Regeln.
Definition: Nachfolgekonfiguration - Einschritt-Ableitung Sei G = (Z,R,k0) ein analytisch-metabolisches System und k eine beliebige Konfiguration für die gilt: T Í AKT(k) mit AKT(k) ¹ Æ. Die 'quasi' gleichzeitige Aktion der Regelmenge T heißt Einschritt-Ableitung und führt zur Nachfolgekonfiguration k', in Symbolen k ÞT k', wenn gilt k' = (k - S"tÎT VOR(t)) + S"tÎT NACH(t). Wir sagen k wird mittels der Aktion T nach k' überführt. D(k) = { k' : $ TÍAKT(k) k ÞT k' } beschreibt die Menge aller Nachfolgekonfigurationen. Vorlesung Modellierung & Simulation 7. Regelsystem
4
Beispiel: Sei G = (Z,R,k0) ein analytisch-metabolisches System mit
Implementierung des analytisch-metabolischen Systems kann eine Vielzahl unterschiedlicher Einschritt-Ableitungen parallel erzeugen. Auf jeder Ebene der Einschritt-Ableitung ist die Potenzmenge über AKT(k) zu bestimmen. Jedes Element dieser Menge erzeugt eine Nachfolgekonfiguration. Negative Konfigurationen sind im Ableitungsbaum Blätter. Beispiel: Sei G = (Z,R,k0) ein analytisch-metabolisches System mit k0 = [B, D, E] und R: r1 = (1.0, [B], [C], [E], Æ), r2 = (1.0, [C], [D], [E], Æ) und r3 = (1.0, [D, B], [C], Æ, Æ). Für die ersten drei Generationen ergibt sich: Vorlesung Modellierung & Simulation 7. Regelsystem
5
1. Generation: [B, E] (r1), [C, E] (r3), [-B, 2 C, E] (r1, r3)
2. Generation: [C, D,E] (r2) [C, E] (r2) 3. Generation: [2 D, E] (r2) [D,E] (r2) [B, D, E] r1 r3 r1,r3 [B, E] [C, E] [-B, 2 C, E] r2 r2 [2D, E] [D, E]
6
Sei G = (Z,R,k0) ein analytisch-metabolisches System mit
Beispiel: Sei G = (Z,R,k0) ein analytisch-metabolisches System mit k = [X] und R = {r1,r2,r3} mit r1 = (1.0, [X], [B], Æ, Æ), r2 = (1.0, [B] ,[C], Æ, Æ) und r3 = (1.0, [X], [D], Æ, Æ). Unter k ist T = {r1,r3} aktiviert. Die Nachfolgekonfiguration von k unter T ergibt: k' = [X] - ([X] + [X]) + ([B] + [D]) = [-X, B, D] Vorlesung Modellierung & Simulation 7. Regelsystem
7
Aktivierung und Aktion sind unabhängige Ereignisse, die jeweils für
alle Regeln 'quasi' gleichzeitig durchgeführt werden. Ableitungsprozess mit negativen Komponenten. Simulationsprogramm / Ableitungs-Operatoren: Basis: Definierter Ableitungsoperator schließt Erreichbarkeit negativer Konfigurationen aus. Alternative: Sequentielle Aktion der Regeln. Die sequentielle Verrechnung basiert auf einer Nummerierung der Regeln. In dieser vordefinierten Reihenfolge werden die Regeln auf Aktivierung getestet und eventuell direkt ausgeführt. Vorlesung Modellierung & Simulation 7. Regelsystem
8
Für k = [6 X] ergibt die sequentielle Ableitung:
Beispiel (s.o.): Für k = [6 X] ergibt die sequentielle Ableitung: [6 X] Þ [5 X, B] Þ [5 X, C] Þ [4 X, C, D] Þ [3 X, B, C, D] [3 X, 2 C, D] Þ [2 X, 2 C, 2 D] Þ [X, B, 2 C, 2 D] Þ [X, 3 C, 2 D] Þ [B, 3 C, 2 D] Þ [3 C, 3 D] Ableitung verdeutlicht die Eigenschaft dieses Systems. - Metaboliten C und D reichern sich im gleichen Verhältnis an. - Negative Konzentrationswerte können im Fall der sequentiellen Ableitung nicht erzeugt werden. Vorlesung Modellierung & Simulation 7. Regelsystem
9
2. Strategie: Random-Parallele Verrechnung
a) Aktivierte Regeln einer Konfiguration bestimmen. b) Klassifizierung: Regeln, die durch ihre 'quasi' gleichzeitige Aktion einen negativen Konzentrationswert eines Metaboliten verursachen können. c) Random-parallele Verrechnung wählt per Zufallsentscheidung aus einer jeden solchen Klasse eine geeignete Teilmenge von Regeln aus. d) Die dadurch bestimmte Menge aktivierter Regeln durchläuft den Prozess der Ableitung. Beispiel: Oben werden die Regeln r1 und r2 einer Klasse zugeordnet. Per Zufallsentscheidung r1 oder r2 ausgewählt. Random-parallele Verrechnung ist nicht deterministisch. Vorlesung Modellierung & Simulation 7. Regelsystem
10
Theoretische Betrachtungen / Sprachen
Sei G = (Z,R,k0) ein beliebiges analytisch-metabolisches System. 1. L(G,i) = { k : k0 i k } Erfasst alle Konfigurationen, die mit i Einschritt-Ableitungen erzeugt werden können. 2. L(G) = { k : k0 * k } Menge aller ableitbaren Konfigurationen. Entspricht gerade dem Ableitungsbaum. Vorlesung Modellierung & Simulation 7. Regelsystem
11
Theoretische Betrachtungen / Sprachen
3. Lcut(G,i,s) = { k : k0 i k und PNach(k,i) ≥ s } Konfigurationen, die in der i-ten Generation mindestens die Wahrscheinlichkeit s aufweisen. Im Simulator wird diese Sprache heuristisch erzeugt, indem über den Parameter PATHWAY die Breite der Einschritt-Ableitung festgelegt werden kann. Damit kann die Frage nach dem Auftreten bestimmter Konfigurationen nach i-Einschritt-Ableitungen diskutiert werden. 4. Tcut(G,i,s) = { k : i IN PKomb(k,i) ≥ s } Alle Kombinationen von Konfigurationen, die zu irgendeinem Zeitpunkt mindestens die Wahrscheinlichkeit s aufweisen. Vorlesung Modellierung & Simulation 7. Regelsystem
12
Theoretische Betrachtungen
Metabolisches System: Menge der Zustände endlich entscheidbar. Analytisch-metabolisches System: Hier gilt dies nicht ! Menge erreichbarer Konfigurationen ist im allgemeinen unendlich. Menge der ableitbaren Konfigurationen bleibt aufzählbar! Überlegungen zeigen: Diese Menge ist im allgemeinen unentscheibar. Beweis: Halteproblem und 2-Zählermaschinen. Vorlesung Modellierung & Simulation 7. Regelsystem
13
Theoretische Betrachtungen
Unbeschränkte Konzentrationswerte und absolute Wirkung der Hemmer Unentscheidbarkeit des analytisch-metabolischen Systems Bedeutung für die Modellierung: Reddy [Reddy et al.1993] zeigte erstmals die Modellierung metabolischer pathways durch Petri-Netze. Erreichbarkeit in Petri-Netzen entscheidbar [Reutenauer 1990]. Vorlesung Modellierung & Simulation 7. Regelsystem
14
Für allgemeine analytisch-metabolische Systeme
Unentscheidbarkeit des analytisch-metabolischen Systems führt unmittelbar zu der Aussage: Für allgemeine analytisch-metabolische Systeme ist keine interessante Fragestellung entscheidbar. Einschränkungen in der Praxis: - Konzentrationen, - Ableitungstiefe und - Ableitungsbreite. Wichtige Fragestellungen in solchen eingeschränkten Systemen werden entscheidbar. Vorlesung Modellierung & Simulation 7. Regelsystem
15
Aufwand dieser Methode ?
Ableitungstiefe eingeschränkt: Sprachen L(G,i) entscheidbar. Dabei umfasst L(G,i) die Nachfolgekonfigurationen, die aus der Start-Konfiguration des analytisch-metabolischen Systems auf der Basis der ersten i Generationen erreichbar sind. Somit ist für ein analytisch-metabolisches System G mit fester Generationstiefe i entscheidbar, ob eine Konfiguration k L(G,i) ist oder nicht. Vorlesung Modellierung & Simulation 7. Regelsystem
16
Aufwand dieser Methode ?
Aufgrund der exponentiellen Komplexität bezüglich der Bestimmung aller Ableitungen eines Ableitungsbaums ist dies jedoch für ein hinreichend großes i IN praktisch nicht möglich, weil bereits die Einschritt-Ableitung 2**{ r R : 0<modp(r,k) ≤ 1 } Nachfolgekonfigurationen berechnen muss. Vorlesung Modellierung & Simulation 7. Regelsystem
17
Erkennung biochemischer Engpässe Definition: Metabolischer Bottleneck
Sei G = (Z,R,k0) ein metabolisches System, k0 Þn kn für n Î IN eine Ableitung, m ein Metabolit und h,l Î IN spezifische Konstanten. Ein Metabolit m heißt (h,t)-Bottleneck, wenn gilt: $ iÎ{1,...,n} ki(m)£t Ú ki(m)³h. Für ki(m)£t heißt m negativer (h,t)-Bottleneck und für k(m)³h positiver (h,t)-Bottleneck. Metabolischer Bottleneck signalisiert einen kritischen Konzentrationswert für einen oder mehrere Metabolite. Vorlesung Modellierung & Simulation 7. Regelsystem
18
Fall 1: Positiver Bottleneck
Eine oder mehrere Regeln werden zu häufig aktiviert. Beispiel: r1 = (1.0, Æ, [10 A], Æ, Æ) und r2 = (0.2, [10 A], Æ, Æ, Æ). Die Regel r1 wird in jeder Generation aktiviert, wohingegen r2 erst in jedem ca. 5. Ableitungsschritt aktiviert wird. Vorlesung Modellierung & Simulation 7. Regelsystem
19
Fall 2: Negativer Bottleneck (komplementäre Situation)
Eine oder mehrere Regeln werden zu häufig aktiviert. Beispiel: r1 = (0.9, [B], [3 A], Æ, Æ) und r2 = (1.0, [6 A], [C], Æ, Æ). r2 konsumiert A, was zu einer permanenten Verminderung der Konzentration dieses Metaboliten führt. Vorlesung Modellierung & Simulation 7. Regelsystem
20
Eigenschaft - Bottleneck-Erkennung
Analytisch-metabolisches System erlaubt die Erkennung der in einer Ableitung auftretenden Bottlenecks. Begründung: Sei G = (Z,R,k0) ein analytisch-metabolisches System, A = k0 bottleneckfreie StartKonfiguration (Substrat) und R die Menge der metabolischen Regeln des Systems. Für jede Ableitung k0 Þn kn mit n Î IN gilt: Jede abgeleitete Konfiguration ki repräsentiert endlich viele Metaboliten. Für jeden Metaboliten kann der aktuelle Konzentrationswert in der Konfiguration ki (i=1,...,n) aus dem zugehörigen Konzentrationswert in Konfiguration ki-1 und den aktivierten Regeln AKT(ki-1) eindeutig berechnet werden. Vorlesung Modellierung & Simulation 7. Regelsystem
21
Anwendung: diagnostische Unterstützung.
Für beliebige analytisch-metabolische Systeme ist es unklar, ob überhaupt ein Bottleneck auftritt. Bottleneck erkannt Identifizierung potentieller Regeln, die für diesen Bottleneck lokal verantwortlich sein können. Anwendung: diagnostische Unterstützung. Vorlesung Modellierung & Simulation 7. Regelsystem
22
Bottleneck im Modell identifiziert, so stellt sich die Frage:
Kann eine solche Konfiguration eventuell eliminiert werden ? Erarbeitung eines hypothetischen Therapieansatzes. Elimination solcher Konfigurationen im Modell ? Vorlesung Modellierung & Simulation 7. Regelsystem
23
Grundlegende Definitionen
Datenbank: Strukturierte Sammlung von Daten, welche Fakten über spezielle Anwendungen eines modellierten Ausschnittes der Realwelt repräsentiert, die dauerhaft (persistent) und weitgehend redundanzfrei gespeichert wird. Datenbank-Management-System (DBMS): Software, die eine Sammlung von Programmen bereitstellt, welche das anwendungsabhängige Erzeugen, Ändern und Löschen einer Datenbank ermöglicht. Datenbanksystem: Kombination eines Datenbank-Management-Systems mit einer oder mehreren, unterscheidbaren Datenbanken. Datenmodell: System von Konzepten zur Beschreibung von Datenbanken. Ein Datenmodell umfasst für ein Datenbanksystem sowohl Syntax als auch Semantik von Datenbankbeschreibungen. Vorlesung Modellierung & Simulation 8. Informationssysteme
24
Anforderungen an Datenbanksysteme / Codd’schen Regeln:
Datenbankschema oder Schemata: Ausprägung von Datenmodellen. Für die Abfrage der Daten wird häufig eine Abfragesprache verwendet. Solche Sprachen sind in der Regel standardisiert, wie z.B. die Structured Query Language (SQL). Anforderungen an Datenbanksysteme / Codd’schen Regeln: Integration: Einheitliche und nichtredundante Datenverwaltung. Operationen: Speichern, ändern und suchen. Benutzersichten: Zugriffe auf Datenbankbeschreibungen. Benutzersichten: Nutzerspezifische Auswahl der Daten. Konsistenzüberwachung: Korrektheit des Datenbestandes. Datenschutz: Ausschluss unautorisierter Zugriffe. Transaktionen: Mehrere Datenbank-Operationen als funktionelle Einheit. Synchronisation: Parallele Transaktionen koordinieren. Datensicherung: Widerherstellung von Daten und Systemfehlern.
25
Informationssystem (IS):
Komplexes, zusammengesetztes Softwaresystem mit aufeinander bezogenen informationsverarbeitenden Komponenten. Diese können in Erzeugung, Speicherung, Umformung, Transport und Darstellung gegliedert werden. Eigenschaften: - Realisiert eine dauerhafte (persistente) Speicherung von Daten. - Wertet die gespeicherten Daten anwendungsspezifisch aus. - Durch Anpassung und Erweiterung dynamisch. - Integriert weitere (externe) Informationsquellen. Biologie: Informationssystem / Datenbank häufig synonym. Vorlesung Modellierung & Simulation 8. Informationssysteme
26
Datenquelle immer autonom verfügbar.
Besteht aus mindestens einem Computer, auf dem Daten gespeichert werden können und auf die über Schnittstellen zugegriffen werden kann. Datenquelle immer autonom verfügbar. Flat-File Datei, die eine bestimmte, implizite Struktur besitzt. Ist ein Flat-File auf einem Rechner verfügbar, so wird diese Kombination auch als Datenquelle verstanden. Flat-File besteht aus verschiedenen Zeilen, in denen Daten häufig in ASCII-Format enthalten sind. Vorlesung Modellierung & Simulation 8. Informationssysteme
27
ENTRY EC NAME Ornithine carbamoyltransferase Citrulline phospharylase Ornithine transcarbamylase CLASS Transferases Transferring one-carbon groups Carboxyl- and carbamoyltransferases SYSNAME Carbamoyl-phosphate: L-ornithine carbamoyltransferase ... Zeilenenden durch bestimmte Zeichen gekennzeichnet (in der Regel Enter). Unterscheidung der Daten innerhalb einer Zeile - Trennsymbole z.B. Tabulatoren oder Sonderzeichen. Unterscheidung innerhalb der Zeile ist möglich – Beispiel: auf der linken Seite Schlüsselwörter (ENTRY, NAME und SYSNAME) zu erkennen. Vorlesung Modellierung & Simulation 8. Informationssysteme
28
Datenintegration Redundanzfreie und einheitliche Verwaltung aller von Anwendungen bzw. von Anwendern benötigten Daten. Weiteres Ziel: Zusammenführung von Informationen, die verteilt in Datenquellen vorliegen. Noch größere Anforderungen an die Zusammenführung von Daten bzw. Informationen stellt die Informationsfusion. Informationsfusion Prozess, der Daten oder Informationen aus verschiedenen (heterogenen) Datenquellen kombiniert, verdichtet, interpretiert und daraus Informationen einer neuen Qualität abzuleitet. Vorlesung Modellierung & Simulation 8. Informationssysteme
29
Molekulare Informationsfusion / Genwirknetze
Data Warehouse Fachorientierte, integrierte, nicht-flüchtige und historische Datensammlung zur Unterstützung von Managemententscheidungen. Molekulare Informationsfusion / Genwirknetze Datenbanksysteme und Informationssysteme verfügbar. Es fehlt an: Softwaretools, die neben der Datenanalyse auch die komplexe Modellierung und Simulation der wesentlichen Zusammenhänge ermöglichen. Vorlesung Modellierung & Simulation 8. Informationssysteme
30
Grundlegend für die Simulation ist die Integration
der molekularen Datenquellen. Entwicklung von komplexen Informationssystemen, die über Internet global zugreifbar sind und letztlich eine multidimensionale Datenbank umfassen, die durch Analysealgorithmen gezielt ergänzt wird. Integration der relevanten Datenquellen und Analysetools. Grundlegend für unsere Fragestellungen sind die Datenbanken, die die metabolischen Pathways repräsentieren. Vorlesung Modellierung & Simulation 8. Informationssysteme
31
Kyoto Encyclopedia of Genes and Genomes (KEGG)
Repräsentiert für eine Vielzahl von Organismen Informationen zu metabolischen und genetischen pathways. Darüber hinaus werden auch Informationen bezüglich molekularer Erkrankungen angeboten (OMIM) und eigens entwickelte Analysetools präsentiert, um z.B. alternative pathways zu berechnen. Expert Protein Analysis System ExPASy Der Schweizer Protein Server rund um die Sequenzen und Strukturen der Proteine. Hier wird eine Vielzahl von Systemen angeboten (u.a. SWISS-PROT, die Protein knowledgebase und TrEMBLE Comuter-annotated supplement to SWISS-PROT). Expasy ist eine Implementierung der Boehringer pathway chart und bietet darüber hinaus u.a. die Möglichkeit der Verlinkung auf einige andere Informationssysteme. Vorlesung Modellierung & Simulation 8. Informationssysteme
32
Protein Information Resource PIR http://pir.georgetown.edu/
Eine Datenbank auf der Ebene der Protein Sequenzen. Die Homepage bietet die unterschiedlichen Werkzeuge an: Datenbanken und Analysetools. Protein Data bank (PDB) Die Protein Data Bank (PDB) ist ein Archiv experimentell ermittelter dreidimensionaler Strukturen biologischer Makromoleküle. Es enthält Atomkoordinaten, bibliographische Verweise, Informationen zu Primär- und Sekundärstrukturen und kristallographische Strukturfaktoren. Diese Datenbank wurde vom Brookhaven National Laboratory in den USA entwickelt. Es existieren verschiedene Anwendungen, die PDB-Daten verarbeiten und visualisieren können. Die PDB-Daten werden durch HTML-Seiten dargestellt. Die Datenfelder sind in Zeilen geordnet, wobei jede Zeile durch ein NEWLINE abgeschlossen wird. Ein strukturierter Zugriff auf einzelne Datenfelder ist somit gut möglich. Vorlesung Modellierung & Simulation 8. Informationssysteme
33
The Transcription Factor Database TRANSFAC
Die TRANSFAC Datenbank repräsentiert Informationen zur Genregulation: Binding sites, Gene, Proteine, Zellen, Klassen von Transkriptionsfaktoren sowie Verteilungsmatrizen der Sequenzen. Zur Archivierung wurde hier ein DBMS genutzt. Hier handelt es sich um einen SQL-Server von MICROSOFT. Eine direkte Nutzung dieser Systeme ist aber nicht möglich. Eine externe Datendarstellung erfolgt durch HTML-Seiten, die somit den sichtbaren Speichermechanismus darstellt. Die gewählten ASCII-Darstellungen besitzen eine klare Struktur. Die Daten werden in Zeilen dargestellt, die durch ein Newline abgeschlossen werden. Die Mölichkeit von Schemaanfragen ist in TRANSFAC nicht gegeben. TRANSFAC ist im Internet verfügbar und bietet verschiedene Masken zur Spezifikation von Anfragen an. Diese können durch HTML Browser genutzt werden. Die so spezifizierten Anfragen werden durch den Aufruf von CGI-Skripten zum Datenbankserver gesendet. Vorlesung Modellierung & Simulation 8. Informationssysteme
34
Transpath Ist ebenfalls ein Produkt der Firma BioBase und repräsentiert eine Datenbank für Signalpathways. Sie ist ähnlich gestaltet wie die TRANSFAC. CYTOMER Ist ebenfalls ein Produkt der Firma BioBase und repräsentiert eine Datenbank für Organ- und Zelltypen. BRENDA Ist ebenfalls ein Produkt der Firma BioBase (Lizens) und repräsentiert die Enzym Datenbank von Prof. Schomburg. Vorlesung Modellierung & Simulation 8. Informationssysteme
Ähnliche Präsentationen
© 2025 SlidePlayer.org Inc.
All rights reserved.