Ein kleiner Exkurs in die Molekularbiologie: Vom Gen zum Phän

Slides:



Advertisements
Ähnliche Präsentationen
Developing your Business to Success We are looking for business partners. Enterprise Content Management with OS|ECM Version 6.
Advertisements

Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
Datenbanken Einführung.
Vorteile der Online-Produkte
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
1 JIM-Studie 2010 Jugend, Information, (Multi-)Media Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
= = = = 47 = 47 = 48 = =
Datenbanken I (0,*) Produkt 3 Karczewski Datenbanken I.
Browser Von Anna Zietek und Peter Paulus Verwendung Aufbau Anwendung.
Java: Objektorientierte Programmierung
An's Netz An's Netz An's.
Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.
Grundkurs Theoretische Informatik, Folie 2.1 © 2006 G. Vossen,K.-U. Witt Grundkurs Theoretische Informatik Kapitel 2 Gottfried Vossen Kurt-Ulrich Witt.
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
Internet facts 2008-II Graphiken zu dem Berichtsband AGOF e.V. September 2008.
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Das Netz der Netze Eine Einführung. 49 Kurssystem des DVZ.
Vererbung Spezialisierung von Klassen in JAVA möglich durch
PKJ 2005/1 Stefan Dissmann Zusammenfassung Bisher im Kurs erarbeitete Konzepte(1): Umgang mit einfachen Datentypen Umgang mit Feldern Umgang mit Referenzen.
Prof. Dr. Bernhard Wasmayr
Access 2000 Datenbanken.
Datenbanken Einführung Merkmale dateiorientierte Datenverwaltung
Seminar: Verteilte Datenbanken
Schulen ans Netz Oberhausener Moderatoren
Fachbereich Mathematik/Informatik Universität Osnabrück
Prof. Dr. Bernhard Wasmayr VWL 2. Semester
Rechneraufbau & Rechnerstrukturen, Folie 12.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 12.
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
Distanzbasierte Sprachkommunikation für Peer-to-Peer-Spiele
2 Distanzbasierte Sprachkommunikation für Peer-to-Peer-Spiele.
... und alles was dazugehört
1. 2 Schreibprojekt Zeitung 3 Überblick 1. Vorstellung ComputerLernWerkstatt 2. Schreibprojekt: Zeitung 2.1 Konzeption des Kurses 2.2 Projektverlauf.
20:00.
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
„Küsse deine Freunde“ – FlexKom-App teilen
Zusatzfolien zu B-Bäumen
Was bedeutet "Internet"? Begriff: Inter net
Eine Einführung in die CD-ROM
GBI Genios Wiso wiso bietet Ihnen das umfassendste Angebot deutsch- und englischsprachiger Literatur für die Wirtschafts- und Sozialwissenschaften. Wir.
für Weihnachten oder als Tischdekoration für das ganze Jahr
Where Europe does business Lück, JDZB | Seite © GfW NRW 252 a.
NEU! 1 2. Wo kommt diese Art von Rezeptor im Körper vor?
Überblick über die Datenbankproblematik
Datenbanken und Datenmodellierung
Allgemeines zu Datenbanken
PROCAM Score Alter (Jahre)
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
DI (FH) DI Roland J. Graf MSc (GIS) U N I V E R S I T Ä T S L E H R G A N G Geographical Information Science & Systems UNIGIS.
Symmetrische Blockchiffren DES – der Data Encryption Standard
Zahlentheorie und Zahlenspiele Hartmut Menzer, Ingo Althöfer ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List.
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
Eike Schallehn, Martin Endig
Eike Schallehn, Martin Endig
Fragebogen Studierende
Folie Einzelauswertung der Gemeindedaten
prof. dr. dieter steinmannfachhochschule trier © prof. dr. dieter steinmann Folie 1 vom Montag, 30. März 2015.
J-Team: Gymnasium Ulricianum Aurich und MTV Aurich Ein Projekt im Rahmen von UlricianumBewegt.de Euro haben wir schon…  8000 mal habt ihr bereits.
Datum:17. Dezember 2014 Thema:IFRS Update zum Jahresende – die Neuerungen im Überblick Referent:Eberhard Grötzner, EMA ® Anlass:12. Arbeitskreis Internationale.
1 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt Wie.
Einführung in die Volkswirtschaftslehre, Mikroökonomie und Wettbewerbspolitik Lothar Wildmann ISBN: © 2014 Oldenbourg Wissenschaftsverlag.
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Monatsbericht Ausgleichsenergiemarkt Gas – Oktober
Monatsbericht Ausgleichsenergiemarkt Gas – November
Datenbanken im Web 1.
 Präsentation transkript:

Interessierende Objekte in der Bioinformatik: Molekularbiologische Grundlagen

Ein kleiner Exkurs in die Molekularbiologie: Vom Gen zum Phän DNA Pflanze (Organismus) Transkription: Ergebnis ist Boten-RNA Faltung Þ Sekundär-und Tertiär-Struktur Translation: Ergebnis ist Aminosäuresequenz Û Protein in Primärstruktur

Ein kleiner Exkurs in die Molekularbiologie: Vom Gen zum Phän DNA: Pflanze (Organismus) ATGACGT GCCGTACGGTTG CAGTACGTATCA CGTACATGACATC CGGAATCTTACAA GTACATAAACAG TCTACAAGCTCC GGATCAA ADQLTEE QIAEFLFDKD KEAFSLFDLFDKDKD GDGTILFDKDTTLFD DTVMRSLGLFDKDQ NPTLFDKDEAELQD NLFDLFDKDKDEL KDDLFDKDL Protein:

Ein kleiner Exkurs in die Molekularbiologie: Der Genetische Code Jeweils 3 zusammenhängende Nukleotide codieren eine Aminosäure! 4³ = 64 aber nur 20 Aminosäuren in Organismus!

Ein kleiner Exkurs in die Molekularbiologie: Translation

Ein kleiner Exkurs in die Molekularbiologie: Von der DNA bis zum Stoffwechselweg

GGTCCTCCTCTCGGCCTGCTTTATCCTGCCTCCCCCTTCTCCTCTCCACCTGCTAGATCTAGAGTAGCTCCTAAGCCCACGAAAACCCCGCCGCGAGATCTGCGCATCTCGCAACACCACCACCATGGCGGCGCCGCGCGTCCTCCTCCTCCTCGCCGCCGCGGCCCTCCTCTCCGTCTCCTCCCTCGGAGACGCTTCGGGCGATGGCCCCCGCGGGCGCAAGCTGCTGGTGCTCGTCGACGATCTGGCCGTCCGCTCCTCCCACTCGGCCTTCTTCGGCTCGCTCCAGGCCCGCGGGCTAGATCTGGAGTTCCGCCTCGCGGACGACCCCAAGCTCTCGCTCCACCGCTACGGTCAGTACCTCTACGACGGCCTCGTCCTCTTCGCCCCGTCGACCCCGCGCTTTGGCGGATCGGTGGACCAGAACGCTGTTCTGGAGTTCATCGATGCTGGGCACGACATGATTCTGGCAGCAGATCATTCGGCTTCTGATCTGATCCGCGGCATCGCAACCGAGTGTGGGGTTGATTTTGATGAGGACCCGGAAGCGATGGGTTATTGACCACATTAATTATGCCTCCAACTGGAGTCTGAAGGGGGGATCACAACCTTTTACTGCGGAAAGNACAAGGATGAGCTCATCAAGAACGCTGCCTACATTGNCACCCCTGGAAAGGGTATTCTTGCTGCTGACGAGTCCGCTACTGTCACTGACAGCCTCAGGTCACTCGAAGCAAGGTTAGCTAGCTAGCACGCAGTGAGCGATGGCGGNCGCGGCGACCATGGCGCTCTCCTCCCCGGCGATGGCCGGCACCCCGGTGAAGGCCTCCAGGGCGGCGCCCTTCGGCGAGGGCCGCATCACCATGCGCAAGACGGCGGGCAAGCCCAAGGTGGCGGCGTCCAGCANCCCGTGGTACGGCTCCGACCGCGTGCTCTACCTCGGCCCGCTCTNCGGCGACCCCCCGAGCTACCTCACCGGCGAGTTCCCCGGCGACTACGGCTGGGACACCGCGGGGCTGTCCGCCGACCCCGAGACCTTCNCCAAGAACCGTGAGCTGGAGGTCATCCACTGCCGCTGGGCCATGCTCGGCGCGCTCGGCTGCGTCTTCCCCGAGCTGCTCGCCCGCAACGGCGTCAAGTTCGGCGAGGCCGTGTGGTTCAAGGCCGGCTCCCAGATCTTCAGCGAGGGCGGCCTCGACTACCTCGGCAACCCCAGCCTCGTCCACGCCCAGAGCATCCTCGCCATCTGGGCCTGCCAGGTGGTGCTCATGGGCGCCGTCCGAGGGCTACCGCGTCGCCGGCGGCCCGCTCGGCGAAGATCGTCGACCCGGCTCTACCCCGGCGGCAAGCTTCGACCCCCTGGGCCTCGCCCGAGGGACCCCGAGGCCTTCGGGGGTGACCATCCTGGCGCCCGTCAAGTCGCCCAACACGGACGGCATCAGTCGTCTCCGGCGACGACTGCGTGGCCATCAAGAGCGGCTGGGACGAGTACGGNATCNCCGTCGGCATGCCCAGCGAGCACATCTCGGTGCGCCGCCTCACCTGCGTGTCCCCGACCAGCGCGGTGATCGCGCTCGGCAGCAGAGATGTCGGGCGGCATACGGGACGTGCGCGCCGAGGACATCACCGGGCTGACTGGACGCCCCTTCAGGGTGTTCAGCCTCGACACGGGGCGGCTGAACCCAGAGACATACCAACTCTTCGACAAGGTGGAGAAGCACTACGGTATCCACATCGAGTACATGTTCCCGGACCAAGGGCCTCTTCTCTTTCTACGAGGACGGACACCAGGAGTGCTGCAGGGTGAGGAAGGTTCGGCCATTGAGGAGGGCCCTCAAGGGCCTCAAGGCCTGGATCACCGGGCAGCGGAAGGACCAGTCCCCTGGCACCAGGGCGAGCATCCCTGTTGTTCAGGTTGATCCGTCATTTGAAGGGCTGGATGGTGGAGCTGGTAGCTTGATCAAGTGGAACCCTGTGGCTAATGTGGATGGCAAGGATATCTGGACCTTCCTCAGGACCATGGATGTCCCTGTGAACACCCTGCATGCTCAAGGCTACGTCTCCATTGGGTGCGAGCCGTGCACCAGGCCCGTGTTGCCGGGGCAGCACGAGAGGGAAGGGAGGTGGTGGTGGGAGGACGCCACGGCCAAGGAGTGCGGTCTCCACAAGGGTAACATCGACAAGGAAGGTCAAGACACCCAAGGTCNGGCGTCAACGNCAACGGCTCGGCTGAGGCCAGTGCCCCAGACATCTTCCAGAGCCAGGCAATCGTCAATCTCACCCGTCCCGGGATCGAGAACGGTGATTTGAGAATTCCAGCATCTTTCTGTGGTGTACTTGGTTTCCGGTCTTCTCATGGGGTTGTGTCTACTCTTGGGACCTTACCGAACTCACATAGCCTAGATACCATTGGATGGCTTGCACGAGATCCTCATATACTTAGTCGTGTTGGAGATGCTCTGTTACCCGTTGCTGCATGTGGACTTAAGGGGAAACTGAGGCCAGTGCCACGTTATGGCAGTA ~2000 Nukleotide

Genomgrößen Virus-Genom 5 * 2.000 = 10.000 Bakterien-Genom 150 * 2.000 = 3.000.000 Kleinstes Pflanzengenom (Arabidopsis Thaliana) 60.000 * 2.000 = 120.000.000 menschliches Genom 1.500.000 * 2.000 = 3.000.000.000 Gersten-Genom 2.500.000 * 2.000 = 5.000.000.000 größtes Pflanzengenom 60.000.000 * 2.000 = 120.000.000.000

Grundlagen aus dem Bereich Informatik

Computer und Betriebsysteme wichtigstes Werkzeug der Bioinformatik: Computer verschiedene „Kategorien“: Personalcomputer Großrechner … Betriebssysteme: Windows MacOS Unix (Solaris, Linux) Frage: Was ist relevant für Bioinformatik? Plattformübergreifende Lösungen bzw. Programmiersprachen: Java Perl Python

Internet und WWW Internet basiert auf militärischer Entwicklung in USA ARPANET: Ausfall eines Teils des Netzwerkes führt nicht zum Totalausfall -> Vorgänger des Internets Kommunikationsprotokolle TCP/IP Namenspaten für Internet Internet = über TCP/IP verbundene Netzwerke Entwicklung des WWW 1990/91 durch Tim Berners-Lee (CERN) WWW ist nur ein Angebot (Service) im Internet!!! Moderne Browser (IE, Netscape, Firefox) sind Programme zur Nutzung des Service WWW Primärziel bei Konzeption und Entwicklung: wissenschaftlicher Datenaustausch wichtige Rolle auch in der Bioinformatik! Parallelität zwischen modernen Methoden im Labor (z.B. DNA-Sequenzierung) und Verbreitung der Angebote im WWW zur Bereitstellung von Informationen!!!

Internet - Struktur Verbindung vieler Netze gemeinsames Protokoll keine gemeinsame Steuerung jeder trägt bei stabil durch Redundanz unpolitisch

Vergleich: Was ist ein LAN?

Physikalische Anbindung an das Internet privater Bereich: analoges Modem ISDN =Integrated Services Digital Network (asynchrones) DSL = Digital Subscriber Line „Steckdose“ oder Kabelanschluss Satellit WLAN … Unternehmen bzw. Forschungseinrichtungen: Standleitungen zu DFN oder anderen Anbietern Anstieg der Übertragungs- kapazität

Logische Anbindung an das Internet Serviceanbieter: Vermittlung zwischen Kunden und Internet Standleitung ans Internet 2 Gruppen mit fließendem Übergang Internet Service Provider Content Provider Beipiele: AOL T-Online Freenet Arcor 1&1 Alice …

Internet Services Email: News FTP SSH und SCP World Wide Web !  ? schwarzes Brett FTP textbasiert, runterladen der Dateien SSH und SCP Verschlüsselung World Wide Web kein runterladen notwendig Navigation durch Hyperlinks URL = Uniform Ressource Locator Beispiel: http://pgrc.ipk-gatersleben.de/fhanhalt/index.php

Die Benutzung von Unix Aussage: Linux-Kenntnisse sind elementar, um moderne Bioinformatik Werkzeuge (wie z. B. BLAST) im Hochdurchsatz effizient anwenden zu können!!! Empfehlung: Teilnahme an einem Linux-Kurs oder Installation einer entsprechenden Distribution auf eigenem PC! -> Erhöhung der Chancen im Beruf!!!!

Daten und Informationen Daten sind Gebilde aus Zeichen oder kontinuierliche Funktionen, die aufgrund bekannter oder unterstellter Abmachungen Information(en) darstellen, vorrangig zum Zweck der Verarbeitung oder als deren Ergebnis. ... In der Informatik versteht man beispielsweise unter Daten alles, was sich in einer für einen Computer erkennbaren Weise codieren lässt. [M. G. Zilahi-Szabó, Herausgeber. Kleines Lexikon der Informatik.München, Oldenbourg, 1995.] Informationen: Informationen sind aus Daten geschlussfolgerte Fakten bzw. deren Interpretationen.

Datenbanken etc. [G. Saake, I. Schmitt und C. Türker Datenbanken etc. [G. Saake, I. Schmitt und C. Türker. Objektdatenbanken — Konzepte, Sprachen, Architekturen. International Thomson Publishing, Bonn, 1997.] Datenbank: Eine Datenbank ist eine strukturierte Sammlung von Daten, welche Fakten über spezielle Anwendungen eines modellierten Ausschnittes der Realwelt repräsentiert, die dauerhaft (persistent) und weitgehend redundanzfrei gespeichert wird. Datenbank-Management-System: Die Software, die eine Sammlung von Programmen bereitstellt, welche das anwendungsabhängige Erzeugen, Ändern und Löschen einer Datenbank ermöglicht, wird als Datenbank-Management-System (DBMS) bezeichnet. Datenbanksystem: Unter einem Datenbanksystem (DBS) wird stets die Kombination eines Datenbank-Management-Systems mit einer oder mehreren, unterscheidbaren Datenbanken verstanden.

Datenbanken ... ... Aufgaben: Integration Operationen Katalog Nutzersichten Konsistenzüberwachung Datenschutz Transaktionen Synchronisation Backup und Recovery Anwendung 1 Anwendung n ... DBMS Datenbank ... [E. F. Codd. Relational Database: A Practical Foundation for Productivity. Communications of the ACM, 25(2):109–117, Februar 1982.] DBS

Informationssystem persistente Speicherung der Informationen Wiedergewinnung der Informationen basierend auf verschiedenen Abfragekriterien anwendungsspezifische Auswertung und Aufbereitung der gespeicherten Informationen integritätserhaltende Änderungsoperationen Integration von zusätzlichen Informationsquellen: externe Datenquellen Informationszugriff über das WWW kooperierender Zugriff … Modellierung von Nutzerschnittstellen und Nutzerführung Verteilungsaspekte Bestandteil jedes Informationssystems ist ein DBS!!!

Datenquelle und Flat-File Eine Datenquelle besteht aus mindestens einem Computer (rechentechnische Einheit), auf dem Daten gespeichert sind und auf die über bestimmte Schnittstellen zugegriffen werden kann. Flat-File: Ein Flat-File ist eine Datei, die eine bestimmte, implizite Struktur besitzt. Ist ein Flat-File auf einem Rechner verfügbar, so wird diese Kombination auch als Datenquelle verstanden. Beispiel: ENTRY EC 2.1.3.3 NAME Ornithine carbamoyltransferase Citrulline phospharylase Ornithine transcarbamylase CLASS Transferases Transferring one-carbon groups Carboxyl- and carbamoyltransferases SYSNAME Carbamoyl-phosphate: L-ornithine carbamoyltransferase ...

Datenintegration und Informationsfusion Die Datenintegration hat das Ziel, die Redundanz zu vermeiden und sie erfordert die einheitliche Verwaltung aller von Anwendungen bzw. von Anwendern benötigten Daten. Informationsfusion: Sie charakterisiert einen Prozess, dessen Aufgabe es ist, Daten oder Informationen aus verschiedenen, zum Teil heterogenen Datenquellen zu kombinieren, zu verdichten, zu interpretieren und daraus Informationen einer neuen Qualität abzuleiten. [G. Saake und A. Heuer. Datenbanken — Implementierungstechniken. MITP-Verlag, Bonn, 1999.]

Datenintegration und Informationsfusion: Beispiel

Ansätze zur Datenintegration: Klassifikation © Kai-Uwe Sattler, Magdeburg 2003

Ausgewählte Möglichkeiten zur Datenintegration 1. Hypertextnavigation [P. D. Karp. A Strategy for Database Interoperation. Journal of Computational Biology, 2(4):573–586, 1995.] 2. Föderiertes Datenbanksystem [A. P. Sheth und J. A. Larson. Federated Database Systems for Managing Distributed, Heterogeneous, and Autonomous Databases. ACM Computing Surveys, 22(3):183–236, September 1990.] [S. Conrad. Föderierte Datenbanksysteme: Konzepte der Datenintegration. Springer-Verlag, Berlin/Heidelberg, 1997.] 3. Mediator [G. Wiederhold. Mediators in the Architecture of Future Information Systems. IEEE Computer, 25(3):38–49, März 1992.] 4. Multidatenbanken 5. Data Warehouse [W. H. Inmon. Building the Data Warehouse. John Wiley & Sons, Inc., 2. Auflage, 1996.]

Keine echte Datenintegration! Hypertextnavigation Keine echte Datenintegration! © Jacob Köhler, Bielefeld 2003

Föderiertes Datenbanksystem (FDBS) © Höding, Türker, Janssen, Sattler, Conrad, Saake, Schmitt, Magdburg 1995

Föderiertes Datenbanksystem (FDBS) Zusammenfassung von mehreren DBS Bezeichnung als Komponenten-DBS (KDBS) Aufrechterhaltung der Autonomie aller KDBS zuerst KDBS immer echtes Datenbanksystem später auch Anbindung von Dateien als Datenquellen wesentlicher Bestandteil ist Föderierungsdienst Aufgabe: Zugriffssteuerung für globale Anwendungen aber: einige Probleme!!!

Mediator © Wiederhold 1992

Mediator Einführung als Alternative zu FDBS Grund: schwieriger Entwurf von großen föderierten Schemata Einsatz von kleinen Vermittlern Mediator: abgeschlossene Softwaremodule mit definierten Schnittstellen keine generelle Verwaltungssoftware (wie Föderierungsdienst) -> viele einzelne Module Besonderheit: kaskadierende Mediatoren Entwicklung von integrierten Schemata in jedem Mediator -> mehre kleinere Schemata -> Einbindung neuer Datenquellen einfacher

Multidatenbanken

Multidatenbanken in DB-Literatur taxonomisch über FDBS, aber in Bioinformatik gleichberechtigter Ansatz! Einsatz einer geeigneter Anfragesprache: Multidatenbankanfragesprache dadurch Definition des verteilten Zugriffs auf Datenquellen Formulierung komplexer Anfragen zur Spezifikation der Informationen und der Datenquelle Realisierung des Zugriffs durch datenquellen-spezifische Treiber Fortsetzung ...

Data Warehouse

Data Warehouse Transformation des Inhalts heterogener Datenquellen: Überführung der Datenquellenschemata in gemeinsames Datenmodell Modellierung eines integrierten Schema (Probleme ähnlich wie bei FDBS) Einbindung neuer Datenquellen immer neue Modellierung notwendig Import dieses Resultats in die Data Warehouse Datenbank Realisierung des physischen Zugriffs über Treiber (spezifische Softwaremodule) durch Import Verlust der Autonomie des Datenquellen (KDBS) eine monolithische Datenbank Fortsetzung ...

Data Warehouse Arbeit auf Kopie der Originaldaten Vorteil in Bezug auf Verfügbarkeit Nachteil bei Änderung der Originaldaten -> neuer Import laut Definition: Nicht-Flüchtigkeit Abschwächung -> Ändern oder Löschen zulassen historische Datensammlung Abschwächung -> keine Zeitreihenanalysen ein Zweck zum Aufbau eines Data Warehouses: Informationsfusion Fortsetzung ...

Data Warehouse: Charakteristika Fachorientierung (subject oriented): Zweck des Systems ist nicht die Erfüllung eienr Aufgabe z.B. Personaldatenverwaltung), sondern Modellierung eines spezifischen Anwendungsziels Integrierte Datenbasis (integrated): Verarbeitung von Daten aus mehren verschiedenen Datenquellen (intern oder extern) Nichtflüchtige Datenbasis (non-volatile): Abschwächung! stabil, persistent! Daten im DW werden nicht mehr entfernt oder geändert! Historische Daten (time variant): Abschwächung! Vergleich der Daten über Zeit möglich (Zeitreihenanalysen) Speicherung über längeren Zeitraum © Eike Schallehn, Magdeburg 2003

Data Warehouse: Beispiel-Szenario (I) © Eike Schallehn, Magdeburg 2003

Data Warehouse: Beispiel-Szenario (II) Anfragen: Wie viele Flaschen Bier wurden letzten Monat verkauft? Wie hat sich der Verkauf von Rotwein im letzten Jahr entwickelt? Wer sind unsere Top-Kunden? Von welchen Lieferanten beziehen wir die meisten Kisten? Probleme: Nutzung externer Quellen (Kundendatenbank, Lieferantendatenbank, ...) Daten mit historischen Bezug © Eike Schallehn, Magdeburg 2003

Data Warehouse: Ergebnis(-Würfel) Welche Umsätze sind in den Jahren 1998 und 1999 in den Abteilungen Kosmetik, Elektro und Haushaltwaren in den Bundesländern Sachsen-Anhalt und Thüringen angefallen? © Eike Schallehn, Magdeburg 2003

Data Warehouse: Ergebnis(-Bericht) © Eike Schallehn, Magdeburg 2003

Plant Data Warehouse am IPK (I)

Plant Data Warehouse am IPK (II) Anfragen: Wie viele Genbank-Samenproben wurden im letzten Monat verschickt? Welche Genbank-Accessions wurden im letzten Jahr erfolgreich innerhalb von IPK-Projekten eingesetzt? Wer sind unsere „Top-Kunden“ unter den Züchtungsunternehmen? Mit welchen Substanzen (z.B. Enzymen) von welchen Lieferanten wurden die meisten Marker experimentell nachgewiesen und erfolgreich kartiert? Probleme: Nutzung verschiedener Quellen (GBIS, CR-EST, MOMA, FLAREX, ...) Daten mit historischen Bezug

Bioinformatik in der modernen Biotechnologie Internet

Relationenmodell & Entity-Relationship-Modellierung QUELLE: Thoralf Töpel: Web-basierte Informationssysteme in der molekularen Bioinformatik, Vorlesung, SoSe 05