Ontologische Kritik der Genia-Ontologie

Slides:



Advertisements
Ähnliche Präsentationen
Generalisierung/Spezialisierung (1)
Advertisements

Protégé für Fortgeschrittene nach dem Pizza-Tutorial
Design Patterns- Entwurfsmuster
Art der Arbeit (Projekt-/Studien-/Diplomarbeit/
Seminar “Kognitionspsychologie meets Ethnologie” SS 2007
RDF R ESOURCE D ESCRIPTION F RAMEWORK Referentin: Claudia Langer.
CIDOC-CRM Universität zu Köln Historisch-kulturwissenschaftliche Informationsverarbeitung AM 2 Dozent: Prof. Dr. Manfred Thaller Referent: Nelson Marambio.
OWL Web Ontology Language. Begriff Ontologie Όν + λόγος sein Grund Lehre Wort.
Einführung XML XML Einführung Andreas Leicht.
Jan Fienhold1 Institut für Informatik Betriebliche Informationssysteme OWL Web Ontology Language.
Explizite und editierbare Metainformationen für Software Muster.
XML / RDF / OWL in Protégé Aufbau · OWL · Code · Demo · Ausblick
CIDOC CRM aus der Sicht von Ontologienutzern. CIDOC CRM - (Formale) Ontologie für die Dokumentation in den Kulturwissenschaften – ISO 21127: A Reference.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
RDF MT Resource Description Framework Model Theory © 2002 by Emir Blažević
Machen Sie sich schlau am Beispiel Schizophrenie.
Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Towards Automatic Composition of Processes based on Semantic.
Automatic composition of UI mashups Vortrag zum Seminar Webengineering 2011 Michael Reißner.
1. Nimm ein Deutsch II Buch. 2. If your parents have signed the classroom expectations form, please put it out on your desk. 2. Schreib 3 Sӓtze: Wann war.
INTAKT- Interkulturelle Berufsfelderkundungen als ausbildungsbezogene Lerneinheiten in berufsqualifizierenden Auslandspraktika DE/10/LLP-LdV/TOI/
TEST - RECAP PRESENT PERFECT TENSE
Formale Sprachen Grammatiken und die Chomsky-Hierarchie
NDepend - Kurzvorstellung Stefan Lieser Web:
Clean Code Software-Entwicklung als Handwerkskunst Thomas Nagel, November 2011.
Alle Zellen brauchen Kohlenstoff  Konstruktionswerkstoff (1)
Universität StuttgartInstitut für Wasserbau, Lehrstuhl für Hydrologie und Geohydrologie Copulas (1) András Bárdossy IWS Universität Stuttgart.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Der formelle Imperativ – the Imperative
Typische Fehler bei der Ontologie-Entwicklung
Konjugier,,sein”! ichwir du ihr er, sie,essie, Sie.
Lust auf Lesen Treffpunkt Deutsch Sixth Edition. Relative Pronoun object of a preposition Recall from chapter 9 that relative clauses describe people,
Die Fragen Wörter Wer? Was? Wann?.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle Semantic WebWS 08/09.
Lexit.at Michael Hausenblas Semantische Darstellung und Abfrage von Rechtsnormen – IRIS 2004 Semantische Darstellung und Abfrage von Rechtsnormen am Beispiel.
Stephanie Müller, Rechtswissenschaftliches Institut, Universität Zürich, Rämistrasse 74/17, 8001 Zürich, Criminal liability.
glucose. lipoproteins, plasma proteins, amino acids, keton bodies, urea, bile, retinol, glucoronides exported metabolies and signalling molecules DNA.
Literary Machines, zusammengestellt für ::COLLABOR:: von H. Mittendorfer Literary MACHINES 1980 bis 1987, by Theodor Holm NELSON ISBN
Vorläufiges Programm, interaktiv 1. Einordnung der Biotechnologie als eine Einführung 2. Der jetzige Stand 3. Einige molekularbiologische Grundlagen 4.
The perfect tense Vital for a good grade!!. There are 2 parts to the perfect tense 1)The correct part of haben (or sein) 2) + the past participle.
Seminar Computing with words WS2001/02 1 Linguistische Hecken Simon Meyer.
? definierende Gleichungen  gültige Gleichungen ?
Frau McKeag. Märchen fangen fast immer an mit "Once upon a time," oder "Es war einmal…”
Proteins Lennart Voß Marie Ullrich. 1. Central questions What are proteins? How does the human body produce proteins? Which functions do proteins fulfill?
Cell autonomous pre-BCR signaling Onishi and Melchers
Gregor Graf Oracle Portal (Part of the Oracle Application Server 9i) Gregor Graf (2001,2002)
EUROPÄISCHE GEMEINSCHAFT Europäischer Sozialfonds EUROPÄISCHE GEMEINSCHAFT Europäischer Fonds für Regionale Entwicklung Workpackage 5 – guidelines Tasks.
Kapitel 2 Grammar INDEX 1.Subjects & Verbs 2.Conjugation of Verbs 3.Subject Verb Agreement 4.Person and Number 5.Present Tense 6.Word Order: Position of.
German Verb Conjugation
Kapitel 8 Grammar INDEX 1.Command Forms: The Du-Command Form & Ihr- Command 2.Sentences & Clauses.
Reflexiv-Verben Deutsch 2/AC.
Kapitel 5: Einkaufen Sprache. Alles klar Look over and know all of the Wortschatz on Seite 171 and 172. Look over the illustration found on Seite 145.
Steroidhormone und ihre Rezeptoren Warum wichtig: regeln viele Entwicklungsprozesse und bei Wirbeltieren: Sexualität relevante Prozesse 1.Molekularer Mechanismus.
(Name of presenter) (Short title of presentation).
The FUTURE to boldly go where no man has boldly gone before!
Cobra 120 Tablets Price In Pakistan
GH-behandelte vs. unbehandelte UTS-Patientinnen: Vergleich von Körperzusammensetzung und Kohlenhydratstoffwechsel SAT and VAT were measured by MRI. IGT.
Deutsch I für Anfänger Beginning German I
Synonyms are two or more words belonging to the same part of speech and possessing one or more identical or nearly identical denotational meanings, interchangeable.
Telling Time in German Deutsch 1 Part 1.
Deutsch I für Anfänger Beginning German I
Uranus. Uranus is the seventh in terms of distance from the Sun, the third in diameter and the fourth in mass of the planet of the Solar System. It was.
Deutsch I für Anfänger Introduction to German Verb Conjugation.
Integrating Knowledge Discovery into Knowledge Management
Reflexive Verbs.
- moodle – a internet based learning platform
Beginning German I Frau Caplan-Carbin
Zhunussova G., AA 81. Linguistic communication, i.e. the use of language, is characteristically vocal and verbal behaviour, involving the use of discrete.
 Präsentation transkript:

Ontologische Kritik der Genia-Ontologie Stefan Schulz, Elena Beißwanger, Anand Kumar

Genia Ontologie und Korpus Entwickelt am Tsuji-Lab, Tokio Anspruch (WWW): “The GENIA ontology is intended to be a formal model of cell signaling reactions in human. It is to be used as a basis of thesauri and semantic dictionaries for natural language processing applications, e.g., Information retrieval (IR) & filtering (IF) Information extraction (IE) Document and term classification & categorization Summarization, etc. “ GENIA Corpus Ver. 3.0x: 2000 MEDLINE Abstracts. (MeSH terms: Human, Blood Cells, and Transcription Factors). Genia-Korpus ist annotiert mit Termen der Genia-Ontologie

+---+-source-+-natural-+-organism-+-multi-cell organism        |               |              |                 +-mono-cell organism        |               |              |                 +-virus        |               |              +-body part        |               |              +-tissue        |               |              +-cell type        |               |              +-cell component        |               |              +-other (natural source)        |               +-artificial-+-cell line        |                                +-other (artificial source)        +-substance-+-compound-+-organic-+-amino acid-+-protein-+-protein family or group        |                   |                   |               |                   |              +-protein complex        |                   |                   |               |                   |              +-individual protein molecule        |                   |                   |               |                   |              +-subunit of protein complex        |                   |                   |               |                   |              +-substructure of protein        |                   |                   |               |                   |              +-domain or region of protein        |                   |                   |               |                   +-peptide        |                   |                   |               |                   +-amino acid monomer        |                   |                   |               +-nucleic acid-+-DNA-+-DNA family or group        |                   |                   |               |                      |          +-individual DNA molecule        |                   |                   |               |                      |          +-domain or region of DNA        |                   |                   |               |                      +-RNA-+-RNA family or group        |                   |                   |               |                      |          +-individual RNA molecule        |                   |                   |               |                      |          +-domain or region of RNA        |                   |                   |               |                      +-polynucletotide        |                   |                   |               |                      +-nucleotide        |                   |                   |               +-lipid-+-steroid        |                   |                   |               +-carbohydrate        |                   |                   |               +-other (organic compounds)        |                   |                   +-inorganic        |                   +-atom        +-other

Genia Ontologie

Genia Ontologie als Annotationsvokabular UI - 85146267 TI - Characterization of <NE ti="3" class="protein" nm="aldosterone binding site" mt="SV" subclass="family_or_group" unsure="Class" cmt="">aldosterone binding sites</NE ti="3"> in circulating <NE ti="2" class="cell_type" nm="human mononuclear leukocyte" mt="SV" unsure="OK" cmt="">human mononuclear leukocytes</NE ti="2">. AB - <NE ti="4" class="protein" nm="Aldosterone binding sites" mt="SV" subclass="family_or_group" unsure="Class" cmt="">Aldosterone binding sites</NE ti="4"> in <NE ti="1" class="cell_type" nm="human mononuclear leukocyte" mt="SV" unsure="OK" cmt="">human mononuclear leukocytes</NE ti="1"> were characterized after separation of cells from blood by a Percoll gradient. After washing and resuspension in <NE ti="5" class="other_organic_compounds" nm="RPMI-1640 medium" mt="SV" unsure="OK" cmt="">RPMI-1640 medium</NE ti="5">, cells were incubated at 37 degrees C for 1 h with different concentrations of <NE ti="6" class="other_organic_compounds" nm="[3H]aldosterone" mt="SV" unsure="OK" cmt="">[3H]aldosterone</NE ti="6"> plus a 100-fold concentration of <NE ti="7" class="other_organic_compounds" nm="RU-26988" mt="SV" unsure="OK" cmt="">RU-26988 </NE ti="7">(<NE ti=“17" class="other_organic_compounds" nm="11 alpha, 17 alpha-dihydroxy-17 beta-propynylandrost-1,4,6-trien-3-one" mt="SV" unsure="OK" cmt="">11 alpha, 17 alpha-dihydroxy-17 beta-propynylandrost-1,4,6-trien-3-one</NE ti=“17">), with or without an excess of unlabeled <NE ti="8" class="other_organic_compounds" nm="aldosterone" mt="SV" unsure="OK" cmt="">aldosterone</NE ti="8">. <NE ti="9" class="other_organic_compounds" nm="Aldosterone" mt="SV" unsure="OK" cmt="">Aldosterone</NE ti="9"> binds to a single class of <NE ti="10" class="protein" nm="receptor" mt="SV" subclass="family_or_group" unsure="OK" cmt="">receptors</NE ti="10"> with an affinity of 2.7 +/- 0.5 nM (means +/- SD, n = 14) and a capacity of 290 +/- 108 sites/cell (n = 14). The specificity data show a hierarchy of affinity of <NE ti="11" class="other_organic_compounds" nm="desoxycorticosterone" mt="SV" unsure="OK" cmt="">desoxycorticosterone</NE ti="11"> = <NE ti="12" class="other_organic_compounds" nm="corticosterone" mt="SV" unsure="OK" cmt="">corticosterone</NE ti="12"> = <NE ti="13" class="other_organic_compounds" nm="aldosterone" mt="SV" unsure="OK" cmt="">aldosterone</NE ti="13"> greater than <NE ti="14" class="other_organic_compounds" nm="hydrocortisone" mt="SV" unsure="OK" cmt="">hydrocortisone</NE ti="14"> greater than <NE ti="15" class="other_organic_compounds" nm="dexamethasone" mt="SV" unsure="OK" cmt="">dexamethasone</NE ti="15">. The results indicate that <NE ti="17" class="cell_type" nm="mononuclear leukocyte" mt="SV" unsure="OK" cmt="">mononuclear leukocytes</NE ti="17"> could be useful for studying the physiological significance of these <NE ti="16" class="protein" nm="mineralocorticoid receptor" mt="SV" subclass="family_or_group" unsure="OK" cmt="">mineralocorticoid receptors</NE ti="16"> and their regulation in humans.

Unser Verständnis einer formalen Ontologie Klare Festlegung des Diskursbereichs, im Fall von Genia: konkrete physikalische Entitäten aus der Molekularbiologie (z.B. Nukleotide, Zellen, Gewebe) Eindeutige Charakterisierung der ontologischen Natur der Entitäten (Klassen, Konzepte, Individuen) Eindeutige Semantik von Relationen, Operatoren und Quantoren Anbindung an domänenunabhängige “Upper Ontology” wünschenswert Soweit möglich, Angabe von hinreichenden und notwendigen Bedingungen, also vollständige Definitionen (Aristoteles: genus + differentia)

Taxonomie als Rückgrat formaler Ontologien Taxonomischer Link “Is-A” (ist ein) Leber Is-A Organ: für alle Instanzen von Klasse/Konzept/Typ Leber gilt, dass sie auch Instanzen von Klasse/Konzept/Typ Organ sind Normalerweise mengentheoretische Deutung, daher klare Semantik Klassen werden verstanden als Mengen, die über die Zeit persistieren und dabei Elemente gewinnen und verlieren können.

Wofür stehen die “Knoten” einer Ontologie ?? types names sets universals sorts categories descriptors entities synsets classes terms properties descriptors concepts

Konzepte („entities of thought“) Namen, (logische) Prädikate Phil. Tradition Realisten Konzeptualisten Nominalisten Universalien ,Typen Konzepte („entities of thought“) Namen, (logische) Prädikate Kategorien trilateral rectangle square circle triangle square circle Bezug Klassen von Dingen der Realität (die nicht von unserer Kognition abhängen) Individuen, Instanzen, Partikularien

Probleme der Genia-Ontologie Taxonomie (Begriffshierachie), keinerlei Anbindung an domänenunabhängige “Upper Ontology” Keine Relationen außer Klasseninklusion (Is-A) Definitionen nur in natürlichsprachliche Ausdrücken, meist unscharf, teils rein extensional

Sources are biological locations where substances are found and their reactions take place, such as human (an organism), liver (a tissue), leukocyte (a cell), membrane (a sub-location of a cell) or HeLa (a cultured cell line).

“Source” ist eine Rolle, kein diskriminierendes Merkmal Sources: “Sources are biological locations where substances are found and their reactions take place, such as human (an organism), liver (a tissue), leukocyte (a cell), membrane (a sub-location of a cell) or HeLa (a cultured cell line)”. Klasseneinteilung sollte gemäß stabiler Merkmale der zu klassifizierenden Entitäten erfolgen. (Zellen können sowohl in Organismen als auch in Gewebekulturen vorkommen) “Source” ist eine Rolle, kein diskriminierendes Merkmal

Sources are biological locations where substances are found and their reactions take place, such as human (an organism), liver (a tissue), leukocyte (a cell), membrane (a sub-location of a cell) or HeLa (a cultured cell line). A tissue, e.g., peripheral blood, lymphoid tissue, vascular endothelium

Tissue: “A tissue, e.g., peripheral blood, lymphoid tissue, vascular endothelium” Keine Definition Rein extensionale Beschreibung: Aufzählung einiger Unterklassen, ohne Angabe differenzierender Kriterien

An amino acid molecule or the compounds that consist of amino acids. Sources are biological locations where substances are found and their reactions take place, such as human (an organism), liver (a tissue), leukocyte (a cell), membrane (a sub-location of a cell) or HeLa (a cultured cell line). An amino acid molecule or the compounds that consist of amino acids. A tissue, e.g., peripheral blood, lymphoid tissue, vascular endothelium

Richtig wäre z.B. “Amino_acid_or_amino_acid_containing_biomolecule” Amino Acid: An amino acid molecule or the compounds that consist of amino acids. Sprachlich exakte logische Definition, die jedoch nicht der üblichen Bedeutung von Aminosäure entspricht Richtig wäre z.B. “Amino_acid_or_amino_acid_containing_biomolecule”

An amino acid molecule or the compounds that consist of amino acids. Sources are biological locations where substances are found and their reactions take place, such as human (an organism), liver (a tissue), leukocyte (a cell), membrane (a sub-location of a cell) or HeLa (a cultured cell line). An amino acid molecule or the compounds that consist of amino acids. A peptide e.g., peptide hormone, 15 amino acids, 18-20 residue-long peptide fragment A tissue, e.g., peripheral blood, lymphoid tissue, vascular endothelium

Statt Definition ist eine prototypische Instanz angegeben Peptide: A peptide e.g., peptide hormone, 15 amino acids, 18-20 residue-long peptide fragment Statt Definition ist eine prototypische Instanz angegeben

Verwirrend: Was ist eine Instanz von Cell_Type ? Uneinheitliche Namensgebung: “Cell_Type”, aber warum nicht “Tissue_Type”: Verwirrend: Was ist eine Instanz von Cell_Type ? eine Einzelzelle eine Klasse von Zellen? Ein Konzept Problem: Die Bezeichnung von Klassen als Typen lässt Meta-Kategorien vermuten. Ist das gewollt ?

Was ist eine Instanz von “Cell_Line”? Fehlende Anbindung an eine “Upper Ontology” verhindert genaue Charakterisierung. Was ist eine Instanz von “Cell_Line”? eine Einzelzelle eine Menge von Einzelzellen eine Zellfamilie Was ist eine Instanz von “Tissue”: eine genau umrissene Gewebeprobe ? eine arbiträre Menge von Gewebe die Gesamtheit allen Gewebes

Resteklassen Ontologisch irrelevant, da keine gemeinsame, identitätsstiftende Eigenschaft Aus praktischen Gründen (zur Annotation) gerechtfertigt. Definition als logisches Komplement

Geschwisterklassen (“siblings”) In GENIA als taxonomische Unterklassen oft bedenklich ist Substructure of Protein nicht eher part-of Protein ? ist eine Instanz von Protein_Family_Or_Group eine Instanz von Protein ? Bilden die Siblings eine komplette Partition, oder gibt es Überlappungen oder Lücken? Siblings unvergleichbar “Proteins include protein groups, families, molecules, complexes, and substructures” Definition der Oberklasse unscharf

Partonomien als 2. wichtiges Ordnungsprinzip für Ontologien In OBO gleichberechtigt zu Is-A In Genia nicht oder höchstens implizit in Klassennamen (Body_Part) vorhanden Part-Of und Has-Part: Transitive Relationen zwischen Klassen Definition nach OBO (Smith et al.) A Part-Of B heißt: jede Instanz von A ist Teil einer Instanz von B B Has-Part A heißt: für jede Instanz von B gibt es eine Instanz von A, die davon Teil ist Wichtig: A Part-Of B impliziert nicht B Has-Part A

Von Genia zu Genia-OWL OWL (ontology web language): standarisierte, logikbasierte Sprache des Semantic Web Genia-OWL: logikbasierte Definition der Genia-Klassen: eindeutige Definitionen weitgehende Abstraktion von natürlicher Sprache höhere Reliabilität bei der Annotation Interface zu anderen formalen Ontologien maschinelles Schließen

Genia-OWL

 x:P(x)  y,z: x=y+z  (P(y)  M(y))  (P(z)  M(z))