Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Semantisches Datenmodell für flächenbezogene Daten

Ähnliche Präsentationen


Präsentation zum Thema: "Semantisches Datenmodell für flächenbezogene Daten"—  Präsentation transkript:

1 Semantisches Datenmodell für flächenbezogene Daten
Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

2 Gliederung Flächenbezogene Daten Semantisches Datenmodell Fazit
Entwurfsebenen Beschreibung konsistenter Zustände Definition von Produktionen Konsistenz Schemadefinition Fazit

3 Flächenbezogene Daten
Zweidimensionales Ordnungskriterium Höhe als gesondertes, sekundäres Kriterium Z.B.: Linien, Strecken, Punkte Unterschied zu administrativen Daten: stärkere innere Verknüpfung Stärkere innere Verknüpfung: z:B. Flächen/Grenzflächen

4 Flächenbezogene Daten
Durch den Raumbezug müssen neben messbaren auch topologische Eigenschaften (z.B. Nachbarschaftsbeziehungen) und deren Manipulation modelliert werden. Nachteile der klassischen Datenmodelle: Topologische Eigenschaften und andere semantische Zusammenhänge müssen umständlich und oft indirekt dargestellt werden. Relationen- und Netzwerkmodell legen Schwerpunkt auf Informationsstrukturierung und nicht auf Datenmodellierung. Dynamische Aspekte sind nicht voll im Datenmodell integriert. Topologie: Unter Topologie versteht man den Sachverhalt, dass in einer Darstellung metrische Verhältnisse keine Rolle spielen, sondern nur die gegenseitige Lagebeziehung von Bedeutung ist.

5 Flächenbezogene Daten
Flächenbezogene Konsistenzbedingungen stellen zusätzliche Anforderungen an ein Datenbanksystem, diese betreffen metrische und topologische Beziehungen, z.B.: Ein Grenzpunkt einer Parzelle ist mindestens an zwei Grenzstrecken beteiligt, d.h. es gibt keine „freiliegenden“ Grenzpunkte Jeder Streckenzug hat genau einen Anfangs- und Endpunkt Jede Parzelle verweist auf mindestens einen Eigentümer

6 Anforderungen an ein flächenbezogenes Datenmodell
Berücksichtigung von semantische Zusammenhängen bei flächenbezogenen Daten. Geometrische Daten und deren Beziehungen müssen gleichberechtigt beschrieben und behandelt werden. Soll deskriptiv sein, da die Struktur und die Permanenz der Daten im Vordergrund stehen. Der deskriptive Ansatz zur Datenbeschreibung gilt auch für die Manipulationsseite. Muss der Datendefinition wie der -manipulation gleichermaßen gerecht werden. Soll problemorientiert sein, d.h. es soll eine möglichst große Klasse flächenbezogener Daten bewältigen. Muss einen formalen Rahmen haben, d.h. durch eine mathematische Theorie begründet sein. Das Modell muss für Erweiterungen und Ergänzungen offen bleiben. Neue Erkenntnisse und Anwendungsbeispiele sollten ohne allzu großen Aufwand ins bestehende System integriert werden können. Semantik: z.B. kann ein Punkt ein Flächen- oder Grenzpunkt sein. Je nach seiner Bedeutung muss er entsprechend behandelt werden. Deskriptiv im Gegensatz zu Operationell: Ein operationelles Konzept ist durch eine Menge von Operatoren gegeben. Diese bilden Objekte eines Definitionsbereichs auf Objekte des Zielbereichs in eindeutiger Weise ab (z.B. Algebra). Deskriptiv: vorerst wird eine Struktur aufgezeigt, darauf können weitere Zusammenhänge deduktiv durch Ableitungsschritte ermittelt werden. Bei der Vorgabe von Operatoren interessieren primär die auswertbaren ZUsamenhänge der Daten, deskriptive Konzepte zielen auf die Entflechtung von Strukturzusammenhängen

7 Semantisches Datenmodell
Das Modell kombiniert semantischen Untersuchungen (Theorie der Graphgrammatik) mit dem klassischen Relationenmodells („relationale“ Graphgrammatik) Von zentraler Bedeutung beim diesem Modell ist die einheitliche Beschreibung statischer und dynamischer Aspekte Damit unterscheidet sich das Modell von andern Ansätzen, welche zwischen der formalen Beschreibung der Datenstruktur und der Formalisierung von Manipulationssprachen trennen.

8 Semantisches Datenmodell
Beinhaltet Schichtenmodell Verschiedene Abstraktionsniveaus der Modellbildung erleichtern den Entwurf der Daten- und Manipulationsstruktur. Drei Entwurfsebenen: Zustandsebene, Darstellungsebene, Objektebene Zur Beschreibung der Datenstruktur werden allgemein markierte Graphen verwendet

9 Graphen Def.: Ein markierter Graph besteht aus einer Menge V von Knoten, einer Menge E von Kanten und einer Funktion a, welche der Menge der Kanten eine Menge ungeordneter Paare koinzidenter Knoten zuordnet. Def.: Ein gerichteter Graph oder Digraph ist ein markierter Graph, bei welchem die Funktion a, der Menge der Kanten eine Menge geordneter Paare verschiedener Knoten zuordnet.

10 Zustandsebene Die Zustandsebene beschreibt das eigentliche Vorkommen der Entitäten. Eine Entität wird durch Eigenschaft-Wertpaare charakterisiert. Entitäten lassen sich anschaulich durch Knoten und Kanten eines Graphen darstellen. Die Knoten eines solchen Zustandsgraphen entsprechen einzelnen Datenwerten, die Kanten zeigen die Bedeutung der Beziehung zwischen zwei Datenwerten auf. Def.: Ein Zustandsgraph besteht aus einer Menge von Datenwerten (Knotenmenge) und Beziehungen (Kantenmenge). Jede Beziehung ist mit der entsprechenden Eigenschaft der zugehörigen Eigenschaft-Wertpaare markiert. Der Zustandsgraph ist nicht gerichtet d.h. die Kanten repräsentieren gleichzeitig beide Beziehungsrichtungen. Diese Regelung gilt auf sämtlichen Entwurfsebenen. Der Zustandgraph beschreibt das Datenvorkommen und wichtige semantische Zusammenhänge. Nicht gerichtet: Beispielsweise wird beim Eigenschaft-Wertpaar „Punktart-PP“ des Punktes P1 implizit ausgedrückt, dass P1 ein Polygonpunkt ist und dass die Eigenschaft Polygonpunkt auf den Punkt P1 zutrifft. Entitäten werden durch Merkmale (Attribute) beschrieben. Das sind wichtige, die einzelnen Entitäten charakterisierende Eigenschaften, wie Größe, Standort, Bezeichnung, etc.. Ein wichtiges Merkmal ist insbesondere der Identifikationsschlüssel welcher die einzelnen Entitäten einer Entitätsmenge eindeutig identifiziert. BSP.- merkmale der Entitätsmenge Punkt: Punktenummer (Identifikationsschlüssel), X-Koordinat, Y-Koordinate, Höhenangabe, Punktetyp etc.

11 Zustandsebene Beispiel: Ein gerichtete Grenzstrecke S1 sei durch Anfangspunkt P1 und Endpunkt P2 definiert und trenne die beiden angrenzenden Flächen F1 und F2. Die Knoten enthalten die Datenwerte, die Kanten zeigen die Zusammenhänge zwischen den einzelnen Datenwerten. > shcon der Zustand einer einfachen Grenzstrecke kann zu einem umfangreichen semantischen Netz führen

12 Darstellungsebene Ideen und Begriffe basieren auf einer Erweiterung des Relationenmodells, bei welchem globale und lokale Datenaspekte unterschieden werden. Auf der Darstellungsebene werden einzelne Knoten und Kanten des Zustandsgraphen (Datenwert, Eigenschaft) in Klassen zusammengefasst. Diese Ebene dient also der Abstraktion, d.h. der datenmäßigen Beschreibung von Entitätsmengen. Die Zusammenfassung von Entitäten zu Entitätsmengen entspricht der Bildung von mathematischen Relationen (Tabellen). Pro Relation muss mindestens eine Schlüsselkombination vorhanden sein. Entitäsmengen können auch Beziehungen oder abstrakte Begriffe unserer Vorstellung modellieren. Die entsprechenden Attribute sind dann Beziehungsattribute. (BSP45)

13 Darstellungsebene Zur Beschreibung von Eigenschaften einer Entitätsmenge werden Attribute verwendet. Attribut: Funktion, welche eine Entitätsmenge in einen Wertebereich oder ein kartesisches Produkt von Wertebereichen abbildet. Bsp.: Entitätsmenge: PUNKT Wertemenge: pktart = (´GP`, ´TP1`, ´TP2`, ´TP3´) Attribut: Punktart Stimmen zwei Entitäten und sämtliche ihrer Wertkombinationen überein, so werden die beiden Entitäten identisch genannt. Diese identifizierende Eigenschaft kann bereits für einen Teil der Attributskombination gelten. Ist sie minimal, so dass bei Weglassen eines der Attribute der Kombination die eindeutige Identifizierbarkeit verletzt würde, so führt dies zum Begriff des Indentifikationsschlüssels.

14 Darstellungsebene Wertebereiche eines Primärschlüssels nennen wir global, solche einzelner Nichtprimärattribute heißen lokal. Die Attribute welche in globale bzw. lokale Wertebereiche abbilden, werden entsprechend global bzw. lokal genannt. Durch globale bzw. lokale Betrachtungen wird geklärt, ob gewisse Wertebereiche in verschiedenen oder ausschließlich einzelnen Entitätsmengen verwendet werden dürfen. DEF.: Ein Darstellungsgraph besteht aus globalen und lokalen Wertebereichen (Knotenmenge) und aus globalen und lokalen Attributen (Kantenmenge). Die Funktionen, markiert durch Attributsnamen, dürfen nur von globalen in globale bzw. von globalen in lokale Wertebereich abbilden. Im Allgemeinen gibt es verschiedene Schlüsselkandidaten , wobei oft physische oder praktische Betrachtungen die Auswahl des sogenannten Primärschlüssels nahe legen. Ist die Schlüsselkombination unzweckmäßig, d.h. sind z.B. zu viele oder ungünstige Attribute daran beteiligt, so kann auf künstliche Schlüssel ausgewichen werden (BSP.punkt) -> Darstellungsebene bereits globale und lokale Abgrenzungen -> weiter auf Objektebene

15 Darstellungsebene Darstellungsgraph einer disjunkten Flächenüberdeckung Flächen-, Strecken- und Punktenummern definieren globale Wertebereiche, da sie als Schlüsselattribute auftreten. Diese Nummern können globalen Betrachtungen dienen, wie Fragen von Koinzidenzen und Nachbarschaftsbeziehungen. Flächeninhalt, Streckenart und Koordinatenangaben verwenden lokale Wertebereiche und sind für globale Betrachtungen aus Konsistenzgründen nicht zugelassen.

16 Objektebene Auf der Objektebene werden die einzelnen Entitätsmengen und Beziehungen modelliert. Durch die dritte Normalform werden (m,n) Beziehungen zwischen Relationen aufgespalten. Dies ergibt eine sogennante Beziehungsrelation, in welche die globalen Attribute der zugehörigen Stammrelation eingehen. Allgemein wird jede Beziehung zwischen Entitätsmengen mittels globalen Attributen dargestellt. Unter der Rolle einer bestimmten Relation verstehen wir ein Attribut, welches in einer fremden Relation einen globalen Wertebereich referenziert -> Beziehungen zwischen verschiedenen Relationen werden ermöglicht/Globaleigenschaften

17 Objektebene Unterscheidung von drei Relationentypen:
Entitätsrelation: besitzt ausschließlich eigene Globalattribute Beziehungsrelation: darf nur Globalattribute fremder Relationen aufweisen Gemischte Relation: enthält eigene Globalattribute und solche fremder Relationen

18 Objektebene Def.: Ein Objektgraph besteht aus Relationen (in dritter Normalform) als Knotenmenge und Globalattributen als Kantenmenge.

19 Beschreibung konsistenter Zustände
Der geschilderte Entwurfsprozess führt iterativ zur relevanten Information und deren Struktur. Je nach Entwurfsebene stehen globale oder lokale Fakten im Vordergrund. Um die Menge sämtlicher konsistenter Zustände zu beschreiben, werden gerichtete Graphen verwendet. Die Einführung gerichteter Graphen ermöglicht, die Datendefinition und –manipulation einheitlich anzugeben. Bei der Datendefinition wird die Struktur der Daten und ihrer Beziehungen beschrieben, indem jedem konsistenten Zustand ein gerichteter Graph zugeordnet wird. Die Anwendung von Ableitungsregeln gerichteter (Prozess-) Graphen auf konsistente Zustände entspricht einer abstrakten Beschreibung der Datenmanipulation.

20 Strukturgraph Def.: Ein Strukturgraph ist ein gerichteter Graph und wie folgt definiert: Die Knoten entsprechen Relationen (Objektebene) oder globalen bzw. lokalen Wertebereichen (Darstellungsebene). Die Kanten sind gerichtet und zeigen die zu einer Relation gehörigen Global- bzw. Lokalattribute (im nicht markierten Fall) oder Rollen (im markierten Fall)

21 Strukturgraph BSP: Strukturgraph bestehend aus einer Entitätsrelation R1 und einer gemischten Relation R2

22 Definition von Produktionen
Def.: Eine Produktion (auch Produktionsregel) hat die folgende Form: <plist;plist>: <left side>  <right side> wobei die Parameterliste die zu substituierenden Größen für die Linke bzw. rechte Seite angibt, und die linke bzw. rechte Seite der Produktionsregel je einen Prozessgraphen darstellt. Die implizit gegebene Verklebungsvorschrift ermöglicht das Ersetzen des linken Prozessgraphen durch den rechten. Bei Graphersetzung muss im Restgraphen das Vorkommen der rechten Seite der Produktionsregel richtig eingebettet werden. Hier stellt sich im allgemeinen die Frage, welche Knoten des Restgraphen verbunden werden sollen. Die Produktionsregel enthält deshalb zusätzlich eine Verklebungsvorschrift.

23 Definition von Produktionen
Diese Ausführung der Produktion geschieht wie folgt: Zuerst werden die Formalparameter der linken und rechten Seite der Produktionsregel durch die Aktualparameter der Paramterliste ausgetauscht, danach wird der linke Prozessgraph als Vorkommen im aktuellen Datenbestand identifziert und durch den rechten Prozessgraph ersetzt.

24 Konsistenztheorem Jede Produktion überführt einen konsistenten in einen konsistenten Zustand (Abgeschlossenheit oder Konsistenzerhaltung) Jeder konsistente Zustand kann erzeugt werden (Vollständigkeit oder Konsistenzerzeugung) Die Produktionsregeln modellieren das dynamische Verhalten, indem jeder konsistente Zustand aus dem (initialen) Startgraphen hergeleitet wird. Konsistenzbedingungen lassen sich durch Eigenschaften der Prozessgraphen formulieren.

25 Seiteneffekte bei Datenmanipulationen
Verlangen wir bei Mutationsoperationen Konsistenzerhaltung, so müssen vor und nach der eigentlichen Ausführung gewisse Konsistenzbedingungen erfüllt sein. Bei den meisten Anwendungen können diese Konditionen isoliert überprüft werden; dies ist bei flächenbezogenen Daten selten der Fall. Geometrische Daten sind oft as Teilstrukturen zusammengesetzt und zeigen verschiedenste semantische Verbindungen.

26 Seiteneffekte bei Datenmanipulationen
Durch die Graphennotation werden die Seiteneffekte einer Produktion auf anschauliche Art freigelegt. Vor der eigentlichen Ausführung einer Manipulation müssen oft einzelne Datenwerte und semantische Verbindungen überprüft werden. Solche auftretenden Nachbarschaften und damit gekoppelte Seiteneffekte werden durch Prozessgraphen modelliert.

27 Seiteneffekte bei Datenmanipulationen
Def.: Ein Prozessgraph ist ein gerichteter Graph und wie folgt definiert: Die Knoten entsprechen Relationen (Objektebene) oder einzelnen Datenwerten, Konstanten oder Parameter (Zustandsebene). Die Kanten sind gerichtet und zeigen die zu einer Relation gehörenden Global- bzw. Lokalattribute (im nicht markierten Fall) oder Rollen (im markierten Fall) Definition des Prozessgraphen illustriert die Verwandtschaft zum Strukturgraphen der Datendefinition. Dabei liegt die Idee zugrunde, die Datenmanipulation aus der Daten und Strukturbeschreibung herzuleiten.

28 Seiteneffekte bei Datenmanipulationen
Beispiel: Produktion Flächenvereinen Präkondition u.a.: die beiden zu verschmelzenden Flächen Fn und Fm müssen vorerst einmal existieren und eine gemeinsame Trennlinie aufweisen (Sk). Diese Bedingung wird in der Zeichnung im linken Prozessgraphen durch eine gestrichelte Linie hervorgehoben und garantiert dass eine einfach zusammenhängende Fläche Fk resultiert (Nachkondition der Produktion) Der linke Prozessgraph von Flächenvereinen zeigt sämtliche Vorbedingungen zur Verschmelzung auf.

29 Entwurfsebenen Die Daten und die Beziehungen aus der lokalen Zustandssicht führen zu globalen Betrachtungen. Einzelne Produktionen stoßen vom Objektgraphen hinunter bis zu den einzelnen Datenvorkommen des Zustandsgraphen.  Diese Methode erlaubt also ein verträgliches Nebeneinander der Systemstruktur und des Systemverhaltens, wobei ersteres zeitunabhängige Beziehungen aufzeigt und letzteres konsistente Zustände aus solchen herleitet.

30 Schema Schema: enthält zentral verwaltete Angaben über den Aufbau, Zugriffsbefugnisse, Restriktionen bei Manipulationen etc. -> Datenbank kann konsistenzerhaltend benutzt werden Schemadefinition soll sich nicht nur auf die Datenstruktur begrenzt sein, sondern auch Manipulationsaspekte miteinbeziehen Def.: Ein Schema ist durch folgende Regel gegeben: <schema definition> ::= schema <static part> <dynamic part> Wobei der statische Teil (Datenschema) die Wertebereiche und die Relationen festlegt und der dynamische Teil (Manipulationsschema) einen vollständigen Satz von Transaktionen definiert.

31 Datenschema Für das statische Datenschema werden die Objekt- und die Darstellungsebene gebraucht. Def.: <static part> ::= <domain definition> <relation definition> umfasst die Definition der lokalen bzw. globalen Wertebereiche und Entitäts-, gemischte- bzw. Beziehungsrelationen.

32 Manipulationsschema Objekt- und die Zustandsebene relevant
Konsistenzerhaltende Produktionen werden spezifiziert Übersetzung einer Produktion in eine lineare Programmprozedur, welche einen konsistenten Datenbankzustand in einen neuen konsistenten Zustand überführt Einbezug von Konsistenzbedingungen und semantischen Regeln in Manipulationsoperationen mit Fehlerbehandlung bei Regelverstoß

33 Fazit Graphen eignen sich gut um Strukturzusammenhänge direkt aufzuzeigen Neben der statischen Struktur der Daten ist ihre Dynamik miteinbezogen. Der Entwurf von konsistenzerhaltenden Prozessen basiert auf der einheitlichen Datenbeschreibung (drei Ebenen). Die Kanten der Prozessgraphen drücken wichtige Zusammenhänge aus. Diese Seiteneffekte werden durch Graphen anschaulich und übersichtlich modelliert. Schon eine einfache Mutation, wie z.B. die Änderung der Koordinaten eines Grenzpunktes betrifft mehrere Entitäsmengen. Die vorgestellten Graphtheoretischen Konzepte erlauben eine einheitliche Darstellung verschiedener Datenbankaspekte, welche bis anhin mit heterogenen Methoden untersucht werden mussten.

34 Ende

35 Fragen?


Herunterladen ppt "Semantisches Datenmodell für flächenbezogene Daten"

Ähnliche Präsentationen


Google-Anzeigen