Geographic Information - Data Quality ISO ISO ISO 19138

Slides:



Advertisements
Ähnliche Präsentationen
Benutzerorientierte Designprinzipien für die Microsoft-Guidelines
Advertisements

Zur Rolle der Sprache bei der Modellierung von Datenbanken
Datenbanken Einführung.
Datenmodellierung Externe Phase Informationsstruktur
Qualitätsmanagement klinischer Prüfungen Rainer Schalnus
Die Definitionsphase -Objektorientierte Analyse - Das statische Modell
Zeitliche Verwaltung XML-basierter Metadaten in digitalen Bibliotheken M. Kalb, G. SpechtUniversität Ulm, Abteilung DBIS.
Kapitel 4 Datenstrukturen
Geodaten im Internet ( I )
Christian A. Kopf Institut für Informatik FU Berlin Episode Recognizer Framework - Rahmenwerk zur Episodenerkennung.
Kombinatorische Topologie in der 3d Geomodellierung
Christos, Kornelia, Jan Christos, Kornelia, Jan Entwicklungsumgebung Versteht unseren Java Programm Code Versteht unseren Java Programm.
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
Was ist und wie prüft man Qualität
Java: Objektorientierte Programmierung
Philosophische Fakultät 3: Empirische Humanwissenschaften Fachrichtung Erziehungswissenschaft Statistik I Anja Fey, M.A.
Schritte zu Datenmodellierung
Qualitätsmanagement-Handbuch
Kann eine XML-Datenbank temporal sein? Universität zu Köln Hauptseminar: Datenbanken vs. Markup Dozent: Prof. Dr. Manfred Thaller Referentin: Cigdem Varol.
Routenplanung und Navigation
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik I Vorlesung Listen-
Was ist ein Modell ? Repräsentiert Zugang: Mathematik Zugang: Empirie
Access 2000 Datenbanken.
Was sind Histogramme? (1)
RDF-Schema Seminar: „Semantic Web“ André Rosin,
Methoden der empirischen Sozialforschung II
DVG Klassen und Objekte
Dieter Bergmann, Lichtenfels
Erhard Künzel für Info 9. Klasse: digitale-schule-bayern.de © Erhard Künzel.
Datenbankentwurfsprozess
Manpower Associates is a $14
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Was versteht man unter XML Schema?
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Spatial Decision Support Systems (SDSS)
Prof. Dr. Gerhard Schmidt pres. by H.-J. Steffens Software Engineering SS 2009Folie 1 Objektmodellierung Objekte und Klassen Ein Objekt ist ein Exemplar.
Spezifikation von Anforderungen
12. Vorlesung: Aktivitätsdiagramme
Nutzerschulung GBIS/M TAX I Markus Oppermann Einführung.
Qualität und Evaluation im Unterricht
Topologische Regeln in SMALLWORLD
Letzter Tag Spaeter Zeitpunkt letzte Lied hoert man weiter.
Import und Verknüpfung von Daten
Datenbank.
Qualitätssicherung ingenieurgeodätischer Prozesse im Bauwesen
GIS - Seminar Wintersemester 2000/2001
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation I Vorlesung 12 WS 2000/2001 Gerhard Gröger Modellierung mit Geodatabases.
Datenbanken Datenstrukturen.
Wohlgeformtheit und Gültigkeit Grundlagen der Datenmodellierung Anke Jackschina.
Qualitätsmanagement in kommunalen Verkehrsplanungsprozessen
UML UML mit SiSy® Vorgehensmodell Dokumentation HTML-Export
5 Software-Qualität 5.1 Qualität 5.2 Taxonomie der Software-Qualitäten.
Das Kausalnetz als Kern eines DSS
Beispiele von Objektkatalogen
Java Programmierung.
ESRI EUROPEAN USER CONFERENCE
Daten- und Ablaufmodellierung
Deutsche Nationalbibliothek, Frankfurt am Main
Aufgaben und Ziele des Faches Qualitätsmanagement:
Klassen und Klassenstruktur
Qualität ? ? was ist das??? ? Kai - Uwe Güteklasse A
1 Polymorphe Konsistenzbedingungen (1) Polymorphe Konsistenzbedingungen legen fest, welche Arten von Zustandsbeschränkungen nach einer Konkretisierung.
Software Engineering Strukturierte Analyse
Operatoren-Zuordnung
Schulungsunterlagen der AG RDA
Peter Brezany Institut für Softwarewissenschaften Universität Wien
Visualisierung von Geodaten
Verkehrsnetze in GIS- Das GDF-Modell
Gerhard Röhner September 2012
Formale Methoden Semesterprojekt Präsentation Thema 1 Test-Arten Fernstudium Master WI, MWI 10F Jan te Kock,
 Präsentation transkript:

Geographic Information - Data Quality ISO 19113 - ISO 19114 - ISO 19138

Motivation Fahrzeugnavigation: Auswirkungen von Datenfehlern bei Routing Fahrtrichtungseinschränkung einer Einbahnstrasse nicht erfasst Kürzester Weg ohne Einbahn-Information 15 Kürzester Weg mit Einbahn-Information 18 Zu fahrende Strecke, weil Einbahn-Information erst vor Ort erkannt werden kann 27 Ziel Start 6 5 4 3 9 E i n b a h s t r ß e

Motivation Versorgungsunternehmen: Auswirkungen von Datenfehlern bei Routing (Sperrstreckenanwendung bei GAS ) Topologische Verbindung zweier Verteilungsrohre nicht erfasst Durch Absperren des Ventils tatsächlich betroffene Hausanschlüsse Hausanschlüsse, die aufgrund des Datenfehlers nicht angezeigt werden

Definition des Begriffs Qualität nach ISO 8402 Qualität ist die Gesamtheit von Eigenschaften und Merkmalen eines Produktes oder einer Dienstleistung, die sich auf die Eignung zur Erfüllung festgelegter oder vorausgesetzter Erfordernisse beziehen. Hier: Produkt = Geodaten

Eignung der Daten für eine Anwendung Anwendungs-schema Das Anwendungsschema abstrahiert eine definierte Sicht auf einen Teil der realen Welt. Sie ist Ziel der digitalen Daten. Datenqualität A) Mit einem Geo-Informationssystem wollen wir Aussagen über die reale Welt treffen. Diese ist allerdings viel zu komplex und vielschichtig, als dass sie auch nur ansatzweise vollständig erfasst werden könnte. B) Mit der Datenmodellierung werden deshalb bestimmte, meist fachbezogene Aspekte der realen Welt festgelegt und vollständig samt Anweisung zur Erfassung der Daten beschrieben. Dieses Datenmodell legt - wie durch einen Filter - einen Teil der realen Welt fest. Dieser Teil wird mit „Abstraktes Abbild der realen Welt“ bezeichnet. C) Durch die Datenerfassung wird dieses abstrakte Abbild meist durch manuelle Digitalisierung oder durch automatische Verfahren der Objekterkennung in Daten des Informationssystems umgesetzt. D) Eine Anwendung erfordert auch ein´bestimmtes Abbild der realen Welt. Nur die Schnittmenge ist für die Anwendung zu gebrauchen. Werden die Daten speziell für eine Anwendung erfasst, so stimmen die abstrakten Abbilder der realen Welt für die Datenerfassung und für die Anwendung überein. E) Die Datenqualität gibt nun an, in wieweit die erfassten Daten mit dem zugrundeliegenden abstrakten Abbild übereinstimmt. Der Grad der Übereinstimmung der Daten mit dem zugehörigen abstrakten Abbild der realen Welt wird als Datenqualität bezeichnet Die Daten sind die physikalische Realisierung des abstrakten Abbildes der realen Welt

Qualitätsinformation ist Teil der Metadaten Übergeordnete Elemente Herkunft (lineage) Gebrauch (usage) Zweck (purpose) Qualitätsangaben Elemente Unterelemente Quality report Damit ein Anwender die Eignung der Daten einschätzen kann, braucht er zusätzliche Informationen über die Daten. Diese Metadaten müssen das Datenmodell enthalten und Angaben über die Herkunft und Verfügbarkeit der Daten machen. Die Qualitätsmodelle Modellqualität und Datenqualität sind wesentlicher Bestandteil der Metadaten. Wenn schon Anwendungen mit diesen Daten durchgeführt wurden, so ist es für den Kunden hilfreich, wenn diese als Referenzprojekte aufgeführt werden. Dabei sind natürlich sowohl positive als auch negative Erfahrungen hilfreich. Nach ISO 19114 (Quality Evaluation Procedures) werden die Informationen zur Datenqualität auch entsprechend des Metadatenmodells nach ISO 19115 (Metadaten) dokumentiert.

Fehlertypen Objektklasse: Eigenschaften: Name: max. Tiefe: Fläche: See Die verschiedenen Fehlertypen, die bei der Erfassung von objektstrukturierten Geodaten auftreten, möchte ich anhand eines Beispiels aufzeigen. Diese Situation des abstrakten Abbildes der realen Welt mit Geometrie und Sachdaten soll erfaßt werden. Durch Vergleich mit den digitalen Daten ergeben sich einige Unterschiede: Objektklasse: Eigenschaften: Name: max. Tiefe: Fläche: See Steinsee 12,6 m 10,17 ha Grunddaten Fachdaten Wasserqualität: -

Objektive Kriterien zur Beurteilung der Qualität von Geodaten nach ISO 19113 Datenqualitätselemente Definition Datenqualitätsunterelemente Vollständigkeit Präsenz oder Fehlen von Objekten, ihrer Attribute und Beziehungen Untervollständigkeit Übervollständigkeit Logische Konsistenz Einhaltung von logischen Regeln der konzeptionellen, logischen und physikalischen Datenstruktur Konsistenz auf konzeptioneller Ebene Einhaltung von Wertebereichen Formatkonsistenz Topologische Konsistenz Lagegenauigkeit Genauigkeit der Lage von Objekten Absolute Genauigkeit Relative Genauigkeit Genauigkeit von Gitter- und Rasterdaten Zeitliche Genauigkeit Genauigkeit der Zeitangaben und der zeitlichen Beziehungen von Objekten Genauigkeit einer Zeitmessung Konsistenz der Chronologie Gültigkeit von Zeitangaben Thematische Genauigkeit Genauigkeit von quantitativen Attributen und Richtigkeit von nicht-quantitativen Attributen und der Zuordnung von Objekten zu Objektklassen und Richtigkeit der Beziehungen Richtigkeit der Klassifizierung Richtigkeit von nicht-quantitativen Attributen Genauigkeit von quantitativen Attributen Durch Strukturierung und Gliederung der möglichen Fehler lassen sich vier hinreichende und notwendige Kriterien zur Beschreibung der Datenqualität aufstellen. Diese sind: Vollständigkeit: Eineindeutige Abbildung zwischen Objekten, Attriubuten und Beziehungen zwischen Objekten des abstrakten Abbildes der realen Welt und dem Datensatz Richtigkeit der Klassifizierung: Das Objekt oder der Attributwert im Datensatz ist der gleichen Kategorie zugeordnet wie im abstrakten Abbild der realen Welt Konsistenz: Die Regeln, welche im Datenmodell festgelegt wurden, sind für alle Objekte, Attribute und Beziehungen eingehalten Genauigkeit: Die erfaßten Werte der quantitativen Eigenschaften aller Objekte liegen innerhalb eines Konfidenzbereiches. Quantitative Eigenschaft eines Objekts ist insbesondere dessen Geometrie, beschrieben durch die Koordinaten aller Punkte. Zur quantitativen Beschreibung der Qualität werden für die einzelnen Kriterien Qualitätsmaße eingeführt. Mit diesen Maßen können auch auch Qualitätsziele als Vorgaben für den Erfassungsprozeß formuliert werden.

ISO 19113 data quality elements and subelements completeness commission omission logical consistency conceptual consistency domain consistency format consistency topological consistency positional accuracy absolute or external accuracy relative or internal accuracy gridded data position accuracy temporal accuracy accuracy of a time measurement temporal consistency temporal validity thematic accuracy classification correctness non-quantitative attribute correctness quantitative attribute accuracy

ISO 19115: Das Qualitätsmodell als Teil der Metadaten – UML-Diagramm

Zu untersuchender Datensatz QualitätsErmittlung und Dokumentation der Ergebnisse entsprechend ISO 19114 Produkt Spezifikation oder NutzerAnforderungen Zu untersuchender Datensatz ISO 19131 1 Auswahl des zutreffenden Qualitätelements, des Unterelements und des Bereiches ISO 19113 ISO 19114 ISO 19138 2 Auswahl des Qualitätsmaßes Qualitätsziele 5 Stufen zur Ermittlung der Qualität von Geodaten 3 Auswahl und Durchführung der Methode zur Qualitätsermittlung 4 Bestimmung der Ergebnisse 5 Prüfung auf Konformität Dokumentation der (quantitativen) Ergebnisse Dokumentation der Ergebnisse (Annahme/Ablehnung)

Was soll geprüft werden? digitales Geo-Objekt Erfassungsquelle Reales Objekt

Worauf beziehen sich Qualitätsinformationen? Datensatz Alle Objekte einer Objektklasse Einzelne Objekte Alle Attributwerte eines Attributes Einzelne Attributwerte sonstiges

Art der Qualitätsprüfung Automatisch Logische Konsistenz Meistens nur visuell möglich (z.B. durch Plot- oder Feldvergleich) Vollständigkeit Lagegenauigkeit Zeitliche Genauigkeit Thematische Genauigkeit Bei der Prüfung können zwei Arten unterschieden werden: Eine nach vorgegebenen Regeln automatisch ablaufende Prüfung läßt sich nur für das Kriterium Konsistenz durchführen. Da bei der Erfassung von Geodaten im Gegensatz zu dem in der Geodäsie sonst üblichen Prinzip der redundanten Bestimmung keine unabhängige Erfassung erfolgt, können die Qualitätsmaße für die Kriterien Vollständigkeit, Richtigkeit und Genauigkeit nur mit Hilfe zusätzlicher Referenzen ermittelt werden. Möglich ist, eine zweite, unabhängige Kontrolle mit anschließendem automatischen Vergleich auf Übereinstimmung im Rahmen einer bestimmten Toleranz oder eine visuelle Prüfung z.B. durch Plotvergleich. Da diese Verfahren sehr aufwendig sind, lassen sie sich im allgemeinen nicht auf den gesamten Datenbestand anwenden. Statt dessen wird von einem Stichprobengebiet auf die Qualität des Gesamtdatenbestandes geschlossen. Auf dieses Verfahren der statistischen Qualitätskontrolle werde ich noch näher eingehen. Besonderheit bei Geo-Daten: keine redundante Erfassung

Qualitätskontrollen

Qualitätsprüfung der in ISO 19113 festgelegten Datenqualitätselemente und Unterelemente Die Elemente und Unterelemente sind in ISO 19113 definiert Für Qualitätsmaße wurde ein neues Projektteam eingerichtet, das Qualitätsmaße in ISO 19138 zusammenstellt Die Prüfmethoden sind nicht Gegenstand der Normung

Ziel von ISO 19138 data quality measures Festlegung der Struktur einer Registratur für Qualitätsmaße Bereitstellung eines ersten Satzes von Qualitätsmaßen Die Liste der Qualitätsmaße kann nach den Regularien der Registratur erweitert werden

data quality base measure type data quality measure type UML für Qualitätsmaße Data quality element Register item properties Data quality subelement <abstract> data quality base measure type 1..* 1..* First draft Data quality measure + Name + alternativeName [0..*] + Definition + Description: anyURI + FieldOfApplication + MeasureIdentifier Parameter + Name + Definition + Description: anyURI 1..* 0..* <abstract> data quality measure type <abstract> error count <abstract> error rate ...

Wieso Normen für Datenqualität? Das Wissen über die Qualität von Geodaten ist wichtig für deren Anwendung Die Qualität muss objektiv beschrieben werden Qualitätsinformation ist Teil der Metainformation ist wichtig bei der Entscheidung über die Verwendbarkeit von Geodaten muss austauschbar sein muss vergleichbar sein Nur möglich mit standardisierten Beschreibungen von Datenqualität