Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Geographic Information - Data Quality ISO ISO ISO 19138

Ähnliche Präsentationen


Präsentation zum Thema: "Geographic Information - Data Quality ISO ISO ISO 19138"—  Präsentation transkript:

1 Geographic Information - Data Quality ISO 19113 - ISO 19114 - ISO 19138

2 Motivation Fahrzeugnavigation: Auswirkungen von Datenfehlern bei Routing Fahrtrichtungseinschränkung einer Einbahnstrasse nicht erfasst Kürzester Weg ohne Einbahn-Information 15 Kürzester Weg mit Einbahn-Information 18 Zu fahrende Strecke, weil Einbahn-Information erst vor Ort erkannt werden kann 27 Ziel Start 6 5 4 3 9 E i n b a h s t r ß e

3 Motivation Versorgungsunternehmen: Auswirkungen von Datenfehlern bei Routing (Sperrstreckenanwendung bei GAS ) Topologische Verbindung zweier Verteilungsrohre nicht erfasst Durch Absperren des Ventils tatsächlich betroffene Hausanschlüsse Hausanschlüsse, die aufgrund des Datenfehlers nicht angezeigt werden

4 Definition des Begriffs Qualität nach ISO 8402
Qualität ist die Gesamtheit von Eigenschaften und Merkmalen eines Produktes oder einer Dienstleistung, die sich auf die Eignung zur Erfüllung festgelegter oder vorausgesetzter Erfordernisse beziehen. Hier: Produkt = Geodaten

5 Eignung der Daten für eine Anwendung
Anwendungs-schema Das Anwendungsschema abstrahiert eine definierte Sicht auf einen Teil der realen Welt. Sie ist Ziel der digitalen Daten. Datenqualität A) Mit einem Geo-Informationssystem wollen wir Aussagen über die reale Welt treffen. Diese ist allerdings viel zu komplex und vielschichtig, als dass sie auch nur ansatzweise vollständig erfasst werden könnte. B) Mit der Datenmodellierung werden deshalb bestimmte, meist fachbezogene Aspekte der realen Welt festgelegt und vollständig samt Anweisung zur Erfassung der Daten beschrieben. Dieses Datenmodell legt - wie durch einen Filter - einen Teil der realen Welt fest. Dieser Teil wird mit „Abstraktes Abbild der realen Welt“ bezeichnet. C) Durch die Datenerfassung wird dieses abstrakte Abbild meist durch manuelle Digitalisierung oder durch automatische Verfahren der Objekterkennung in Daten des Informationssystems umgesetzt. D) Eine Anwendung erfordert auch ein´bestimmtes Abbild der realen Welt. Nur die Schnittmenge ist für die Anwendung zu gebrauchen. Werden die Daten speziell für eine Anwendung erfasst, so stimmen die abstrakten Abbilder der realen Welt für die Datenerfassung und für die Anwendung überein. E) Die Datenqualität gibt nun an, in wieweit die erfassten Daten mit dem zugrundeliegenden abstrakten Abbild übereinstimmt. Der Grad der Übereinstimmung der Daten mit dem zugehörigen abstrakten Abbild der realen Welt wird als Datenqualität bezeichnet Die Daten sind die physikalische Realisierung des abstrakten Abbildes der realen Welt

6 Qualitätsinformation ist Teil der Metadaten
Übergeordnete Elemente Herkunft (lineage) Gebrauch (usage) Zweck (purpose) Qualitätsangaben Elemente Unterelemente Quality report Damit ein Anwender die Eignung der Daten einschätzen kann, braucht er zusätzliche Informationen über die Daten. Diese Metadaten müssen das Datenmodell enthalten und Angaben über die Herkunft und Verfügbarkeit der Daten machen. Die Qualitätsmodelle Modellqualität und Datenqualität sind wesentlicher Bestandteil der Metadaten. Wenn schon Anwendungen mit diesen Daten durchgeführt wurden, so ist es für den Kunden hilfreich, wenn diese als Referenzprojekte aufgeführt werden. Dabei sind natürlich sowohl positive als auch negative Erfahrungen hilfreich. Nach ISO (Quality Evaluation Procedures) werden die Informationen zur Datenqualität auch entsprechend des Metadatenmodells nach ISO (Metadaten) dokumentiert.

7 Fehlertypen Objektklasse: Eigenschaften: Name: max. Tiefe: Fläche: See
Die verschiedenen Fehlertypen, die bei der Erfassung von objektstrukturierten Geodaten auftreten, möchte ich anhand eines Beispiels aufzeigen. Diese Situation des abstrakten Abbildes der realen Welt mit Geometrie und Sachdaten soll erfaßt werden. Durch Vergleich mit den digitalen Daten ergeben sich einige Unterschiede: Objektklasse: Eigenschaften: Name: max. Tiefe: Fläche: See Steinsee 12,6 m 10,17 ha Grunddaten Fachdaten Wasserqualität: -

8 Objektive Kriterien zur Beurteilung der Qualität von Geodaten nach ISO 19113
Datenqualitätselemente Definition Datenqualitätsunterelemente Vollständigkeit Präsenz oder Fehlen von Objekten, ihrer Attribute und Beziehungen Untervollständigkeit Übervollständigkeit Logische Konsistenz Einhaltung von logischen Regeln der konzeptionellen, logischen und physikalischen Datenstruktur Konsistenz auf konzeptioneller Ebene Einhaltung von Wertebereichen Formatkonsistenz Topologische Konsistenz Lagegenauigkeit Genauigkeit der Lage von Objekten Absolute Genauigkeit Relative Genauigkeit Genauigkeit von Gitter- und Rasterdaten Zeitliche Genauigkeit Genauigkeit der Zeitangaben und der zeitlichen Beziehungen von Objekten Genauigkeit einer Zeitmessung Konsistenz der Chronologie Gültigkeit von Zeitangaben Thematische Genauigkeit Genauigkeit von quantitativen Attributen und Richtigkeit von nicht-quantitativen Attributen und der Zuordnung von Objekten zu Objektklassen und Richtigkeit der Beziehungen Richtigkeit der Klassifizierung Richtigkeit von nicht-quantitativen Attributen Genauigkeit von quantitativen Attributen Durch Strukturierung und Gliederung der möglichen Fehler lassen sich vier hinreichende und notwendige Kriterien zur Beschreibung der Datenqualität aufstellen. Diese sind: Vollständigkeit: Eineindeutige Abbildung zwischen Objekten, Attriubuten und Beziehungen zwischen Objekten des abstrakten Abbildes der realen Welt und dem Datensatz Richtigkeit der Klassifizierung: Das Objekt oder der Attributwert im Datensatz ist der gleichen Kategorie zugeordnet wie im abstrakten Abbild der realen Welt Konsistenz: Die Regeln, welche im Datenmodell festgelegt wurden, sind für alle Objekte, Attribute und Beziehungen eingehalten Genauigkeit: Die erfaßten Werte der quantitativen Eigenschaften aller Objekte liegen innerhalb eines Konfidenzbereiches. Quantitative Eigenschaft eines Objekts ist insbesondere dessen Geometrie, beschrieben durch die Koordinaten aller Punkte. Zur quantitativen Beschreibung der Qualität werden für die einzelnen Kriterien Qualitätsmaße eingeführt. Mit diesen Maßen können auch auch Qualitätsziele als Vorgaben für den Erfassungsprozeß formuliert werden.

9 ISO 19113 data quality elements and subelements
completeness commission omission logical consistency conceptual consistency domain consistency format consistency topological consistency positional accuracy absolute or external accuracy relative or internal accuracy gridded data position accuracy temporal accuracy accuracy of a time measurement temporal consistency temporal validity thematic accuracy classification correctness non-quantitative attribute correctness quantitative attribute accuracy

10 ISO 19115: Das Qualitätsmodell als Teil der Metadaten – UML-Diagramm

11 Zu untersuchender Datensatz
QualitätsErmittlung und Dokumentation der Ergebnisse entsprechend ISO 19114 Produkt Spezifikation oder NutzerAnforderungen Zu untersuchender Datensatz ISO 19131 1 Auswahl des zutreffenden Qualitätelements, des Unterelements und des Bereiches ISO 19113 ISO 19114 ISO 19138 2 Auswahl des Qualitätsmaßes Qualitätsziele 5 Stufen zur Ermittlung der Qualität von Geodaten 3 Auswahl und Durchführung der Methode zur Qualitätsermittlung 4 Bestimmung der Ergebnisse 5 Prüfung auf Konformität Dokumentation der (quantitativen) Ergebnisse Dokumentation der Ergebnisse (Annahme/Ablehnung)

12 Was soll geprüft werden?
digitales Geo-Objekt Erfassungsquelle Reales Objekt

13 Worauf beziehen sich Qualitätsinformationen?
Datensatz Alle Objekte einer Objektklasse Einzelne Objekte Alle Attributwerte eines Attributes Einzelne Attributwerte sonstiges

14 Art der Qualitätsprüfung
Automatisch Logische Konsistenz Meistens nur visuell möglich (z.B. durch Plot- oder Feldvergleich) Vollständigkeit Lagegenauigkeit Zeitliche Genauigkeit Thematische Genauigkeit Bei der Prüfung können zwei Arten unterschieden werden: Eine nach vorgegebenen Regeln automatisch ablaufende Prüfung läßt sich nur für das Kriterium Konsistenz durchführen. Da bei der Erfassung von Geodaten im Gegensatz zu dem in der Geodäsie sonst üblichen Prinzip der redundanten Bestimmung keine unabhängige Erfassung erfolgt, können die Qualitätsmaße für die Kriterien Vollständigkeit, Richtigkeit und Genauigkeit nur mit Hilfe zusätzlicher Referenzen ermittelt werden. Möglich ist, eine zweite, unabhängige Kontrolle mit anschließendem automatischen Vergleich auf Übereinstimmung im Rahmen einer bestimmten Toleranz oder eine visuelle Prüfung z.B. durch Plotvergleich. Da diese Verfahren sehr aufwendig sind, lassen sie sich im allgemeinen nicht auf den gesamten Datenbestand anwenden. Statt dessen wird von einem Stichprobengebiet auf die Qualität des Gesamtdatenbestandes geschlossen. Auf dieses Verfahren der statistischen Qualitätskontrolle werde ich noch näher eingehen. Besonderheit bei Geo-Daten: keine redundante Erfassung

15 Qualitätskontrollen

16 Qualitätsprüfung der in ISO 19113 festgelegten Datenqualitätselemente und Unterelemente
Die Elemente und Unterelemente sind in ISO definiert Für Qualitätsmaße wurde ein neues Projektteam eingerichtet, das Qualitätsmaße in ISO zusammenstellt Die Prüfmethoden sind nicht Gegenstand der Normung

17 Ziel von ISO 19138 data quality measures
Festlegung der Struktur einer Registratur für Qualitätsmaße Bereitstellung eines ersten Satzes von Qualitätsmaßen Die Liste der Qualitätsmaße kann nach den Regularien der Registratur erweitert werden

18 data quality base measure type data quality measure type
UML für Qualitätsmaße Data quality element Register item properties Data quality subelement <abstract> data quality base measure type 1..* 1..* First draft Data quality measure + Name + alternativeName [0..*] + Definition + Description: anyURI + FieldOfApplication + MeasureIdentifier Parameter + Name + Definition + Description: anyURI 1..* 0..* <abstract> data quality measure type <abstract> error count <abstract> error rate ...

19 Wieso Normen für Datenqualität?
Das Wissen über die Qualität von Geodaten ist wichtig für deren Anwendung Die Qualität muss objektiv beschrieben werden Qualitätsinformation ist Teil der Metainformation ist wichtig bei der Entscheidung über die Verwendbarkeit von Geodaten muss austauschbar sein muss vergleichbar sein Nur möglich mit standardisierten Beschreibungen von Datenqualität


Herunterladen ppt "Geographic Information - Data Quality ISO ISO ISO 19138"

Ähnliche Präsentationen


Google-Anzeigen