Lukas Kerecz - Edits1 Edits Lukas Kerecz. Lukas Kerecz - Edits2 Gliederung  Einführung  Edits – warum und wofür?  Edits – Definiton  einleitende Beispiele.

Slides:



Advertisements
Ähnliche Präsentationen
Programmierung 1 - Repetitorium WS 2002/2003 Programmierung 1 - Repetitorium Andreas Augustin und Marc Wagner Homepage:
Advertisements

Zur Rolle der Sprache bei der Modellierung von Datenbanken
10. Grundlagen imperativer Programmiersprachen
Puck eine visuelle Programmiersprache für die Schule
Microsoft Access – Einführung – Allgemeine Technologien I
Kombinatorische Topologie in der 3d Geomodellierung
Friedhelm Meyer auf der Heide 1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität Grammatiken beschreiben Sprachen L µ *, indem.
Training IT-Grundlagen Interaktive Web-Seiten (HTML-Forms, CGI, Servlets) - Prof. Dr. Böttcher - S. cgi/ 1 Prolog als Datenbanksprache.
Hands On – Einführung in XML
RDF R ESOURCE D ESCRIPTION F RAMEWORK Referentin: Claudia Langer.
Datenbankdesign und Normalisierung
XML-Schema HKI Proseminar Wintersemester 2010/11 Dozentin: Frau Kurz von Jan Kohl und Christian Lütticke.
IS: Datenbanken, © Till Hänisch 2000 CREATE TABLE Syntax: CREATE TABLE name ( coldef [, coldef] [, tableconstraints] ) coldef := name type [länge], [[NOT]NULL],
Universität Dortmund, Lehrstuhl Informatik 1 EINI II Einführung in die Informatik für Naturwissenschaftler und Ingenieure.
SQL/XML. © Prof. T. Kudraß, HTWK Leipzig 2 2 Motivation Speicherung von XML in allen großen kommerziellen DBMS vorhanden proprietäre Lösungen für die.
XML Standardisierungen und Abfragesprachen
SoSe 2004 Spree Entwicklung einer Wissensbasis Aufgaben und Techniken.
Weiteres Programm Studium des Breitendurchlaufs Hierzu
Einführung in die Programmierung Datensammlung
RelationentheorieObjektorientierte Datenbanken AIFB SS Das ODMG-Objektmodell vs. relationales Modell (1/9) ODMG-Objektmodell Literal_type Atomic_literal.
2.2 Definition eines Datenbankschemas (SQL-DDL)
Datenbankentwicklung IV-LK
Isabelle/HOL ( Kripke Structures & Model Checking ) Ying Wang, Nelli Bärsch, Bartosz Rynarzewski,
Integritätsbedingungen
Computergraphik mit OpenGL Einführung. Bilder Objekt existiert im Raum unabhängig vom Betrachter Objekte sind beschrieben durch die Position verschiedener.
RDF MT Resource Description Framework Model Theory © 2002 by Emir Blažević
Proseminar an der TU München Martin Levihn
Datenbank.
PHP und MYSQL am Organisatorisches Der komplette Kurs im Schnelldurchgang Bewertung von wichtig und unwichtig Historisch Kulturwissenschaftliche.
SS 2013 – IBB4B Datenmanagement Fr 17:00 – 18:30 R Vorlesung #5 Relationale Entwurfstheorie.
Mathematik lernen und lehren an der AHS
§3 Allgemeine lineare Gleichungssysteme
Einführung in SPSS/PASW. Eckdaten Ort: ZIP-Pool Zielgruppe: Primär 3. Semester Bachelor, sekundär Diplomstudierende Zeiten: Dienstags: 10:15-11:45 Uhr.
Java für Fortgeschrittene
Chair of Software Engineering Einführung in die Programmierung Prof. Dr. Bertrand Meyer Lektion 15: Topologisches Sortieren Teil 1: Problemstellung und.
Institut für Wirtschaftsinformatik – Software Engineering, JKU Linz 1 Algorithmen und Datenstrukturen SS 2005 Mag.Th. Hilpold u. Dr. A.Stritzinger Institut.
Vom Umgang mit Daten. public void myProgram() { int[] saeulenWerte = new int[world.getSizeX()]; for (int i = 0; i < saeulenWerte.length; i++) { saeulenWerte[i]
Theoriereferat Indexes, Scales and Typologies The Logic of Sampling
SS 2011 – IBB4C Datenmanagement Fr 15:15 – 16:45 R Vorlesung #5 Relationale Entwurfstheorie.
Vorlesung #4 Überführung des ER-Modells in das relationale Modell
Vorlesung #4 Überführung des ER-Modells in das relationale Modell
Einführung in Datenbankmodellierung und SQL
Relationales Datenmodell ist beherrschend: –Riesige Datenbestände und damit hohe Investitionen. –Die große Mehrzahl der Anwendungen arbeitet mit weitgehend.
Relationentheorie AIFB SS Relationen in 1NF und relationale Datenbanken(1/5) Attribut a Wertebereichdom(a) (domain) AttributemengeA = {a 1,...,
Vortrag: Visual Basic Neuerungen Autor : Dennis Hoyer
Das relationale Modell
MODULA-2.
Datentypen: integer, char, string, boolean
Agenda für heute, 7. April, 2005 Bedingte ProgrammausführungBedingte Programmausführung Algorithmische Grundlagen Vergleichsoperatoren, Wahrheitswerte.
Integritätserhaltung und -Überprüfung in deduktiven Datenbanken
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
1 Polymorphe Konsistenzbedingungen (1) Polymorphe Konsistenzbedingungen legen fest, welche Arten von Zustandsbeschränkungen nach einer Konkretisierung.
Erstellen einer Arff-Datei
Mehrfachausführungen Schleifen in VB 2010 ee. Programmidee: Der Anwender gibt eine Zahl ein, und das Programm gibt die Mehrfachen dieser Zahl aus (das.
Einführung in die Programmierung Prof. Dr. Bertrand Meyer
Vordefinierte Datentypen (1)
SS 2014 – IBB4B Datenmanagement Do 17:00 – 18:30 R Vorlesung #4 Überführung des ER-Modells in das relationale Modell.
Extended Pascal ( Erweitreung von Pascal) Name: Mehmet CELIK Matr :
The Programming Language Pascal
SS 2015 – IBB4C Datenmanagement Fr 17:00 – 18:30 R Vorlesung #5 Relationale Entwurfstheorie.
SS 2015 – IBB4C Datenmanagement Fr 17:00 – 18:30 R Vorlesung #4 Überführung des ER-Modells in das relationale Modell.
Datenbanken erstellen mit PostgreSQL
Übungsblatt 4 Erläuterungen Wintersemester 15/16 DBIS.
csv2siard Version 1.7 csv2siard erlaubt die Konvertierung von CSV-Datei Sammlungen in eine SIARD-Datei. Die Vorteile einer solchen Konvertierung: 1.einzelne.
Datentypen: integer, char, string, boolean
Vorlesung #5 SQL (Teil 2).
Kapitel 6: Datenbanksysteme
GRUNDLAGEN WISSENSCHAFTLICHEN ARBEITENS MODULA-2 SONAY SUBAYAZ
The Programming Language Pascal
 Präsentation transkript:

Lukas Kerecz - Edits1 Edits Lukas Kerecz

Lukas Kerecz - Edits2 Gliederung  Einführung  Edits – warum und wofür?  Edits – Definiton  einleitende Beispiele  Geo-Daten  relationale Daten  Edit-Typen  Einfache Edits  Logische Edits  Numerische Edits  Statistische Edits  Fuzzy Edits

Lukas Kerecz - Edits3 Einführung: Edits – warum und wofür? Terminologie  Semantische Datenintegrität  Datenkonsistenz  Kohärenz Funktionalitäten  Validierungsregeln  Integrity Constraints (IC's) ‏  Edits

Lukas Kerecz - Edits4 Edits – warum und wofür? Aufgaben von Edits sind:  aufspüren semantischer Inkosistenzen  korrigieren inkohärenter Daten  imputieren von Daten im Falle von Null-Werten (fehlende Daten) ‏ Datenquelle/Dateneingabe Datenbank Edit aufspüren korrigieren imputieren

Lukas Kerecz - Edits5 Edits – Definition Definition: Ein Edit ist eine Sammlung von Regeln,  die auf jedes Element des Datenbestandes anwendbar sind,  und die abhängig von den Beziehungen zwischen den entsprechenden Attributen sind. Regelsammlung Halb-Strukturierte Datenrelationale Daten

Lukas Kerecz - Edits6 Zitat Bernd Streitberg „We can get no intelligent software, but we need less stupid programms“

Lukas Kerecz - Edits7 Objekte bei der Dateneingabe 1.Fest formatierte Daten  Relationen  Sets  Listen  Dateien  Records  Fields 1.Halb-strukturierte Daten  HTML  XML

Lukas Kerecz - Edits8 einleitende Beispiele

Lukas Kerecz - Edits9 Beispiel 1: Geo-Daten Rahmenbedingungen: x = (a, b, c) beinhaltet die Strecken eines Dreiecks zwischen den Punkten A,B und C. Das Dreieck hat einen rechten Winkel bei B. A CB Regel: a² + b² = c² + c a b Pythagoras ? Passt das Tupel z = (2, 4, 3) in die Regelsammlung, bzw. ist das Tupel kosistent?

Lukas Kerecz - Edits10 Beispiel 2: Relationale Daten Rahmenbedingungen: Datenbankschema: Fragebogen ( ID, Alter, Schultyp, Familienstatus, Familienstand) ‏ ? Passt das Tupel z = (0010, 015, Grundschule, Kind, Single) in die Regelsammlung, bzw. ist das Tupel kosistent?

Lukas Kerecz - Edits11 Edit-Typen einfach Edits logische Edits numerische Edits wahrscheinlichkeitstheoretische Edits statistische Edits Fuzzy-Edits

Lukas Kerecz - Edits12 einfache Edits

Lukas Kerecz - Edits13 einfache Edits einfache Edits beziehen sich auf nur ein einzelnes Feld oder Attribut. Berücksichtigt werden hier:  der Datentyp  die Länge  Subset Constraints  Scale  Dimension

Lukas Kerecz - Edits14 Einfache Edits – Beispiel Syntax (in der Infix-Notation) ‏  Alter type integer  code length 4  date between ( – ) ‏  size scale cardinal  cost dimension €/Jahr

Lukas Kerecz - Edits15 Logische Edits

Lukas Kerecz - Edits16 Logische Edits – Idee for all u U if kleinergleich(Alter, 15) ‏ or Schultyp(Grundschule) ‏ then not Familienstatus(Oberhaupt) ‏ and Familienstand(Single) ‏ Verallgemeinerung: if x 1 is A 1 and x 2 is A 2 and... and x n is A n then y is B Fellegi und Holt (1973, 1976), Mamdani and Assilian (1975)‏ Wenn jemand jünger als 16 Jahre ist, oder er noch in die Grundschule geht, dann kann er nicht das Familienoberhaupt sein und er muss “nicht verheiratet” (Single) sein.

Lukas Kerecz - Edits17 Logische Edits in Normalform  kleinergleich (Alter, 15) Familienstatus (Oberhaupt) =.false.  kleinergleich (Alter, 15) not Familienstand (Single) =.false.  Schultyp (Grundschule) Familienstatus (Oberhaupt) =.false.  Schultyp (Grundschule) not Familienstand(Single) =.false.

Lukas Kerecz - Edits18 Logische Edits - Algorithmen Es gibt Algorithmen um:  Edits in Normalform zu überführen  zu entscheiden, ob ein Edit neu ist  eine Sammlung essentiell unterschiedlicher Edits zu erstellen

Lukas Kerecz - Edits19 Numerische Edits

Lukas Kerecz - Edits20 Numerische Edits  „unscharfe/ungenaue“ Werte einzelner Attribute sind nicht erlaubt  nur anwendbar auf die Datentypen „integer, real, decimal“  „Constraint Programming“ A x ≥ b (numerical constraints)‏ x ≥ 0 (nicht-Negativität)‏ x ∈ X (für alle Attribute x)‏ Fuzzy-Edits

Lukas Kerecz - Edits21 Numerische Edits - Beispiel Fakten: Der ehemalige Student s ist jetzt 29 Jahre alt (x 1 ), hat 6 Jahre die Grundschule besucht (x 2 ), hat 7Jahre die Oberschule besucht (x 3 ), hat 5 Jahre an der Universität studiert (x 4 ) ‏ und ist angestellt seit 2 Jahren (x 5 ) ‏ x löst die Gleichung a'x ≥ b mit folgenden Werten: a' = (1, -1, -1, -1, -1)‏ x' = (x 1, x 2, x 3, x 4, x 5 ) = (29, 6, 7, 5, 2)‏ b = 6 X = ∏ range (x i )‏

Lukas Kerecz - Edits22 Numerische Edits – Beispiel Gleichung: a'x ≥ b einsetzen: a'x = 1 * 29 + (-1) * 6 + (-1) * 7 + (-1) * 5 + (-1) * 2 a'x = (1, -1, -1, -1, -1) * a'x = 9 => a'x ≥ b = 6

Lukas Kerecz - Edits23 Statistische Edits

Lukas Kerecz - Edits24 statistische Edits Syntax: = ± Beispiel: Umsatz = 10 ± 2 Konfidenzintervall mit Wahrscheinlichkeit 1-α (vergl. Schmid (1979))‏

Lukas Kerecz - Edits25 statistische Edits - Schritte Modell-Spezifikationen  Variablen  Ranges (co-domains) ‏  Konfidenzintervall unter Normalverteilung Parameter-Schätzungen / „Lernen“ es wird nur ein Wert pro Variable gemessen Interferenzen – Aufspüren, Korrigieren, Imputieren