Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/25

Slides:



Advertisements
Ähnliche Präsentationen
Überblick über die Datenbankproblematik
Advertisements

Business Engineering Philipp Osl, Alexander Schmidt
Support.ebsco.com Lernprogramm zum Erstellen einer lokalen Sammlung.
Datenbankdesign mit ACCESS.
Übung Datenbanksysteme WS 2003/ Übung Datenbanksysteme Entwurf eines Bibliothekssystems
Bauinformatik II Softwareanwendungen 1
Kapitel 4 Datenstrukturen
Franziska Schmidt Sarah Ahlheit
Support.ebsco.com Business Source-Suche in EBSCOhost Lernprogramm.
FH-Hof Extensible Markup Language Richard Göbel. FH-Hof Extensible Markup Language XML XML ist universeller Ansatz für die Strukturierung von Zeichenketten.
Java: Objektorientierte Programmierung
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/12 Informationsretrieval Suche mit und nach Attributen und Merkmalen, die bedeutend für die.
Lernen als Informationsverarbeitung
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24 Beispiel einer Anfrage Welche Umsätze sind in den Jahren 1998 und 1999 in den Abteilungen.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/10 Grafische Anfragesprachen Geeignet sind grafische Anfragesprachen für Nutzer, die keine.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Datenbanken werden als Anhäufung von Werten eines Wertebereiches aufgefasst und Datenbankabfragen.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/9 Data Mining Ist die Wissensgewinnung aus Datensammlungen (Knowledge Discovery in Database).
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Information Retrieval auf Texten An ihre Grenzen stoßen relationale Datenbanken bei der.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Klassifikationen Klassifikationen dienen dazu, Themen oder Objekte systematisch zu ordnen.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/10
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri)
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/7
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/5 Grundtechniken des Information Retrieval Deskribierung Hierunter versteht man eine manuelle.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/4 Machine Learning (ML) Der erste Teil dieser Definition ist auch eine Beschreibung von Machine.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/4 Manuelle Verfahren Klassifizierung Hier werden Dokumente in ein fest vorgegebenes System.
QBE in MS Access formulieren
Klassendiagramm Verwandte Begriffe: class, Typ, Objektfabrik
Abhängigkeitsbeziehung
UML im Überblick – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/22
C- Syntax. Bestandteile der Sprache C: Ausdrücke Anweisungen.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Präsentation des Seminararbeitsthemas
HTML - Eine erste Annäherung
Datenbankentwurf mit Hilfe des ER-Modells entwickeln
IS: Datenbanken, © Till Hänisch 2000 CREATE TABLE Syntax: CREATE TABLE name ( coldef [, coldef] [, tableconstraints] ) coldef := name type [länge], [[NOT]NULL],
Support.ebsco.com Lernprogramm zur einfachen Suche in wissenschaftlichen Bibliotheken.
Grundlegende Analysen & Zwischendarstellungen
Access 2000 Datenbanken.
Kurs Schreiben 1/12 Dr. Barbara Hoffmann LiteraturKompetenz Formatiertes wissenschaftliches Schreiben Der Kurs ist zur allgemeinen Information.
Online Recherche 1.Vorbereitung der Recherche (bevor Sie sich in einen Host, bzw. Eine Datenbank einwählen) Erster Schritt: Ermittlung des Informationsbedarfs.
Hyperlinks und Anker Links notieren
EXCEL PROFESSIONAL KURS
Die Grundterminologie
Import und Verknüpfung von Daten
Access 2000 Willkommen im Access-Kurs Oliver Mochmann.
§3 Allgemeine lineare Gleichungssysteme
Musterlösungen Übungsblatt 5
Überblick über die Datenbankproblematik
Datenbanken Datenstrukturen.
Allgemeines zu Datenbanken
Ganzheitliches Projekt-, Ressourcen- und Qualitätsmanagement 1 Reports und AddOns Auf den folgenden Seiten wird Ihnen die Funktionsweise der Reports und.
UML-Kurzüberblick Peter Brusten.
(D.h. „Hallo MausFans!“ auf Japanisch).
Paradigmenwechsel in der Unternehmensmodellierung Prof. Dr. Wolfgang Voigt Dipl.-Ing. Päd. Alexander Huwaldt UML Extrakt UML Seminar, Chemnitz
Informationskompetenz für den Fachbereich Soziale Arbeit
Das ABC der Statistik DIE SÄULENDIAGRAMME 1
Ihr Trainer: Gerold Hämmerle
Das relationale Modell
verstehen planen bearbeiten
Kompass für wissenschaftliches Arbeiten
Geschäftsprozessmodellierung und Ablaufmodellierung
Klassen und Klassenstruktur
Informatik Technische Informatik Praktische Informatik Theoretische
Eike Schallehn, Martin Endig
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
Software Engineering Strukturierte Analyse
Grammatikalische Begriffe im Unterricht
1 Syntaktische Grundform selectA 1, A 2, …, A n fromR 1, R 2, …, R m wherebedingung w ;
1 Suchprofile erstellen und verwalten. 2 Suchprofile bei Registrierung Hier können Sie bis zu drei Suchprofile einrichten. Diese finden Sie später unter.
 Präsentation transkript:

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/25 Textdatenbanken Volltextdatenbanken enthalten im Prinzip den vollen Text einer Dokumentationseinheit. Aber in allen Fällen wird der Text bzw. die in ihm enthaltenen Informationen durch weitere Felder beschrieben: Attribute Merkmale Nomenklaturen Thesaurus

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 2/25 Feldname Datentyp ND (Dokument-, Artikelnummer qualitatives Merkmal PY (Erscheinungsjahr) Rangmerkmal VN (Ausgabenummer der Zeitung) PD (Erscheinungsdatum der Zeitung) PA (Seite der Zeitung) AC (zweistelliger Zifferncode des Autors oder Redakteurs) AU (Name oder Namenskurzzeichen des Autors oder Redakteurs) RB (Titel einer Rubrik) formatiertes Feld bzw. qualitatives Merkmal TI (Titel des Artikels) formatiertes Feld UT (Untertitel) AB (Einleitung des Artikels) Text T1 (1. Textabschnitt des Artikels) ++ (weitere Textabschnitte des Artikels)

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 3/25 Die drei formatierten Felder RB, TI und UT übernehmen noch Informationen des Artikels mit Textcharakter. Lediglich das Feld RB könnte, bei entsprechender Strukturierung auch ein qualitatives Merkmal sein. Hinzu kommen noch Rangmerkmale. VN und PD, sowie die Seitennummer haben einen eindeutigen Rangcharakter. Für das Retrieval bedeutet das, dass zusätzlich die kleiner/größer-Operatoren Verwendung finden können. Die verbleibenden Felder stellen qualitative Merkmale dar. Wie bereits ausgeführt, bilden qualitative Merkmale nach dem Messvorgang disjunktive Teilmengen auf der betrachteten Menge der Objekte. Einige jedoch nehmen eine Sonderstellung ein, weil ihre Teilmengen aus nur je einem Element bestehen. In diesem Datensatz ist dies z.B. das Feld ND.

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 4/25 Für das Retrieval stellen diese Felder insoweit eine Besonderheit dar, weil ein Suchvorgang mit ihnen (über eine Merkmalsausprägung) immer zu einer einelementigen Menge führt. Diese Felder erlauben also die Identifikation einzelner Sätze der Datenbank. Sie sollen, in Anlehnung an den entsprechenden Begriff der Datenbanktheorie, „Schlüssel“ genannt werden. Neben langen Texten (allgemein, Zeitschriften, Vorschriften) werden auch Patentdatenbanken als Volltextdatenbanken geführt.

Bibliographische Datenbanken Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 5/25 Bibliographische Datenbanken AB = textliche Informationen Textliche Informationen werden modelliert. Da aber Wissen modelliert wird, wird von Repräsentationen (Wissensrepräsentationen) gesprochen. Diese Repräsentationen können nun als Erklärungsversuch verstanden werden.

Decimal Classification Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 6/25 Feldname Datentyp AN (Accession number) Schlüssel TI (Original title) formatiertes Feld AU (Author(s)) DT (Document type) qualitatives Merkmal SO (Source) formatiertes Feld bzw. qualitatives Merkmal Decimal Classification DP (primary) Nomenklatur DS (Secondary) DG (Geographical) MJ (Major descriptors) Nomenklatur bzw. qualitatives Merkmal MN (Minor descriptors) AB (Abstract) Text (Information über Text)

Integrierte Datenbanken Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 7/25 Integrierte Datenbanken Datenbanken mit umfangreichem Inhalt. Sie integrieren Daten aus Fakten-basierenden Datenbanken und aus textlichen Datenbanken. Data Warehouse ist ein Begriff, der in diesem Zusammenhang verwendet wird. Fakten an Produkten statische Daten (z.B. Herstellung Ein- und Ausfuhr) Daten der Zulieferer Rechtsvorschrift (Umweltverträglichkeit) Patentinformationen Formalismen

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 8/25 Auf der unteren Ebene sind horizontal die mengenorientierten Systeme angegeben, die sich an den operativen Funktionen Produktion, Technik, Beschaffung, Vertrieb und Personaleinsatz ausrichten. Als Beispiel kann Betriebsdatenerfassung (BDE), bspw. Auch die Arbeitszeiterfassung genannt werden. Die mengenorientierten Prozesse werden vertikal in wertorientierten Abrechnungssystemen des Rechnungswesens erfasst. Beispiele für das Beschaffungssystem sind die Kreditorenbuchführung, für das Vertriebssystem die Debitorenbuchführung und für das Personalwesen die Lohn- und Gehaltsabrechnung. Aus den mengen- und wertorientierten Systemen Informationen für Berichts- und Kontrollsysteme abgeleitet. Analyse- und Informationssysteme werden erstellt, die neben den verdichteten Daten auch Daten externer Quellen einbeziehen. Beispiele hierfür sind Marketing-, Beschaffungs- und Produktionsinformationssysteme.

Auch hier liegt wieder ein zusammengesetztes Feld vor (CI), das ohne Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 9/25 Die höchste Verdichtungsstufe bilden Planungs- und Entscheidungssysteme, die insbesondere für langfristig wirkende Entscheidungen Unterstützung geben sollen, zum Beispiel etwa ein Vertriebs-Führungsinformationssystem für den Vertriebsvorstand. Auch hier liegt wieder ein zusammengesetztes Feld vor (CI), das ohne Schwierigkeit in die Form einzelner Merkmale überführt werden kann. Weiter finden sich hier bereits in diesem ersten Teil der Informationseinheit numerische Informationen im Feld CD (Corporate Statistics). Numerische Informationen in Online-Datenbanken stellen wiederum im Regelfall Ausprägungen quantitativer Merkmale oder vercodete Ausprägungen qualitativer Merkmale dar. In diesem Fall handelt es sich um klare quantitative Merkmale: SALES (in US-Dollar) und EMPLOYEES, allerdings in einem zusammengehörigen Teil erfasst.

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 10/25 Feldname Datentyp AB (Abstract, hier Time Series) Text bzw. Tabelle (!) AN (Identification number) qualitatives Merkmal/Schlüssel CI (Corporate Information) zusammengesetztes Feld aus qualitativen Merkmalen CN (Country Descriptor & Country Code) Nomenklatur CO (Company Descriptor) CS (Corporate Statistics) zusammengesetzt aus qualitativen Merkmalen und einem   Rangmerkmal EN (Event Descriptor & Country Code) Nomenklatur mit Mehrfacheinträgen PN (Product Descriptor & Event Code) SE (Stock exchange and symbol) qualitative Merkmale SF (Special feature) qualitatives Merkmal SO (Source) TI (Title) formatiertes Feld YR (Year of Publication)

Grafik in Datenbanken Bilddateien gif jpeg Geographische Datenbank Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 11/25 Grafik in Datenbanken Bilddateien gif jpeg Geographische Datenbank (Stadtpläne) Grafische Struktur (Kommunikation über grafische Elemente) Grafik in integrierten Datenbanken

Funktionsorientierte Informationssysteme Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 12/25 Funktionsorientierte Informationssysteme vertikal horizontal

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 13/25 Typische Begriffe: Planungs- und Entscheidungssysteme Gewinn, Marktanteil Analyse- und Informationssysteme Abweichungen, Korrelationen Berichts- und Kontrollsysteme Kosten- und Erlösart, Kostenstelle, Kostenträger Wertorientierte Abrechnungssysteme Konto, Buchungssatz Mengenorientierte operative Systeme Produktionsfaktoren, Aufträge (Administrations- & Dispositionssysteme  

Informationsübertragungs- und Wartezeiten 8. Stunde Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 14/25 1. Stunde Einarbeitung Disposition 2. Stunde Informationsübertragungs- und Wartezeiten 8. Stunde 1. Stunde Einarbeitung Lieferantenauswahl 2. Stunde Informationsübertragungs- und Wartezeiten 8. Stunde 1. Stunde Einarbeitung Bestellschreibung 1. Stunde Prozesskette mit arbeitsteiliger Datenverwaltung Durchlaufzeit (DLZ) = 24 Stunden = 3 Tage Ablauf bei traditioneller arbeitsteiliger Organisation

Einarbeitung Disposition Wartezeiten 4. Std. Datenbank Einarbeitung Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 15/25 Einarbeitung Datenbank Disposition Wartezeiten 4. Std. Einarbeitung Lieferantenauswahl Wartezeiten 4. Std. Einarbeitung Bestellschreibung Prozesskette mit integrierter Datenbasis Durchlaufzeit (DLZ) = 16 Stunden = 2 Tage Ablauf bei Unterstützung durch integrierte Datenbank

Integration (lateinisch) : „Wiederherstellung eines Ganzen“ Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 16/25 Integration (lateinisch) : „Wiederherstellung eines Ganzen“ Allgemein: (Wieder-)Herstellung einer Einheit; Einbeziehung; Eingliederung in ein größeres Ganzes, d.h. z.B. das Zusammenwirken der verschiedenen Informationssysteme unternehmensintern und unternehmensübergreifend auf den unterschiedlichsten Ebenen Daten, Funktionen, Organisation

Kriterien für Anfragesprachen Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 17/25 Kriterien für Anfragesprachen Ad hoe Formulierung: Der Benutzer soll eine Anfrage formulieren können, ohne ein vollständiges Programm schreiben zu müssen. Deskriptivität: Der Benutzer soll formulieren: „Was will ich haben?“ und nicht „Wie komme ich an das, was ich haben will?“ Mengenorientiertheit: Jede Operation soll auf Mengen von Daten gleichzeitig arbeiten, nicht navigierend nur auf einzelnen Elementen (one-tuple-at-a-time). Abgeschlossenheit: Das Ergebnis kann wieder als Eingabe für die nächsten Anfragen verwendet werden

Alle Konstrukte des zugrundeliegenden Datenmodells werden unterstützt. Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 18/25 Adäquatheit: Alle Konstrukte des zugrundeliegenden Datenmodells werden unterstützt. Orthogonalität: Sprachkonstrukte sind in ähnlichen Situationen auch ähnlich anwendbar. Optimierbarkeit: Die Sprache besteht aus wenigen Operationen, für die es Optimierungsregeln gibt. Effizienz: Jede Operation ist effizient ausführbar. Sicherheit: Keine Anfrage, die syntaktisch korrekt ist, darf in eine Endlosschleife geraten oder ein unendliches Ergebnis liefern.

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 19/25 Eingeschränktheit: Die Anfragesprache darf keine komplette Programmiersprache sein. Diese Eigenschaft folgt aus Sicherheit, Optimierbarkeit und Effizienz. Vollständigkeit: Die Sprache muss mindestens die Anfrage einer Standardsprache ausdrücken können.

Invnr Name Invnr Titel ISBN Autor Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 20/25 Invnr Name 4711 Meyer 1201 Schulz 0007 Müller 4712 Ausleih Invnr Titel ISBN Autor 0007 Dr. No 3-125 James Bond 1201 Objektdatenbanken 3-111 Heuer 4711 Datenbanken 3-765 Vossen 4712 3-891 Ullman 4717 Pascal 3-999 Wirth Buch

Der Syntax der Projektion ist ¶ [attributmenge] (relation) Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 21/25 Projektion Der Syntax der Projektion ist ¶ [attributmenge] (relation) Beispiel: ¶ [Name] (Ausleih) Selektion Die Syntax der Selektion ist σ [bedingung] (relation) σ [Name<‚N‘] (Ausleih) Name Meyer Schulz Müller Invnr Name 4711 Meyer 0007 Müller 4712

ß [ neu  alt] (relation) Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 22/25 Verbund Relation 1 Relation 2 Beispiel: Ausleih Buch Umbenennung ß [ neu  alt] (relation) ß [Autor 1  Autor 2] (Buch 2) Müller Dr. No 3-125 James Bond Schulz Objektdaten-banken 3-111 Heuer Meyer Datenbanken 3-765 Vossen 3-891 Ullman Autor 2 Witt Vossen Silberschatz Meier Wirth

Buch 1 U ß [Autor 1  Autor 2] (Buch 2) Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 23/25 Vereinigung relation 1 U relation 2 Beispiel: Buch 1 U ß [Autor 1  Autor 2] (Buch 2) Differenz relation1 – relation 2 Buch 1 – ß [Autor 1  Autor 2] (Buch 2) Autor 1 James Bond Heuer Vossen Ullman Wirth Witt Silberschatz Meier Name James Bond Heuer Ullman

Minimale Menge relationenalgebraischer Operatoren Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 24/25 Durchschnitt relation 1 ∩ relation 2 Beispiel: Buch 1 ∩ ß [Autor 1  Autor 2] (Buch 2) Minimale Menge relationenalgebraischer Operatoren Für theoretische Untersuchungen ist es wichtig, mit einer minimalen Menge von Operationen auszukommen. Eine minimale Relationenalgebra besteht etwa aus den Operationen. π σ ß U - ∩ Autor 1 Vossen Wirth

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 25/25 Wobei bei der Selektion nur einfache Konstanten- und Attribute – Selektionen, aber keine vollständigen booleschen Ausdrücke notwendig sind. Wir bezeichnen diese Menge von Operationen mit Ω. Die Operationen mit Ω sind unabhängig, d.h. es kann keine weggelassen werden, ohne die Vollständigkeit zu verlieren.