Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25 Textdatenbanken Volltextdatenbanken enthalten im Prinzip den vollen Text einer Dokumentationseinheit.

Ähnliche Präsentationen


Präsentation zum Thema: "Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25 Textdatenbanken Volltextdatenbanken enthalten im Prinzip den vollen Text einer Dokumentationseinheit."—  Präsentation transkript:

1 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25 Textdatenbanken Volltextdatenbanken enthalten im Prinzip den vollen Text einer Dokumentationseinheit. Aber in allen Fällen wird der Text bzw. die in ihm enthaltenen Informationen durch weitere Felder beschrieben: Attribute Merkmale Nomenklaturen Thesaurus

2 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg2/25 FeldnameDatentyp ND (Dokument-, Artikelnummerqualitatives Merkmal PY (Erscheinungsjahr)Rangmerkmal VN (Ausgabenummer der Zeitung)Rangmerkmal PD (Erscheinungsdatum der Zeitung)Rangmerkmal PA (Seite der Zeitung)Rangmerkmal AC (zweistelliger Zifferncode des Autors qualitatives Merkmal oder Redakteurs) AU (Name oder Namenskurzzeichen des qualitatives Merkmal Autors oder Redakteurs) RB (Titel einer Rubrik)formatiertes Feld bzw. qualitatives Merkmal TI (Titel des Artikels)formatiertes Feld UT (Untertitel)formatiertes Feld AB (Einleitung des Artikels)Text T1 (1. Textabschnitt des Artikels)Text ++ (weitere Textabschnitte des Artikels)Text

3 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg3/25 Die drei formatierten Felder RB, TI und UT übernehmen noch Informationen des Artikels mit Textcharakter. Lediglich das Feld RB könnte, bei entsprechender Strukturierung auch ein qualitatives Merkmal sein. Hinzu kommen noch Rangmerkmale. VN und PD, sowie die Seitennummer haben einen eindeutigen Rangcharakter. Für das Retrieval bedeutet das, dass zusätzlich die kleiner/größer-Operatoren Verwendung finden können. Die verbleibenden Felder stellen qualitative Merkmale dar. Wie bereits ausgeführt, bilden qualitative Merkmale nach dem Messvorgang disjunktive Teilmengen auf der betrachteten Menge der Objekte. Einige jedoch nehmen eine Sonderstellung ein, weil ihre Teilmengen aus nur je einem Element bestehen. In diesem Datensatz ist dies z.B. das Feld ND.

4 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg4/25 Für das Retrieval stellen diese Felder insoweit eine Besonderheit dar, weil ein Suchvorgang mit ihnen (über eine Merkmalsausprägung) immer zu einer einelementigen Menge führt. Diese Felder erlauben also die Identifikation einzelner Sätze der Datenbank. Sie sollen, in Anlehnung an den entsprechenden Begriff der Datenbanktheorie, Schlüssel genannt werden. Neben langen Texten (allgemein, Zeitschriften, Vorschriften) werden auch Patentdatenbanken als Volltextdatenbanken geführt.

5 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg5/25 Bibliographische Datenbanken AB = textliche Informationen Textliche Informationen werden modelliert. Da aber Wissen modelliert wird, wird von Repräsentationen (Wissensrepräsentationen) gesprochen. Diese Repräsentationen können nun als Erklärungsversuch verstanden werden.

6 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg6/25 FeldnameDatentyp AN (Accession number)Schlüssel TI (Original title)formatiertes Feld AU (Author(s))formatiertes Feld DT (Document type)qualitatives Merkmal SO (Source)formatiertes Feld bzw. qualitatives Merkmal Decimal Classification DP (primary)Nomenklatur DS (Secondary)Nomenklatur DG (Geographical)Nomenklatur MJ (Major descriptors)Nomenklatur bzw. qualitatives Merkmal MN (Minor descriptors)Nomenklatur bzw. qualitatives Merkmal AB (Abstract)Text (Information über Text)

7 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg7/25 Integrierte Datenbanken Datenbanken mit umfangreichem Inhalt. Sie integrieren Daten aus Fakten- basierenden Datenbanken und aus textlichen Datenbanken. Data Warehouse ist ein Begriff, der in diesem Zusammenhang verwendet wird. Fakten an Produkten statische Daten (z.B. Herstellung Ein- und Ausfuhr) Daten der Zulieferer Rechtsvorschrift (Umweltverträglichkeit) Patentinformationen Formalismen

8 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg8/25 1.Auf der unteren Ebene sind horizontal die mengenorientierten Systeme angegeben, die sich an den operativen Funktionen Produktion, Technik, Beschaffung, Vertrieb und Personaleinsatz ausrichten. Als Beispiel kann Betriebsdatenerfassung (BDE), bspw. Auch die Arbeitszeiterfassung genannt werden. 2.Die mengenorientierten Prozesse werden vertikal in wertorientierten Abrechnungssystemen des Rechnungswesens erfasst. Beispiele für das Beschaffungssystem sind die Kreditorenbuchführung, für das Vertriebssystem die Debitorenbuchführung und für das Personalwesen die Lohn- und Gehaltsabrechnung. 3.Aus den mengen- und wertorientierten Systemen Informationen für Berichts- und Kontrollsysteme abgeleitet. 4.Analyse- und Informationssysteme werden erstellt, die neben den verdichteten Daten auch Daten externer Quellen einbeziehen. Beispiele hierfür sind Marketing-, Beschaffungs- und Produktionsinformationssysteme.

9 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg9/25 5.Die höchste Verdichtungsstufe bilden Planungs- und Entscheidungssysteme, die insbesondere für langfristig wirkende Entscheidungen Unterstützung geben sollen, zum Beispiel etwa ein Vertriebs-Führungsinformationssystem für den Vertriebsvorstand. Auch hier liegt wieder ein zusammengesetztes Feld vor (CI), das ohne Schwierigkeit in die Form einzelner Merkmale überführt werden kann. Weiter finden sich hier bereits in diesem ersten Teil der Informationseinheit numerische Informationen im Feld CD (Corporate Statistics). Numerische Informationen in Online-Datenbanken stellen wiederum im Regelfall Ausprägungen quantitativer Merkmale oder vercodete Ausprägungen qualitativer Merkmale dar. In diesem Fall handelt es sich um klare quantitative Merkmale: SALES (in US-Dollar) und EMPLOYEES, allerdings in einem zusammengehörigen Teil erfasst.

10 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg10/25 FeldnameDatentyp AB (Abstract, hier Time Series)Text bzw. Tabelle (!) AN (Identification number)qualitatives Merkmal/Schlüssel CI (Corporate Information)zusammengesetztes Feld aus qualitativen Merkmalen CN (Country Descriptor & Country Code)Nomenklatur CO (Company Descriptor)qualitatives Merkmal/Schlüssel CS (Corporate Statistics)zusammengesetzt aus qualitativen Merkmalen und einem Rangmerkmal EN (Event Descriptor & Country Code)Nomenklatur mit Mehrfacheinträgen PN (Product Descriptor & Event Code)Nomenklatur mit Mehrfacheinträgen SE (Stock exchange and symbol)qualitative Merkmale SF (Special feature)qualitatives Merkmal SO (Source)qualitatives Merkmal TI (Title)formatiertes Feld YR (Year of Publication)Rangmerkmal

11 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg11/25 Grafik in Datenbanken Grafik in integrierten Datenbanken Bilddateien gif jpeg Geographische Datenbank (Stadtpläne) Grafische Struktur (Kommunikation über grafische Elemente)

12 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg12/25 Funktionsorientierte Informationssysteme Produktion Technik Beschaffung Vertrieb Personal vertikal horizontal

13 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg13/25 Typische Begriffe: Planungs- und EntscheidungssystemeGewinn, Marktanteil Analyse- und InformationssystemeAbweichungen, Korrelationen Berichts- und KontrollsystemeKosten- und Erlösart, Kostenstelle, Kostenträger Wertorientierte AbrechnungssystemeKonto, Buchungssatz Mengenorientierte operative SystemeProduktionsfaktoren, Aufträge (Administrations- & Dispositionssysteme

14 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg14/25 Einarbeitung Disposition Informationsübertragungs- und Wartezeiten Einarbeitung Lieferantenauswahl Informationsübertragungs- und Wartezeiten Einarbeitung Bestellschreibung 8. Stunde 1. Stunde 2. Stunde Prozesskette mit arbeitsteiliger Datenverwaltung Durchlaufzeit (DLZ) = 24 Stunden = 3 Tage Ablauf bei traditioneller arbeitsteiliger Organisation

15 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg15/25 Einarbeitung Disposition Wartezeiten Einarbeitung Lieferantenauswahl Wartezeiten Einarbeitung Bestellschreibung Datenbank Prozesskette mit integrierter Datenbasis Durchlaufzeit (DLZ) = 16 Stunden = 2 Tage Ablauf bei Unterstützung durch integrierte Datenbank 4. Std.

16 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg16/25 Integration (lateinisch) : Wiederherstellung eines Ganzen Allgemein: (Wieder-)Herstellung einer Einheit; Einbeziehung; Eingliederung in ein größeres Ganzes, d.h. z.B. das Zusammenwirken der verschiedenen Informationssysteme unternehmensintern und unternehmensübergreifend auf den unterschiedlichsten Ebenen Daten, Funktionen, Organisation

17 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg17/25 Kriterien für Anfragesprachen Ad hoe Formulierung: Der Benutzer soll eine Anfrage formulieren können, ohne ein vollständiges Programm schreiben zu müssen. Deskriptivität: Der Benutzer soll formulieren: Was will ich haben? und nicht Wie komme ich an das, was ich haben will? Mengenorientiertheit: Jede Operation soll auf Mengen von Daten gleichzeitig arbeiten, nicht navigierend nur auf einzelnen Elementen (one-tuple-at-a-time). Abgeschlossenheit: Das Ergebnis kann wieder als Eingabe für die nächsten Anfragen verwendet werden

18 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg18/25 Adäquatheit: Alle Konstrukte des zugrundeliegenden Datenmodells werden unterstützt. Orthogonalität: Sprachkonstrukte sind in ähnlichen Situationen auch ähnlich anwendbar. Optimierbarkeit: Die Sprache besteht aus wenigen Operationen, für die es Optimierungsregeln gibt. Effizienz: Jede Operation ist effizient ausführbar. Sicherheit: Keine Anfrage, die syntaktisch korrekt ist, darf in eine Endlosschleife geraten oder ein unendliches Ergebnis liefern.

19 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg19/25 Eingeschränktheit: Die Anfragesprache darf keine komplette Programmiersprache sein. Diese Eigenschaft folgt aus Sicherheit, Optimierbarkeit und Effizienz. Vollständigkeit: Die Sprache muss mindestens die Anfrage einer Standardsprache ausdrücken können.

20 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg20/25 InvnrName 4711Meyer 1201Schulz 0007Müller 4712Meyer InvnrTitelISBNAutor 0007Dr. No3-125James Bond 1201Objektdatenbanken3-111Heuer 4711Datenbanken3-765Vossen 4712Datenbanken3-891Ullman 4717Pascal3-999Wirth Ausleih Buch

21 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg21/25 Projektion Der Syntax der Projektion ist ¶ [attributmenge] (relation) Beispiel: ¶ [Name] (Ausleih) Selektion Die Syntax der Selektion ist σ [bedingung] (relation) Beispiel: σ [Name

22 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg22/25 Verbund Relation 1 Relation 2 Beispiel: Ausleih Buch Umbenennung ß [ neu alt] (relation) Beispiel: ß [Autor 1 Autor 2] (Buch 2) MüllerDr. No3-125 James Bond Schulz Objektdaten- banken 3-111Heuer MeyerDatenbanken3-765Vossen MeyerDatenbanken3-891Ullman Autor 2 Witt Vossen Silberschatz Meier Wirth

23 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg23/25 Vereinigung relation 1 U relation 2 Beispiel: Buch 1 U ß [Autor 1 Autor 2] (Buch 2) Differenz relation1 – relation 2 Beispiel: Buch 1 – ß [Autor 1 Autor 2] (Buch 2) Name James Bond Heuer Ullman Autor 1 James Bond Heuer Vossen Ullman Wirth Witt Silberschatz Meier

24 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg24/25 Durchschnitt relation 1 relation 2 Beispiel: Buch 1 ß [Autor 1 Autor 2] (Buch 2) Minimale Menge relationenalgebraischer Operatoren Für theoretische Untersuchungen ist es wichtig, mit einer minimalen Menge von Operationen auszukommen. Eine minimale Relationenalgebra besteht etwa aus den Operationen. π σ ß U - Autor 1 Vossen Wirth

25 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg25/25 Wobei bei der Selektion nur einfache Konstanten- und Attribute – Selektionen, aber keine vollständigen booleschen Ausdrücke notwendig sind. Wir bezeichnen diese Menge von Operationen mit Ω. Die Operationen mit Ω sind unabhängig, d.h. es kann keine weggelassen werden, ohne die Vollständigkeit zu verlieren.


Herunterladen ppt "Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25 Textdatenbanken Volltextdatenbanken enthalten im Prinzip den vollen Text einer Dokumentationseinheit."

Ähnliche Präsentationen


Google-Anzeigen