Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/9 Data Mining Ist die Wissensgewinnung aus Datensammlungen (Knowledge Discovery in Database).

Slides:



Advertisements
Ähnliche Präsentationen
Datenbankdesign mit ACCESS.
Advertisements

Daten im Data-Warehouse
Heterogene Informationssysteme
Datenbanken Einführung.
Datenmodellierung Externe Phase Informationsstruktur
Objekt – Relationales – Modell Tomasz Makowski IN
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/12 Informationsretrieval Suche mit und nach Attributen und Merkmalen, die bedeutend für die.
Lernen als Informationsverarbeitung
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24 Beispiel einer Anfrage Welche Umsätze sind in den Jahren 1998 und 1999 in den Abteilungen.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/10 Grafische Anfragesprachen Geeignet sind grafische Anfragesprachen für Nutzer, die keine.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Datenbanken werden als Anhäufung von Werten eines Wertebereiches aufgefasst und Datenbankabfragen.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Information Retrieval auf Texten An ihre Grenzen stoßen relationale Datenbanken bei der.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Klassifikationen Klassifikationen dienen dazu, Themen oder Objekte systematisch zu ordnen.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/10
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri)
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/7
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/5 Grundtechniken des Information Retrieval Deskribierung Hierunter versteht man eine manuelle.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/4 Machine Learning (ML) Der erste Teil dieser Definition ist auch eine Beschreibung von Machine.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/4 Manuelle Verfahren Klassifizierung Hier werden Dokumente in ein fest vorgegebenes System.
QBE in MS Access formulieren
Abhängigkeitsbeziehung
UML im Überblick – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/22
Schritte zu Datenmodellierung
Markplätze für Agenten Seminar Softwareagenten Timo Hoelzel.
AGXIS – Ein Konzept für eine generische Schnittstellenbeschreibung Dr.-Ing. Ulrich Hussels, RISA GmbH 07. Juni 2005 Workshop Umweltdatenbanken 2005.
Datenbankentwurf mit Hilfe des ER-Modells entwickeln
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
Universeller Zugriff auf multimediale Dokumentstrukturen auf der Basis von RDF und MPEG-7 Stefan Audersch BerlinXSW Juni.
Data Warehousing Oberseminarvortrag zum Thema: von Daniel Schulte
OLAP. © T. Kudraß, HTWK Leipzig Warum? Daten einer Firma verfügbar machen für Entscheidungsprozesse – Umsetzung schwierig neue Konzepte notwendig zur.
Abgrenzung, Einordnung und Anwendungen Sebastian Hentschel
Access 2000 Datenbanken.
Datenbanken Einführung Merkmale dateiorientierte Datenverwaltung
Datenintegrität Referentielle Integrität create table
Einführung Dateisystem <-> Datenbanksystem
Datenmodellierung - Aufbau einer Datenbank -
Fachbereich Mathematik/Informatik Universität Osnabrück
Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.
Datenbankentwurfsprozess
Die Bank von morgen - eine neue Welt für IT und Kunden? 23. Oktober 2001.
Daten sammeln aus Verschiedenen Datenbanken Dokumenten Dateien
... und alles was dazugehört
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Anforderungen von eScience und Grid-Technologie.
© DVS System Software GmbH & Co. KG
Eine Einführung in OLAP (Online Analytical Processing)
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Problemstellung Heterogene DV-Strukturen Mangelnde Kapazität in der EDV-Abteilung Historische Daten nicht verfügbar Analysen belasten die vorhandene Infrastruktur.
Sesame Florian Mayrhuber
Data und Web Mining KFK Semantic Web: Knowledge Management
Überblick über die Datenbankproblematik
Datenbanken und Datenmodellierung
Allgemeines zu Datenbanken
(D.h. „Hallo MausFans!“ auf Japanisch).
00:13 Matthias Ansorg FH Gießen-Friedberg1 / 24 Multidimensionale Datenstrukturen - semantische und logische Modellierung Teilvortrag: logische Modellierung.
Betriebliche Anwendung von Datenbanksystemen: Data Warehouse
Mehr Zeit für den Kunden und wirtschaftlicher Arbeiten mit BIB-Control
Pki Informationssysteme für Marktforschung präsentiert...
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 19 Version 1.0a Programme - Zusatzsoftware Oracle: –Forms –Reports –Designer –Jdeveloper –APEX (Application Express)
Das Information Warehouse Die Stärken eines zentralen dispositiven Information-Warehouse als informative Kernkomponente in einer heterogenen operativen.
Informatik Technische Informatik Praktische Informatik Theoretische
Eike Schallehn, Martin Endig
Einführung Dateisystem <-> Datenbanksystem
Nachtrag Abgrenzung OLAP / OLTP
Oracle Portal think fast. think simple. think smart. Dieter Lorenz, Christian Witt.
Seminar Data Warehousing - SS 2005
Excel-Tool: Beschwerdeanalyse  Folie 1 von Bitte Makros aktivieren Das Excel-Tool funktioniert nur mit eingeschalteten Makros. Eventuell erhalten.
Nachtrag Abgrenzung OLAP / OLTP
 Präsentation transkript:

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/9 Data Mining Ist die Wissensgewinnung aus Datensammlungen (Knowledge Discovery in Database). Hier wird in vorhandenen Datensammlungen nach nützlichen Regelmäßigkeiten gesucht. Dabei braucht zunächst nicht bekannt sein, welche Eigenschaften oder Attribute der Datensätze wichtig sind. Das sollen die Data Mining Verfahren herausfinden. Allgemein lässt sich das so definieren: Knowledge Discovery in Database (oder Data Mining) beschreiben automatisierte Verfahren, mit denen Regelmäßigkeiten in Mengen von Datensätzen gefunden und in eine für Nutzende verständliche Form gebracht werden.

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg2/9 Kennzeichnend für das Data Warehouse ist eine spezielle Strukturierung der Daten zur Unterstützung mehrdimensionaler Auswertungen. Große Bedeutung haben dabei die sogenannten Stern-Schemata gefunden, deren Einsatz sich auch zur Web-Zugriffsanalyse eignet. Dabei ist die Masse der auszuwertenden Daten im Rahmen von Faktentabellen gespeichert. Die zur Auswertung benötigten beschreibenden Eigenschaften der Fakten sind durch Dimensionstabellen repräsentiert; die Verbindung zwischen den Tabellen erfolgt durch Fremdschlüssel der Faktentabelle, die sich auf jeweils eine Dimension beziehen.

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg3/9 Grobarchitektur für Data Warehouse und OLAP Externe Datenquellen Operationale Datenquellen Metadaten Extrahieren Data Marts Data Warehouse Analyse Werkzeug OLAP Server

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg4/9 Anforderungen an OLAP Der Autor Pendse fasst Anforderungen an OLAP unter der Bezeichnung FASMI (Fast Analysis of Shared Multidimensional Information) zusammen. Fast Die Zugriffszeit muss im Sekundenbereich liegen, um interaktives Arbeiten zu ermöglichen. Analysis Das System muss analytische und statistische Funktionalität anbieten. Die Benutzerschnittstelle muss Ad-hoc Anfragen ohne Programmieraufwand erlauben.

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg5/9 Shared Das System erlaubt Mehrnutzerbetrieb. Allgemein sollten die DBMS Funktionalitäten der Transaktionssynchronisation realisiert sein. Auch wenn die Anwendungen in der Regel nur lesend zugreifen, ist die Transaktionssynchronisation in den Phasen der Aktualisierung notwendig. Multidimensional Unterstützung des multidimensionalen Datenmodells (hypercube) Information Ziel der OLAP Analyse ist die Gewinnung von Informationen aus Rohdaten.

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg6/9 OLAP Unter der Bezeichnung OLAP (On-line Analytical Processing) werden Systeme zusammengefasst, mit denen Datenbankinhalte grafisch dargestellt werden können. Mit OLAP Systemen lassen sich Auswirkungen von Änderungen bestimmter Parameter analysieren. Durch solche Visualisierungswerkzeuge können Entscheidungen unterstützen. Marktführend bei OLAP sind Hyperion Solutions (25%) und Oracle (21%).

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg7/9 Nach E.F. Codd sollten OLAP Systeme folgende Merkmale erfüllen: Mehrdimensionale konzeptionelle Sicht auf Daten Transparenz und Integration in die operativen Systeme Zugänglichkeit unterschiedlicher Databasen über eine logische Gesamtsicht stabile, volumenabhängige Antwortzeiten Client- Server Architektur Mehrbenutzerunterstützung flexibles Berichtwesen intuitive Datenmanipulation unbeschränkte dimensionsübergreifende Operationen

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg8/9 Für OLAP sind einige Architekturvarianten entwickelt worden, die mit einem vorangestellten Buchstaben identifiziert werden. MOLAP (multidimensionales OLAP) Charakteristisch ist eine eigene Datenhaltung in Form eines Datenwürfels. Dient zur Speicherung von Matrizen. Problemfall ist ein dünn besetzter Würfel. ROLAP (relationales OLAP) Speicherung erfolgt in Relationen. Die Speicherung der Dimensionsinformation erfolgt in relationaler Form, also in Stern- oder Schneeflocken Schemas. HOLAP (hybrides OLAP) Sind Systeme, die die Speicherung als ROLAP und MOLAP unterstützen.

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg9/9 Waren Waren ID Produktgruppe MWSt-Satz Kunde KundenNr KundenAdr Stadt Fakten DatumsID FilialenID WarenID KundenNr Anzahl Gesamtpreis Rabatt Datum DatumsID Tag MonatID Filialen FilialenID Filiale OrtID AnzMitarbeiter Monate MonatID Monat JahrID AnzTage Jahre JahrID AnzTage Staaten StaatID Staat Landessprache Orte OrtID Ort Bundesland Fläche StaatID