Methoden der Datengewinnung

Slides:



Advertisements
Ähnliche Präsentationen
Was ist die Reihenfolge der Monate?
Advertisements

Datenbanken Einführung.
Tagungskalender Januar Februar März April.
Indischer Ozean 2004 Januar WindeZenit ITC Niederschlag pro Monat in mm Niederschlagskarten: GPCC-Visualizer Deutscher Wetterdienst.
Niederschläge in Afrika
Mehrwert aus Daten gewinnen mit Datamining und Textmining
Herzlich willkommen beim 1. Workshop der AG Methodik
Einführung und Überblick
© DVS System Software GmbH & Co. KG
Eine Einführung in OLAP (Online Analytical Processing)
Datenanbindung zwischen LucaNet und QlikView als Frontend
DataMining Von Daten zu Informationen und Wissen
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
...ich seh´es kommen !.
Problemstellung Heterogene DV-Strukturen Mangelnde Kapazität in der EDV-Abteilung Historische Daten nicht verfügbar Analysen belasten die vorhandene Infrastruktur.
By Woody Jahreszeiten Projekt.
Data und Web Mining KFK Semantic Web: Knowledge Management
Präsentation läuft auch vollautomatisch ab … wie du möchtest
Überblick über die Datenbankproblematik
Allgemeines zu Datenbanken
DI (FH) DI Roland J. Graf MSc (GIS) U N I V E R S I T Ä T S L E H R G A N G Geographical Information Science & Systems UNIGIS.
2014 Januar 2014 So Mo Di Mi Do Fr Sa So
Microsoft Corporation
Wann hast du Geburtstag?
Der Erotik Kalender 2005.
Datenbanken im Web 1.
Hübsche Frauen Kalender 2008
Lehrveranstaltungsverwaltung online - Ein langer Weg Mag. Ester Tomasi, LL.M IRIS 2004.
XML in der Praxis: Electronic Bill Presentment (EBP) Institut für Wirtschaftsinformatik J. W. Goethe-University J. W. Goethe University Institute of Information.
Januar, Februar, März, April - die Jahresuhr steht niemals still!
2006. Januar MODIMIDOFRSASO
Season Project By Alex hartman
Datenbanken abfragen mit SQL
...ich seh´es kommen !.
...ich seh´es kommen !.
Januar 2016 MONTAGDIENSTAGMITTWOCHDONNERSTAGFREITAGSAMSTAGSONNTAG 1 Neujahr
Er ist da, Ladies & Gentlemen !!!
WebServices Vortrag zur Diplomarbeit WebServices Analyse und Einsatz von Thomas Graf FH Regensburg
Flüchtlingssituation in der Stadt Paderborn Verfasser: Sozialamt.
PLAYBOY-KALENDER 2020 Januar
eCommerce Internet und Geschäftswelt Geschäfte und Bezahlung
MONATE Ein Jahr hat 12 Monate..
PLAYBOY-KALENDER 2020.
Dekorative Kalender für Ihre Planungs-Folien
Kalender 2004 String-Version
Januar 2018 MONTAG DIENSTAG MITTWOCH DONNERSTAG FREITAG SAMSTAG
Prof. Dr.-Ing. Franz-Josef Behr Geodaten und Datenmodell
Wesentliche Bestandteile:
IDL / SAP Schnittstellen-Set
eCommerce Internet und Geschäftswelt Geschäfte und Bezahlung
Daten als Basis für Entscheidungen
Einführung "Datenbanksysteme"
Datenbanken Eine Einführung Kerstin Fröhlig, HHBK.
Erstellt und bebildert von Nemo
GroupLink’s everything HelpDesk® im Einsatz bei der Inform GmbH
Von Wietlisbach, Lenzin und Winter
JANUAR MONTAG DIENSTAG MITTWOCH
Tage, Monate, Uhrzeit.
Da·ten·bank /Dátenbank/ Substantiv, feminin [die]
JANUAR MONTAG DIENSTAG MITTWOCH DONNERSTAG FREITAG SAMSTAG
Datenbanken Von Zoe und Carem.
Datenbanken Von Amed und Alicia.
Januar 2016 Montag Dienstag Mittwoch Donnerstag Freitag Samstag
Von Wietlisbach, Lenzin und Winter
Winalldatview - IVDK Data Mining Software
 Präsentation transkript:

Methoden der Datengewinnung Datenbanken In der heutigen Wirtschaftspraxis dominant: Relationale Datenbanksysteme (RDBMS) Massendatenverwaltung in OLTP-Systemen (OnLine Transaction Processing) Deklarative DBMS-Sprache: SQL (Structured Query Language, früher auch SEQUEL: Structured English QUEry Language) Problem: in OLTP-Systemen werden Daten für die Massenverwaltung optimiert, nicht hingegen für die Abfragen (Joins) 11/10/2018

Methoden der Datengewinnung Datawarehouse-Konzept ... Sammlung von EDV-Werkzeugen zur Gewinnun von entscheidungsrelevanten Informationen aus Daten ... bildet die Basis für PRÄSENTATIONEN (Grafiken, Berichte) und AUSWERTUNGEN (OLAP - OnLine Analytical Processing, Datamining) IDC-Studie aus 1996: durchschnittlicher ROI nach 3 Jahren eines Datawarehouses: 400% (bis zu 600% Spitze) Voraussetzungen: objektorientierte Software, Speicherung komplexer Daten und sehr umfangreicher Daten (VLDB) 11/10/2018

Methoden der Datengewinnung Datawarehouse-Konzept Datenstrom: OLTP ===> Datawarehouse Mögliche Anwendungen: - Customer Retention - Customer Services - Risk assessment and fraud detection Retrospektive Analyse vs. prospektive Analyse 11/10/2018

Methoden der Datengewinnung OLAP (OnLine Analytical Processing) OLAP gliedert die Unternehmensdaten in mehrere logische Dimensionen (Umsatz je Region, Gewinn je Produkt, Kosten pro Kostenstelle, Marktanteil je Markt etc.) Eignet sich für Problemstellungen, die mit SQL und Spreadsheets nicht gelöst werden können Antwortzeit für eine typische Fragestellung sollte < 5 sec. liegen (unabhängig von der Größe der Datenbank) Die OLAP-Entwicklung wurde von betriebswirtschaftlichen Fragestellungen und nicht von den Datenbankherstellern vorangetrieben 11/10/2018

Methoden der Datengewinnung OLAP (OnLine Analytical Processing) Typisches OLAP-Problem: automatisches Umrechnen von Gewinnen und Umsätzen in eine Gewinnspanne (Gewinn / Umsatz) bezogen auf unterschiedliche Variable (Produkt, Region, Vertriebskanal, Markt etc.) 1995: vier OLAP-Software-Hersteller gründen das OLAP-Council (http://www.olapcouncil.org) Anfang 1998: Microsoft gibt eigenen OLAP-Schnittstellen-Standard bekannt (OLE DB for OLAP, http://www.microsoft.com/data/oledb/olap/) 11/10/2018

Methoden der Datengewinnung OLAP (OnLine Analytical Processing) Die wichtigsten praktischen Voraussetzungen für OLAP-Produkte: - Schneller Datenzugriff, - schnelle Berechnungen, - Ausdruckskraft der Berechnungsformeln, - anwenderfreundliche Benutzeroberflächen, - flexible Ansichten und - Mehrbenutzerbetrieb Spreadsheets eignen sich praktisch nicht für OLAP-Anwendungen 11/10/2018

Methoden der Datengewinnung OLAP (OnLine Analytical Processing) Darstellung höherdimensionaler Ansichten in OLAP-Software: Produkt: Schuhe Umsatz direkte indirekte Gesamt- Spanne Kosten Kosten kosten Jänner 520 320 110 430 90 Februar 400 250 130 380 20 März 430 300 120 420 10 April 490 320 150 470 20 Mai 520 310 180 490 30 Juni 390 230 150 380 10 Juli 470 290 160 450 20 August 500 360 150 510 -10 September 450 290 140 430 20 Oktober 480 290 140 430 50 November 510 310 150 460 50 Dezember 550 330 160 490 60 11/10/2018

Methoden der Datengewinnung OLAP (OnLine Analytical Processing) Multidimensional Domain Structures (MDS): ... dienen zur Markierung mehrdimensionaler Zustände auf unterschiedlichen Skalen Wesentliches Merkmale von OLAP-Software: Zahlenverdichtung über Hierarchien hinweg 12 Regeln für OLAP von Codd (von TM/1 abgeschaut - OLAP-Benchmark) 11/10/2018

Methoden der Datengewinnung Datamining ... ist die Automatisierung des Entdeckens von Information in großen Datenmengen andere Bezeichnung: Knowledge Discovery in Databases (KDD) ... wurde auch schon früher betrieben (z.B. Regressionsan-alysen), aber noch nicht so genannt! 2 unterschiedliche Anwendungen: - supervised learning (classification studies) - unsupervised learning (clustering studies) KDD gilt zur Zeit als „strategisches Betriebsgeheimnis“! 11/10/2018

Methoden der Datengewinnung Datamining Beginn des Datamining: „Reinigung“ der Daten Planung der Studie Auswahl eines Training- und eines Verifikations-Datenbestands Wichtigste Techniken: Entscheidungsbäume (Decision Trees) Genetische Algorithmen (Genetic Algorithms) Neuronale Netze (Neural Nets) 11/10/2018

Methoden der Datengewinnung XML und XBRL XML: ein vom W3C-Konsortium beschlossener, vom Anwender frei definierbarer Sprachstandard. Beispiel: <!xml version=”1.0”!> <liste> <kunde> <name>Microsoft</name> <ort>München</ort> </kunde> </liste> 11/10/2018

Methoden der Datengewinnung XML und XBRL Eigene Tags können in einer Document Type Definition festgelegt werden. XML-Serverdatenbanken sind bereits verfügbar. Diese Technologie besitzt das schnellste Wachstum und das größte Zukunftspotential im gesamten EDV- und Internet-Bereich! In Zukunft: weblications (Webpage = application) 11/10/2018

Methoden der Datengewinnung Standard zum Datenaustausch von Bilanz-, Kontensalden-, Journal- und Belegdaten (existiert zur Zeit als draft, endgültige Version ab 1.3.2000): www.xbrl.org Wird als Standard-Datenformat in alle neuen MS-Produkte integriert. Ersatz für EDIFACT-Standard. 11/10/2018