Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 20021 Web Warehousing Teil 2 der Präsentation „Web Warehousing und Knowledge Management“ Gerda.

Ähnliche Präsentationen


Präsentation zum Thema: "Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 20021 Web Warehousing Teil 2 der Präsentation „Web Warehousing und Knowledge Management“ Gerda."—  Präsentation transkript:

1 Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 20021 Web Warehousing Teil 2 der Präsentation „Web Warehousing und Knowledge Management“ Gerda Jelleschitz gerda.jelleschitz@gmx.at

2 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 2 Überblick 1.web-based query and reporting 2.web-OLAP 3.web-based statistical analysis and data mining 4.web-based graphical information systems 5.text information management systems 6.search engines and facilities 7.text mining systems 8.multimedia information management systems

3 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 3 1. Web-Based Query und Reporting zwas sind /wofür sind yquery tools yreporting tools zwelche Technologien wofür zVorteile einer Web-Warehousing- Applikation

4 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 4 Query Tools z eine Anfrage unmittelbar an die Datenbank z Modus „pro-active“ z Einsatz: y die gewünschte Information ändert sich oft y Benutzer zu unterschiedlichen Zeiten unterschiedliche Informationen benötigen y wichtig, dass Information zeitgerecht und sofort verfügbar ist

5 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 5 Reporting Tools z ein Report wird generiert und danach abgespeichert z Modus „reactive“ z Einsatz: y wenn die Information für eine bestimmte Zeit gültig ist y wenn User die selbe Info in dem selben Format öfter und jederzeit benötigen

6 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 6 Welche Technologien wofür ReportingQuery PPPideal! CGImöglichideal Java mit JDBCmöglichgut Client- Applikation möglichandere Nachteile!

7 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 7 Vorteile einer Web- Warehousing-Anwendung z Einsparungen beim yNetzwerk yEnd-User-Workstations yEnd-User-Software ySoftware-Wartung und End-User- Support z Möglichkeit von jedem Ort der Welt aus zu arbeiten, weltweite Konsistenz

8 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 8 2. Web-OLAP zWas ist OLAP zCharakteristika einer erfolgreichen OLAP- Implementation zDesign-Ansätze zData-Management-Ansätze

9 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 9 Was ist OLAP z OnLine Analytical Processing  Daten werden aus einer Datenbank ermittelt und übersichtlich dargestellt z Base Reports  vordefiniertes Layout haben yStyles (zB straight, sparse/nested, stacked/nested). z Navigierbarkeit zOLAP für Online-Aktivitäten und nicht als Report-Writer einzusetzen!

10 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 10 Charakteristika einer erfolgreichen OLAP- Implementation Vvolatile content Aactionable Iimportant Nnavigatable Sstable format & dimensions

11 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 11 Design-Ansätze zPrecalculate and Store zCalculate on the Fly zHybride Ansätze

12 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 12 Data-Management-Ansätze zbig cube – little cube

13 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 13 3. Web-Based Statistical Analysis and Data Mining zAnalytische Tools zWas ist Data-Mining zKategorien ermittelter Information zstatistische Produkte zdata discovery tools zVergleich zArchitektonische Ansätze

14 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 14 Analytical Toolkits zstatistische Analyse zData Discovery

15 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 15 Kategorien ermittelbarer Information z Desciptive Information z Predictive Information z Exploratory/Explanatory Discovery z Specialized Insights

16 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 16 Was ist Data Mining? z große Mengen an Daten analysieren um versteckte Muster oder Charakteristika zu entdecken, zu beschreiben

17 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 17 Überblick Statistische Produkte z Korrelationsanalyse z Faktoranalyse zRegressionsanalyse

18 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 18 Überblick Data Discovery Tools z auch data mining, information discovery oder knowledge discovery zNeuronale Netze zCHAID y(chi-square automatic interaction detection)

19 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 19 Vergleich zAnforderungen an den Benutzer zAufbereitung der Daten zMathematische Grundlagen zZuverlässigkeit der Ergebnisse

20 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 20 Vergleich Anforderungen an den Benutzer zallgemein: y Statistical Tools verlangen größeres Verständnis von statistischen Grundlagen z Bedienung y Statistical Tools: benötigt meist einen Statistiker y Data Discovery Tools: sehr einfach z Interpretation der Ergebnisse y Statistical Tools:ohne Statistik-Kenntnisse sehr schwer y Data Discovery Tools: üblicherweise leicht zu verstehen und schwer zu misinterpretieren

21 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 21 Vergleich Aufbereitung der Daten Statistical Tools zsehr hohen Standards im Sinne von yMenge yGenauigkeit Data Discovery Tools z mit weniger und qualitativ schlechteren Daten können bereits Ergebnisse erzielt werden

22 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 22 Vergleich Mathematical Foundations zStatistical Tools ytraditionelle Statistik x extrem hohen Standards für Tests und Messungen z Data Discovery Tools y neuere, weniger traditionell definierte oder bewiesene Formen statistischer Analyse  Modelle meist viel einfacher zu erstellen  Abhängigkeiten weit schwerer zu beweisenden

23 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 23 Vergleich Zuverlässigkeit der Ergebnisse z statistischen Ergebnisse i.a. genauer und verlässlicher als Data Discovery z ungleich höhere Kosten der statistischen Tools bzw deren Anwendung! z Bevorzugung der Data-Discovery-Tools, v.a. wenn kleine Ungenauigkeiten keine Auswirkungen haben

24 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 24 Architektonische Ansätze z100% server-based z100% client-based zHybride Ansätze

25 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 25 4. Web-Based Graphical and Geo- graphical Information Systems zArten graphischer Informationsysteme ytraditional charting and drawing-sw yVirtual Reality (2D/3D/4D) – Reality Representations yMehrdimensionale abstrakte Repräsentationen yGeographische Informationssysteme

26 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 26 Traditional Charting and Drawing-Software zFunktionalität weit verbreitet! yzB Excel, Lotus 1-2-3,....... zWert ygroße Mengen Daten in klare Muster yklar Trends und Richtungen zu zeigen yden Kommunikationsprozess vereinfachen

27 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 27 Virtual Reality (2D/3D/4D) – Reality Representations  jene Anwendungen, die die Realität darstellen (zB Darstellung von Vorgängen innerhalb eines Kernkraftwerks) zLayering Applications

28 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 28 Mehrdimensionale abstrakte Repräsentationen  stellt extrem komplexe, mehrdimensionale Daten stark vereinfacht graphisch dar zVisual Data Mining

29 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 29 Geographische Informationssysteme zlayers und overlays...

30 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 30 5. Text Information Management Systems zIdee: System sucht Texte, liest sie, und bewertet sie z Text Information Management System(TIMS) ist ein System, bestehend aus y Menschen y Prozessen, y Hard- und Software y „Rohstoffen“, in diesem Fall Texte in jeder erdenklichen Form.

31 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 31 Text Information Management Systems z TIMS werden unterschieden nach 1.den wichtigsten Kategorien von TIMS 2.ihren funktionellen Komponenten 3.ihr Zustell- und Ausführmodell 4.ihren Informationsquellen 5.der Menge/Art an Texten

32 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 32 Die wichtigsten Kategorien von TIMS zsearch engines und search enabler yweb-based public domain ysubscription search services ycorporate digital libraries zsubscription/conscription services zcollaborative work environments

33 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 33 Search Engines und Search Enabler zkeyword search zeinengen des Suchfelds ygeographisch yzeitlich ysprachlich yInhalt (Graphiken, Videos etc) y..... zSearch Enabler: neue Generation „super- Suchmaschinen“

34 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 34 Subscription/Conscription Services znews services zstock quotes/monitoring zon-line clipping services zspecial interests groups zmarketing conscription services zcorporate conscription services

35 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 35 Collaboratorive Work Environments zShared Reference Libraries zWork Flow Management Systems zCollaborative Problem Solving and Think Tank Applications

36 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 36 Textanalyse z Ansätze zur Textanalyse enthalten: yKeyword oder „Abstract“ Analyse yWord Count yPhrase and Word Combination Count yContext Evaluation yAdvanced Analytical Techniques z2 Arten yin Suchmaschinen integriert yfreistehend

37 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 37 Funktionelle Komponenten eines TIMS zTIMS üblicherweise Kombination aus yTexterstellung yTextkonvertierung ySpeicherung der Texte yWartung der Verzeichnisse yTexte indexieren und katalogisieren yTextanalyse yTextsuche und –retrieval yTextformatierung und -anzeige

38 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 38 TIMS Delivery and Execution Models z Pull Model vs. Push Model z Targeted Model vs. Broadcast Model z User-based-Model vs. Agent-based-Model

39 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 39 TIMS Informationsquellen zPublic Domain zMarketing Materials zBrokered Information zCorporate Property

40 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 40 6. Search Engines und Facilities zArchitektur zVariationen in der Arbeitsweise

41 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 41 Search Engines und Facilities - Architektur z jede Suchmaschine hat zumindest folgende Komponenten: yUser Request Facility ySearch Template y Search Universe y Index y Index Builder y Query Builder und Execution Mechanism y User Response Facility

42 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 42 Variationen in der Arbeitsweise z Verschiedene Index-Schemen y einfacher Suchmaschinen-Index y mehrwertige Index-Spalten y multipler Index z Art der Indexerstellung y von Menschen y job-based y Spider

43 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 43 7. Text Mining Systeme zumfasst yInformation und/oder Wissen aus Dokumenten extrahieren yTrends in Dokumenten entdecken yInformationen über Menschen, Orte und Dinge aus Dokumenten herauslesen yDokumente zusammenfassen

44 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 44 Text Mining Systeme zTechniken: yContent Summarization yContent Search yTrend Analysis yDocument Categorization y Lexical Analysis y Grammatical Analysis y Semantic Analysis yLinguistic Analysis yCluster Analysis

45 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 45 8. Multimedia Information Systems zKategorien yHybride Suchsysteme yreine Multimedia Such- und Retrieval- Systeme yMultimedia Analyse Systeme ySicherheits- und Identifikationssysteme

46 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 46 Unterschiede zu TIMS

47 Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 47 Ansätze zur Indexerstellung zSimple Name Search zKeyword Search zDescriptive Document Search zReferenceable Document Search zDescriptive Database Search zMultimedia Mining Tools zReal-time matching


Herunterladen ppt "Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 20021 Web Warehousing Teil 2 der Präsentation „Web Warehousing und Knowledge Management“ Gerda."

Ähnliche Präsentationen


Google-Anzeigen