Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Klaudia Beutel Geändert vor über 9 Jahren
1
Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 20021 Web Warehousing Teil 2 der Präsentation „Web Warehousing und Knowledge Management“ Gerda Jelleschitz gerda.jelleschitz@gmx.at
2
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 2 Überblick 1.web-based query and reporting 2.web-OLAP 3.web-based statistical analysis and data mining 4.web-based graphical information systems 5.text information management systems 6.search engines and facilities 7.text mining systems 8.multimedia information management systems
3
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 3 1. Web-Based Query und Reporting zwas sind /wofür sind yquery tools yreporting tools zwelche Technologien wofür zVorteile einer Web-Warehousing- Applikation
4
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 4 Query Tools z eine Anfrage unmittelbar an die Datenbank z Modus „pro-active“ z Einsatz: y die gewünschte Information ändert sich oft y Benutzer zu unterschiedlichen Zeiten unterschiedliche Informationen benötigen y wichtig, dass Information zeitgerecht und sofort verfügbar ist
5
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 5 Reporting Tools z ein Report wird generiert und danach abgespeichert z Modus „reactive“ z Einsatz: y wenn die Information für eine bestimmte Zeit gültig ist y wenn User die selbe Info in dem selben Format öfter und jederzeit benötigen
6
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 6 Welche Technologien wofür ReportingQuery PPPideal! CGImöglichideal Java mit JDBCmöglichgut Client- Applikation möglichandere Nachteile!
7
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 7 Vorteile einer Web- Warehousing-Anwendung z Einsparungen beim yNetzwerk yEnd-User-Workstations yEnd-User-Software ySoftware-Wartung und End-User- Support z Möglichkeit von jedem Ort der Welt aus zu arbeiten, weltweite Konsistenz
8
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 8 2. Web-OLAP zWas ist OLAP zCharakteristika einer erfolgreichen OLAP- Implementation zDesign-Ansätze zData-Management-Ansätze
9
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 9 Was ist OLAP z OnLine Analytical Processing Daten werden aus einer Datenbank ermittelt und übersichtlich dargestellt z Base Reports vordefiniertes Layout haben yStyles (zB straight, sparse/nested, stacked/nested). z Navigierbarkeit zOLAP für Online-Aktivitäten und nicht als Report-Writer einzusetzen!
10
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 10 Charakteristika einer erfolgreichen OLAP- Implementation Vvolatile content Aactionable Iimportant Nnavigatable Sstable format & dimensions
11
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 11 Design-Ansätze zPrecalculate and Store zCalculate on the Fly zHybride Ansätze
12
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 12 Data-Management-Ansätze zbig cube – little cube
13
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 13 3. Web-Based Statistical Analysis and Data Mining zAnalytische Tools zWas ist Data-Mining zKategorien ermittelter Information zstatistische Produkte zdata discovery tools zVergleich zArchitektonische Ansätze
14
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 14 Analytical Toolkits zstatistische Analyse zData Discovery
15
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 15 Kategorien ermittelbarer Information z Desciptive Information z Predictive Information z Exploratory/Explanatory Discovery z Specialized Insights
16
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 16 Was ist Data Mining? z große Mengen an Daten analysieren um versteckte Muster oder Charakteristika zu entdecken, zu beschreiben
17
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 17 Überblick Statistische Produkte z Korrelationsanalyse z Faktoranalyse zRegressionsanalyse
18
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 18 Überblick Data Discovery Tools z auch data mining, information discovery oder knowledge discovery zNeuronale Netze zCHAID y(chi-square automatic interaction detection)
19
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 19 Vergleich zAnforderungen an den Benutzer zAufbereitung der Daten zMathematische Grundlagen zZuverlässigkeit der Ergebnisse
20
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 20 Vergleich Anforderungen an den Benutzer zallgemein: y Statistical Tools verlangen größeres Verständnis von statistischen Grundlagen z Bedienung y Statistical Tools: benötigt meist einen Statistiker y Data Discovery Tools: sehr einfach z Interpretation der Ergebnisse y Statistical Tools:ohne Statistik-Kenntnisse sehr schwer y Data Discovery Tools: üblicherweise leicht zu verstehen und schwer zu misinterpretieren
21
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 21 Vergleich Aufbereitung der Daten Statistical Tools zsehr hohen Standards im Sinne von yMenge yGenauigkeit Data Discovery Tools z mit weniger und qualitativ schlechteren Daten können bereits Ergebnisse erzielt werden
22
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 22 Vergleich Mathematical Foundations zStatistical Tools ytraditionelle Statistik x extrem hohen Standards für Tests und Messungen z Data Discovery Tools y neuere, weniger traditionell definierte oder bewiesene Formen statistischer Analyse Modelle meist viel einfacher zu erstellen Abhängigkeiten weit schwerer zu beweisenden
23
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 23 Vergleich Zuverlässigkeit der Ergebnisse z statistischen Ergebnisse i.a. genauer und verlässlicher als Data Discovery z ungleich höhere Kosten der statistischen Tools bzw deren Anwendung! z Bevorzugung der Data-Discovery-Tools, v.a. wenn kleine Ungenauigkeiten keine Auswirkungen haben
24
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 24 Architektonische Ansätze z100% server-based z100% client-based zHybride Ansätze
25
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 25 4. Web-Based Graphical and Geo- graphical Information Systems zArten graphischer Informationsysteme ytraditional charting and drawing-sw yVirtual Reality (2D/3D/4D) – Reality Representations yMehrdimensionale abstrakte Repräsentationen yGeographische Informationssysteme
26
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 26 Traditional Charting and Drawing-Software zFunktionalität weit verbreitet! yzB Excel, Lotus 1-2-3,....... zWert ygroße Mengen Daten in klare Muster yklar Trends und Richtungen zu zeigen yden Kommunikationsprozess vereinfachen
27
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 27 Virtual Reality (2D/3D/4D) – Reality Representations jene Anwendungen, die die Realität darstellen (zB Darstellung von Vorgängen innerhalb eines Kernkraftwerks) zLayering Applications
28
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 28 Mehrdimensionale abstrakte Repräsentationen stellt extrem komplexe, mehrdimensionale Daten stark vereinfacht graphisch dar zVisual Data Mining
29
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 29 Geographische Informationssysteme zlayers und overlays...
30
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 30 5. Text Information Management Systems zIdee: System sucht Texte, liest sie, und bewertet sie z Text Information Management System(TIMS) ist ein System, bestehend aus y Menschen y Prozessen, y Hard- und Software y „Rohstoffen“, in diesem Fall Texte in jeder erdenklichen Form.
31
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 31 Text Information Management Systems z TIMS werden unterschieden nach 1.den wichtigsten Kategorien von TIMS 2.ihren funktionellen Komponenten 3.ihr Zustell- und Ausführmodell 4.ihren Informationsquellen 5.der Menge/Art an Texten
32
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 32 Die wichtigsten Kategorien von TIMS zsearch engines und search enabler yweb-based public domain ysubscription search services ycorporate digital libraries zsubscription/conscription services zcollaborative work environments
33
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 33 Search Engines und Search Enabler zkeyword search zeinengen des Suchfelds ygeographisch yzeitlich ysprachlich yInhalt (Graphiken, Videos etc) y..... zSearch Enabler: neue Generation „super- Suchmaschinen“
34
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 34 Subscription/Conscription Services znews services zstock quotes/monitoring zon-line clipping services zspecial interests groups zmarketing conscription services zcorporate conscription services
35
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 35 Collaboratorive Work Environments zShared Reference Libraries zWork Flow Management Systems zCollaborative Problem Solving and Think Tank Applications
36
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 36 Textanalyse z Ansätze zur Textanalyse enthalten: yKeyword oder „Abstract“ Analyse yWord Count yPhrase and Word Combination Count yContext Evaluation yAdvanced Analytical Techniques z2 Arten yin Suchmaschinen integriert yfreistehend
37
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 37 Funktionelle Komponenten eines TIMS zTIMS üblicherweise Kombination aus yTexterstellung yTextkonvertierung ySpeicherung der Texte yWartung der Verzeichnisse yTexte indexieren und katalogisieren yTextanalyse yTextsuche und –retrieval yTextformatierung und -anzeige
38
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 38 TIMS Delivery and Execution Models z Pull Model vs. Push Model z Targeted Model vs. Broadcast Model z User-based-Model vs. Agent-based-Model
39
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 39 TIMS Informationsquellen zPublic Domain zMarketing Materials zBrokered Information zCorporate Property
40
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 40 6. Search Engines und Facilities zArchitektur zVariationen in der Arbeitsweise
41
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 41 Search Engines und Facilities - Architektur z jede Suchmaschine hat zumindest folgende Komponenten: yUser Request Facility ySearch Template y Search Universe y Index y Index Builder y Query Builder und Execution Mechanism y User Response Facility
42
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 42 Variationen in der Arbeitsweise z Verschiedene Index-Schemen y einfacher Suchmaschinen-Index y mehrwertige Index-Spalten y multipler Index z Art der Indexerstellung y von Menschen y job-based y Spider
43
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 43 7. Text Mining Systeme zumfasst yInformation und/oder Wissen aus Dokumenten extrahieren yTrends in Dokumenten entdecken yInformationen über Menschen, Orte und Dinge aus Dokumenten herauslesen yDokumente zusammenfassen
44
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 44 Text Mining Systeme zTechniken: yContent Summarization yContent Search yTrend Analysis yDocument Categorization y Lexical Analysis y Grammatical Analysis y Semantic Analysis yLinguistic Analysis yCluster Analysis
45
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 45 8. Multimedia Information Systems zKategorien yHybride Suchsysteme yreine Multimedia Such- und Retrieval- Systeme yMultimedia Analyse Systeme ySicherheits- und Identifikationssysteme
46
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 46 Unterschiede zu TIMS
47
Dezember, 02KFK Verteilte Systeme/Informationssysteme WS 2002 47 Ansätze zur Indexerstellung zSimple Name Search zKeyword Search zDescriptive Document Search zReferenceable Document Search zDescriptive Database Search zMultimedia Mining Tools zReal-time matching
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.