Konzeptionierung am Beispiel der Schwachstellenanalyse

Slides:



Advertisements
Ähnliche Präsentationen
Dauermagnete Bei magnetischen Materialien unterscheidet man Eisenkerne bzw. Weicheisenstücke und Dauermagnete bzw. Hart-magnetische Materialien. Dauermagnete.
Advertisements

TAGUNG DER DEUTSCH-LUSITANISCHEN JURISTENVEREINIGUNG O processo penal português Panorâmica introdutória Der portugiesische Strafprozess ein einführender.
Ach wie gut, daß niemand weiß Der Schutz von Wissen
Herzlich Willkommen bei SIMPLE STABLE BULDING
Adjektivendungen Tabellen und Übungen.
ZWILLING Neuheiten 2008.
Das Hexenkochbuch Nicht Rattenschwänze, Spinnenbein
 Präsentation transkript:

Konzeptionierung am Beispiel der Schwachstellenanalyse Reifegradmodell zur Bewertung der Inputfaktoren von datenanalytischen Anwendungen Konzeptionierung am Beispiel der Schwachstellenanalyse Dipl.-Ing. Robert Bernerstätter Leoben, 28.05.2019

Ausgangssituation und Zielsetzung Probleme mit der IT-Infrastruktur bzw. dem Datenmanagement Probleme mit der Datenqualität Herausforderungen im datenanalytischen Prozess Quelle: Lueth (2016) Ziel Entwicklung eines Reifegradmodells, welches die Reife einer Organisation feststellt, um datenanalytische Projekte durchzuführen.

Forschungsfrage Wie muss ein Reifegradmodell aufgebaut und inhaltlich ausgestaltet sein, um die Faktoren bewerten zu können, welche die Datenqualität für die unterschiedlichen Komplexitäten des Data-Minings beeinflussen? SF 1: Mit welchen Reifegradkategorien und –stufen lassen sich diese Faktoren und Komplexitätsgrade beschreiben? SF 2: Lassen sich bestehende Datenqualitätsbetrachtungen in die Bewertungslogik integrieren bzw. was muss dafür verändert werden? SF 3: Sind Zusammenhänge zwischen der Reife des Datenmanagements und der Datenqualität feststellbar? SF 4: Wie kann eine Schwachstellenanalyse in die Logik der Analysekomplexität des Data- Minings integriert werden? SF 5: Wie müssen Reifegrade für die Schwachstellenanalyse beschrieben und wie kann der Reifegrad für diese erhoben werden? SF 6: Welche datenanalytischen Methoden können die Schwachstellenanalyse bei steigender Systemkomplexität unterstützen?

Methodische Vorgehensweise Umfeld Design Science Research Wissensbasis Anwendungsdomäne Erstellen von Designartefakten und -prozessen Fundierung Menschen Organisationale Systeme Technische Systeme Probleme und Möglichkeiten Wissenschaftliche Theorien und Methoden Erfahrungen und Expertise Meta-Artefakte (Design-Produkte und Design-Prozesse) Rigor Zyklus Grundlagen Ergänzungen zur Wissensbasis Relevanz Zyklus Anforderungen Feldtests Design Zyklus Würdigung in der Arbeit Evaluation Würdigung in der Arbeit Kapitel 2: Reifegradmodelle Kapitel 3: Datenmanagement Kapitel 4: Datenanalytik Kapitel 5: Schwachstellenanalyse Kapitel 1: Ausgangssituation Kapitel 7: Fallbeispiele Würdigung in der Arbeit Kapitel 6: Ausarbeitung des Reifegradmodells Kapitel 7: Fallbeispiele

Inhalt und Struktur des Reifegradmodells Hauptforschungsfrage SF 1 SF 2 Quelle: in Anlehnung an Wirth, R.; Hipp, J. (2000)

Reifegradstufen des Modells Zusammenhang zu den Analysekomplexitäten SF 1 hoch Optimierung Präskriptive Analysen Präskriptive Reife Integrierte Systeme, konsistente Daten Regelbasierte Modelle Simulation Was soll geschehen? Predictive Modelling Prädiktive Analysen Prognosen Prognostische Reife Teilweise Integration, lange Aufzeichnung Was wird geschehen? Strukturprüfende Verfahren Wettbewerbsvorteil Mehrwert steigt Diagnostische Analysen Zunehmender Reifegrad Strukturentdeckende Verfahren Diagnostische Reife Standards, digitale Erfassung Warum ist es geschehen? Deskriptive Statistik Visualisierungen Deskriptive Analysen Deskriptive Reife Keine Standards, kaum Digitalisierung Reports Was ist geschehen? niedrig niedrig Grad der Komplexität hoch Anforderungen an die Daten nehmen zu Quelle: in Anlehnung an Camm, J. D. et al. (2018)

Bewertung der Schwachstellenanalyse Reifegradzuordnung und Methoden SF 4 SF 6 Präskriptive Reife Prognostische Reife Anomalieerkennung Diagnostische Reife Assoziationsanalyse Deskriptive Reife ABC-Analyse, Kennzahlenvergleich Quelle: in Anlehnung an Biedermann (2017)

Erhebung des Reifegrades SF 5 Fragebogen mit 40 Fragen Analysen zu Vollständigkeit, Darstellung und Auslegbarkeit Fragen wurden den Reifegradkategorien zugeordnet Antworten wurden den Reifegradstufen zugeordnet Mindestanforderungen wurden definiert Restliche Zuordnung kann von fachkundigen Personen vorgenommen werden Bewertung der Datenbereitstellung

Zusammenfassung und Ausblick SF 3 Reifegradmodell zur Bewertung des datenanalytischen Prozesses Bewertung anhand des CRISP-DM Vorgehens Sechs Reifegradkategorien Vier Reifegradstufen Erarbeitung anhand von sechs Fallbeispielen Weiterer Forschungsbedarf Auswirkung der Datenmodellierung auf die Datenqualität Bestimmung der Kosten und des Nutzens der Reifegraderhöhung

Konzeptionierung am Beispiel der Schwachstellenanalyse Reifegradmodell zur Bewertung der Inputfaktoren von datenanalytischen Anwendungen Konzeptionierung am Beispiel der Schwachstellenanalyse Dipl.-Ing. Robert Bernerstätter Leoben, 28.05.2019

Backup

Literatur Derwisch, S. (2019): Data Monetization - Use Cases, Umsetzung, Merhwerte. Würzburg: BARC GmbH. 2019. Eppler, M.; Helfert, M. (2004): A classification and analysis of data quality costs. Proceedings of 9th MIT international conference in information quality, Bosten MA, 2004. Bosten MA. Lueth, K. L.; Patsioura, C.; Williams, Z. D.; Kermani, Z. Z. (2016): Industrial Analytics 2016/2017. The current state of data analytics usage in industrial companies. IoT Analytics GmbH. 2016. Stodder, D. (2016): Improving Data Preparation for Business Analytics; Applying Technologies and Methods for Establishing Trusted Data Assets for More Productive Users. Renton: tdwi. 2016. Biedermann, H. (2017): Lean Smart Maintenance - Controlling. Die Schwachstellenanalyse als zentrales Element im Führungssystem der Instandhaltung. In: Biedermann, H. (Hrsg.): Erfolg durch Lean Smart Maintenance: Bausteine und Wege des Wandels. Köln: TÜV Media GmbH. ISBN 978-3-7406-0243-7 (Praxiswissen für Ingenieure - Instandhaltung)., S. 23–36. Otto, B. (2015): Quality and Value of the Data Resource in Large Enterprises. In: Information Systems Management, Jg. 32, Nr. 3, S. 234–251. Wirth, R.; Hipp, J. (2000): CRISP-DM: Towards a standard process model for data mining. Proceedings of Fourth International Conference on the Practical Application of Knowledge Discovery and Data Mining, Manchester, 2000. Manchester: Blackpool. Camm, J. D.; Cochrane, J. J.; Fry, M. J.; Ohlmann, J. W.; Anderson, D. R.; Sweeney, D. J.; Williams, T. A. (2018): Business analytics; Descriptive, Predicitve, Prescriptive. 3rd edition, Boston: Cengage Learning. ISBN 978-1-337-40642-0. Rohweder, J. P.; Kasten, G.; Malzahn, D.; Piro, A.; Schmid, J. (2015): Informationsqualität – Definitionen, Dimensionen und Begriffe. In: Hildebrand, K.; Gebauer, M.; Hinrichs, H.; Mielke, M. (Hrsg.): Daten- und Informationsqualität. Wiesbaden: Springer Fachmedien Wiesbaden. ISBN 978-3-658-09213-9, S. 25–46.

Klassische Datenqualitätsbetrachtung DQ Kategorien Inhärente DQ Zweckabhängige DQ Darstellungs-bezogene DQ Systemgestützte DQ Kurz-beschreibung Sind die Daten unabhängig ihrer Anwendung vertrauenswürdig? Sind die Daten vollständig und sinnvoll nutzbar? Sind die Daten übersichtlich und verständlich? Sind die Daten leicht zugänglich und bearbeitbar? DQ-Dimensionen Glaubwürdigkeit Wertschöpfung Eindeutige Auslegbarkeit Zugänglichkeit Fehlerfreiheit Relevanz Verständlichkeit Bearbeitbarkeit Objektivität Aktualität Einheitliche Darstellung Hohes Ansehen Vollständigkeit Übersichtlichkeit Angemessener Umfang Quelle: in Anlehnung an Rohweder, J. P. et al. (2015)

Reifegradmodell Daten-erfassung Daten-bereitstellung Daten-formate Reifegradstufe Daten-erfassung Daten-bereitstellung Daten-formate Daten-darstellung Daten-umfang Daten-konsistenz Präskriptive- Reife Automatisch, regelmäßig Horizontale und vertikale Integration Definierte Schnittstellen Eindeutige Darstellung Vollständig erfasst Einheitliche IDs Prognostische- Reife Automatische Erfassung Horizontal integrierte Systeme Gesicherte Kompatibilität Metrische Skalierung Großer Aufzeichnungs-horizont Konsistenz quellen-übergreifend Diagnostische- Reife Digital und manuell Offen jedoch unvernetzt Zugänglich, tlw. inkompatibel Nominale Codes Höher dimensionale Daten Zeitstempel vorhanden Deskriptive- Reife Keine Standards Unzugängliche Systeme Proprietäre Formate Unstrukturiert und Fließtext Excelfähig Keine Zeitstempel Zunehmende Reife  komplexere Analysen

CRISP-DM

House of Data Quality Bestimmung der Zusammenhänge

House of Data Quality für Schwachstellenanalyse

Reifegradbewertungen 𝑒𝑖𝑛ℎ𝑒𝑖𝑡𝑙. 𝐷𝑎𝑟𝑠𝑡𝑒𝑙. = 𝑖=1 𝑛 𝑟𝑎𝑡𝑒 𝑒𝑑 (𝑖) 𝑛 6‑2 𝑟𝑎𝑡𝑒 𝑒𝑑 = 1 𝑗𝑎 0 𝑛𝑒𝑖𝑛 6‑3 𝑒𝑖𝑛𝑑. 𝐴𝑢𝑠𝑙𝑒𝑔𝑏. = 𝑖=1 𝑛 𝑟𝑎𝑡𝑒 𝑒𝑎 (𝑖) 𝑛 6‑4 𝑟𝑎𝑡𝑒 𝑒𝑎 = 1 𝑗𝑎 0 𝑛𝑒𝑖𝑛 6‑5 𝑉= 𝑖=1 𝑛 1− 𝑓𝑒ℎ𝑙𝑒𝑛𝑑𝑒 𝐸𝑖𝑛𝑡𝑟ä𝑔𝑒 𝑖 𝐸𝑖𝑛𝑡𝑟ä𝑔𝑒 𝑖 𝑛 6‑6 𝑉𝑜𝑙𝑙𝑠𝑡= 4 𝑉≥0,99 3 0,99>𝑉≥0,95 2 0,95>𝑉≥0,90 6‑7

Assoziationsanalyse und datengestütztes Ishikawa Diagramm 𝒔𝒖𝒑𝒑𝒐𝒓𝒕 𝑨→𝑩 = 𝒕∈𝑫|(𝑨∪𝑩)⊆𝒕 𝑫 𝒄𝒐𝒏𝒇𝒊𝒅𝒆𝒏𝒄𝒆 𝑨→𝑩 = 𝒕∈𝑫|(𝑨∪𝑩)⊆𝒕 𝒕∈𝑫|𝑨⊆𝒕 = 𝒔𝒖𝒑𝒑𝒐𝒓𝒕 𝑨→𝑩 𝒔𝒖𝒑𝒑𝒐𝒓𝒕 𝑨 𝒍𝒊𝒇𝒕 𝑨→𝑩 = 𝒄𝒐𝒏𝒇𝒊𝒅𝒆𝒏𝒄𝒆(𝑨→𝑩) 𝒔𝒖𝒑𝒑𝒐𝒓𝒕 (𝑩)

Beispielhafte Bewertung eines Use Cases

Kosten und Wert von Daten(qualität)

Kosten und Wert von Daten(qualität) Neueingabe-kosten Quelle: aus dem Englischen übersetzt: Eppler, M.; Helfert, M. (2004) Quelle: aus dem Englischen übersetzt: Otto, B. (2015)

Reifegradmodell Ein Modell, das die wesentlichen Elemente effektiver Prozesse für einen oder mehrere Interessenbereiche enthält und einen evolutionären Verbesserungspfad von ad hoc, unreifen Prozessen zu disziplinierten, reifen Prozessen mit verbesserter Qualität und Effektivität beschreibt. Alle Punkte, die einen Reifegrad ausmachen, müssen erfüllt sein, damit dieser als erreicht gilt. In der Arbeit wird der datenanalytische Prozess anhand von greifbaren Bereichen – den Kategorien – bewertet. Es existiert ein Konnex zwischen den Bewertungskategorien und der Bewertungsskala welcher eine kontinuierliche Verbesserung des Prozesses beiträgt und die Qualität des Outputs verbessert. Beschreibungsmodell: Beschreibung von Elementen und deren Beziehungen untereinander. Referenzmodell: Ein Modell, das als Maßstab für die Messung eines Attributs verwendet wird.

Schwachstellenanalyse Eine Schwachstelle ist eine an einer physischen oder nicht physischen(abstrakten) Messstelle feststellbare Wirkung die zu einer negativen Abweichung vom Sollzustand führt, welche durch zeitlich vorgelagerte Einflüsse (Ursachen) ausgelöst wurde. Die Ursachen sind dabei nicht zwingend örtlich – physisch wie organisatorisch – an die Messstelle gebunden.

Methoden zur Schwachstellenanalyse Deskriptive Schwachstellenanalyse Datenmenge begrenzt aufgrund mangelnder Vernetzung und Automatisierung der Datenerfassung. Auswertungen dienen zur Identifikation möglicher Schwachstellen durch Visualisierung, Kennzahlenvergleiche und ABC-Analyse (Paretodiagramm) Diagnostische Schwachstellenanalyse Erhöhte Datenmange in der Attributanzahl und Aufzeichnungsdauer. Möglichkeit von Ursache-Wirkungsanalysen ergeben sich durch die Anwendung von Big- Data Analytics Methoden. Beispiel ist die datengestützte Schwachstellenanalyse mittels Assoziationsanalyse.

Aufbau der Arbeit und methodische Vorgehensweise Rigor-Zyklus Sechs Fallbeispiele zur Ausarbeitung des Reifegradmodells (RGM): Automobilhersteller Initiale Idee und grobe Abgrenzung der Reifegradkategorien Stahlerzeuger Verfeinerung der Reifegradkategorien Textilunternehmen Erste Bewertung mit dem RGM Automobilzulieferer Ableitung von Handlungsempfehlungen aufgrund der Bewertung Hausgerätehersteller Weitere Ableitung von Handlungsempfehlungen Holzverarbeiter Anwendung des Fragebogens und durchgängige Anwendung Design-Zyklus Relevanz-Zyklus

Diverse Umfragen Quelle: Stodder (2016)