Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Topic 2: Tabellenclustering Tutor: Martin Lorenz.

Ähnliche Präsentationen


Präsentation zum Thema: "Topic 2: Tabellenclustering Tutor: Martin Lorenz."—  Präsentation transkript:

1 Topic 2: Tabellenclustering Tutor: Martin Lorenz

2 Überblick Tabellenanalyse von Topic 1 zeigt als Ergebnis nur Paare von ähnlichen Tabellen Ähnlichkeit kann verschiedene Gründe haben – Spezialisierungen von existierenden Konzepten (Tabellen) Mitarbeiter Manager – Konzeptionelle Trennung Aufspaltung von Merkmalen einer Entität auf mehrere Tabellen mit gleichem Kern – Unwissenheit Entwicklungsabteilung wusste nichts von gleichem Konzept in anderem Modul – Technische Gründe Puffer- oder Transportabellen

3 Problemstellung Viele Rückschlüsse auf die Ursache und die Zusammenhänge von Redundanz lassen sich nur im Kontext eines Clusters von ähnlichen Tabellen nachvollziehen. Wie clustere ich Tabellen auf Basis der gewählten Ähnlichkeitsmaße?

4 Aufgaben Entwicklung von unterschiedlichen Clusteringverfahren auf Basis der Ergebnisse der Datenmodelanalyse Visualisierung der Beziehung zwischen Tabellen im Cluster


Herunterladen ppt "Topic 2: Tabellenclustering Tutor: Martin Lorenz."

Ähnliche Präsentationen


Google-Anzeigen