Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Dr. Ralf Gutfleisch, Stadt Frankfurt a.M.. Fragestellung Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Zentrale Fragestellungen: Was Wann Wie ist eine Clusteranalyse?

Ähnliche Präsentationen


Präsentation zum Thema: "Dr. Ralf Gutfleisch, Stadt Frankfurt a.M.. Fragestellung Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Zentrale Fragestellungen: Was Wann Wie ist eine Clusteranalyse?"—  Präsentation transkript:

1 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M.

2 Fragestellung Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Zentrale Fragestellungen: Was Wann Wie ist eine Clusteranalyse? wird eine Clusteranalyse angewendet? Definition Voraussetzung Interpretation Methodik

3 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. eine Vielzahl von Objekten werden zu Gruppen zusammengefasst Clusteranalyse = Gruppenbildungsverfahren = Fragestellung Definition Voraussetzung Interpretation Methodik zur Etymologie: engl. Cluster = Haufen, Menge, Ballung altdt. Kluster = was dicht und dick zusammensitzt (Grimmsches Wörterbuch)

4 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Ojekte innerhalb einer Gruppe sollen homogen sein Objekte zwischen den Gruppen sollen heterogen sein Fragestellung Definition Voraussetzung Interpretation Methodik Objekte:Beschreibung durch verschiedene Merkmale unterschdl. Ausprägung Cluster:Bildung durch Objekte mit ähnlichen Ausprägungen was dicht und dick zusammensitzt- Sumo-Ringer

5 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. - Marketing: Zusammenhang zw. Selbstbild und Wahl einer Automarke Fragestellung Definition Voraussetzung Interpretation Methodik - Archäologie: Kultureller Fingerabdrücke in der Kategorie Schmuck in hallstattzeitlichen Siedlungen im Mittelrheingebiet - Botanik: Ein pflanzensoziologisches Modell der Schattentoleranz von Baumarten in den Bayerischen Alpen - Städtestatistiker: Sozialraumanalyse, Analyse zu Luftverschmutzung u. Lärmbelastung, Bürgerumfragen, Wirtschaftsräumen, Wahlanalysen etc.

6 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Sozialraumanalyse: Fragestellung Definition Voraussetzung Interpretation Methodik - Cluster = ähnliche Bezirke - Merkmale sozio-ökonomische Variablen*: - unter 6-Jährige - über 65-Jährige - Zu- u. Wegzüge - Ausländer/-innen - Einpersonenhaushalte - Arbeitslosendichte - Sozialhilfeempfänger/innen - Mehrfamilienhäuser - Wahlbeteiligung * jeweils Anteile => Variablenauswahl extrem wichtig

7 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Datenvoraussetzungen - Empfehlungen: kein spezielles Skalenniveau Standardisierte Merkmale (z-Transformation) Ausreißer ausschließen (Verzerrungen) Anzahl der Merkmale Keine Begrenzung, aber: nur relevante Variablen einbeziehen - Vorüberlegungen möglichst hoch korrelierenden Variablen ausschließen keine Variablen mit konstanten Ausprägungen bei allen Objekten Anzahl der Objekte Keine Begrenzung Fragestellung Definition Voraussetzung Interpretation Methodik

8 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Drei Ablaufschritte: 1.Bestimmung der Distanz (Abstand-Differenz) durch Proximitätsmaße 2. Auswahl des Fusionierungsalgorithmuses 3. Bestimmung der Clusteranzahl Fragestellung Definition Voraussetzung Interpretation Methodik

9 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Standard bei Distanzmaßen bei metrischen Skalen: L2-Norm = Quadrierte Euklidische Distanz Berechnung: absoluten Differenzwerte werden quadriert und addiert Proximitätsmaß Fragestellung Definition Voraussetzung Interpretation Methodik Proximitätsmaße: Maßzahl zur Quantifizierung des Abstandes der Objekte durch Merkmalswerte Vielzahl von Maßberechnungen - abhängig vom Skalenniveau

10 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Fusionierung Ausgangsdatenmatrix Distanzmaß Distanzmatrix (Quadrierte Euklidische Distanz) mit Hilfe von Cluster-Algorithmen: Fusionierung Fragestellung Definition Voraussetzung Interpretation Methodik

11 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Partitionierendes Verfahren: 1.Vorgabe einer Anfangspartition 2.jedes Objekt kann im Prozess jederzeit verschoben werden 3.Festlegung der Clusteranzahl im vorhinein Hierarchisch- agglomerativ Verfahren: 1.Keine Vorgabe – Start mit feinster Partition (jedes Objekt ist ein Cluster) 2.Objekte mit der geringsten Distanz werden verbunden, später Gruppen 3.Durchlaufen zu einem Großcluster Fusionierung Fragestellung Definition Voraussetzung Interpretation Methodik

12 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Häufigste Anwendung: Ward Verfahren: Bildung von homogeneren Clustern – Vereinigt diejenigen Objekte, die die Fehlerquadratsumme (Varianz/Streuung) am wenigsten erhöhen Fusionierung Fragestellung Definition Voraussetzung Interpretation Methodik

13 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Möglichkeiten zur Bestimmung der Clusteranzahl: 1. Fehlerquadratsumme Clusteranzahl Fragestellung Definition Voraussetzung Interpretation Methodik Zur Erinnerung! : aggl. Verf. nach Ward geht von der kleinsten Partition aus und endet bei einem Großcluster! 3. Dendrogramm 2. Elbow-Kriterium

14 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. 1. Fehlerquadratsumme Clusteranzahl Fragestellung Definition Voraussetzung Interpretation Methodik = gibt die Varianzveränderung an, bei großen Sprüngen werden heterogene Cluster zusammengeführt

15 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. 2. Elbow-Kriterium Clusteranzahl Fragestellung Definition Voraussetzung Interpretation Methodik = Abtragung der Fehlerquadratsumme in ein Diagramm

16 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. 3. Dendrogramm Clusteranzahl Fragestellung Definition Voraussetzung Interpretation Methodik = Abtragung der Fusionsierungsschritte Festlegung Clusteranzahl => Clustermatrix

17 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Drei Ablaufschritte: 1.Bestimmung der Distanz durch Proximitätsmaße: Quadrierte Euklidische Distanz 2.Auswahl des Fusionierung salgorithmuses: hierarchisch, agglomerativ nach Ward 3.Bestimmung der Clusteranzahl : Fehlerquadratsumme, Elbow und Dendrogramm Fragestellung Definition Voraussetzung Interpretation Methodik

18 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Fragestellung Definition Voraussetzung Interpretation Methodik Hilfestellung für die Interpretation: absoluten Merkmalsausprägungen Karte Für Spezialisten: F- Werte (Varianz/Streuung ) t-Wert (Standardabweichung )

19 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. F-Werte (Varianz): Homogenität einer Gruppe; t-Werte (Standardabweichung): Überbewertung/Unterbewertung einer Variablen) Fragestellung Definition Voraussetzung Interpretation Methodik Cluster 10,350,40 0,130,190,320,150,270,76 20,420,35 0,340,180,280,430,100,58 31,380,60 0,341,880,071,120,280,66 40,380,15 0,060,090,070,110,080,21 50,410,34 0,300,490,350,330,210,40 60,500,39 0,710,420,500,310,190,89 70,230,18 0,120,480,230,090,060,28 Anteil der ausl. Bev. an der Bevölkerung Anteil der Bev. v. 65 Jahren und älter a.d. Bevölkerung Anteil d. Zu- u. Wegzüge an der Bevölkerung Anteil d. Mehr- familienhäuser an den Wohn- gebäuden Anteil der Bev. im Alter v. u. 6 Jahren a.d. Bevölkerung Arbeits- losendichte Anteil d. Sozial- hilfeempfänger/ -innen an der Bevölkerung Wahlbe- teiligung b.d. Bundes- tagswahl Anteil d. Einpersonen- haushalte a.d. Privathaush.

20 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Problembehandlung Alternative Methoden Vorüberlegungen sind wichtig: Probleme bei der Auswahl der Variablen Korrelationen Ausreißer Festlegung von Grenzwerten – aber welche Grenzwerte sind gültig? Bestimmung der Clusteranzahl – ein Glücksspiel? Zuweisung bei hierarchisch-agglomerativen Verfahren (nicht revidierbar, dafür Tendenz, gleich große Gruppen zu bilden, Ausreißer erkennbarer) Fazit

21 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Vorüberlegungen sind wichtig: Konkretisierung der Problemstellung der Untersuchung Verfahren: Faktorenanalyse (Reduzierung der Merkmale) Klassische Raumanalyse (feste Grenzwerte) Problembehandlung Alternative Methoden Fazit Zur Überprüfung der Klassenzugehörigkeit: Diskriminanzanalyse

22 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Konkruente Zuordnung – Klasssiche Raumanalyse: 43 Bezirke von 110 Bezirken waren identisch (39,1 %) Bezirke mit eindeutiger inhaltlicher Aussage Ergebnisvergleich: Problembehandlung Alternative Methoden Fazit

23 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Ergebnis: Auswahl der Analyseverfahren muss sich an konkreten Fragestellungen orientieren methodische Annahmen, Voraussetzungen und Bedingungen müssen erläutert werden Clusteranalyse mit unterschiedlichen Programmen durchführbar => Clusteranalyse ein geeignetes Verfahren für Städtestatistiker Problembehandlung Alternative Methoden Fazit

24 Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Clusteranalyse überzeugt ! Sind Sie nun von der ?


Herunterladen ppt "Dr. Ralf Gutfleisch, Stadt Frankfurt a.M.. Fragestellung Dr. Ralf Gutfleisch, Stadt Frankfurt a.M. Zentrale Fragestellungen: Was Wann Wie ist eine Clusteranalyse?"

Ähnliche Präsentationen


Google-Anzeigen