(Thomas Nirschl, Stadt Nürnberg)

Slides:



Advertisements
Ähnliche Präsentationen
Statistische Suche nach melodischen Prototypen
Advertisements

Präsentation: Diaschau mit Musik Ruedi Knupp.
Projektumfeld Gesellschaftliche Strömungen Strukturen/ Gliederung
Sortierverfahren Richard Göbel.
Sortierverfahren Richard Göbel.
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Der Umgang mit qualitativ erhobenen Daten: Strategien der Datenanalyse
Mehrfachregressionen
Demoprogramm: Clustering Eine graphische Demonstration verschiedener Clusteringalgorithmen anhand des Clusterings von Punkten im zweidimensionalen Raum.
Numerische Klassifikation TWINSPAN
Was Wie Wann Zentrale Fragestellungen: ist eine Clusteranalyse?
Herzlich willkommen beim 1. Workshop der AG Methodik
Stadt Frankfurt am Main – Der Magistrat / Bürgeramt, Statistik und Wahlen Ralf Gutfleisch Design und Umsetzungskonzept koordinierter kommunaler Umfragen.
Präsentation der Ergebnisse von Clusteranalysen
Kurs Schreiben 1/12 Dr. Barbara Hoffmann LiteraturKompetenz Formatiertes wissenschaftliches Schreiben Der Kurs ist zur allgemeinen Information.
Excel Kurs Teil VI Logische Funktionen( WENN, UND, ODER ) Datumsfunktionen ( DATUM, MONAT ) Bedingte Formatierung F. Bäumer.
Kompetenz 2.0: E-Portfolios im Einsatz
Univariate Statistik M. Kresken.
Einstiegsunterricht - Informatik -. Möglichkeiten des Einstiegsunterricht Benutzung und Analyse eines dokumentierten Systems Einführung in die Programmierung.
Tutorium
Tutorium
Clusteranalyse von Maria Eickhold und Tobias Töpfer.
Diskrete Wahrscheinlichkeitsmodelle
Neuer Aufbau, neue Elemente Schubladen In unseren neuen Schubladenelementen hat viel Information auf wenig Raum Platz. Sie öffnen eine Schublade durch.
Histogramm/empirische Verteilung Verteilungen
Neue variable Lernkontrollen mit Diagnose und Förderplanung
Self Organizing Tree Algorithm
Webkatalog am Beispiel von
Statistisches Amt des Kantons Basel-Stadt Schweizerische Statistiktage 2010 / Neuenburg Wer erhält wie viel Geld? Budgetinzidenz Basel-Stadt Andrea Pfeifer.
Delphi II - OOP IFB Fortbildung
Chi Quadrat Test Tamara Katschnig.
Übungsblatt 02 Lehrstuhl für Kommunal- und Umweltökonomie
Seminar: Datenerhebung
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) 3. Ausgaben ( ) Wiederholung Tabellen,
Seminar: Datenerhebung
Einführung in SPSS/PASW. Inhaltsübersicht 1. Intro ( ) 2. Deskriptive Statistik ( ) (In Buch 1 Seite 85ff.) Kennwerte (Erwartungswert,
Copyright, 2002 © Josef Fürst Neue Funktionen im Digitalen Hydrologischen Atlas Österreichs (digHAO) J. Fürst T. Hörhan Institut.
STATISIK LV Nr.: 0028 SS Mai 2005.
Konfidenzintervall und Testen für den Mittelwert und Anteile
Kapitel 19 Kointegration
Willkommen in der Welt der effizienten Datenanalyse! Seite 1 Dr. Franz Weissenböck.
Ganzheitliches Projekt-, Ressourcen- und Qualitätsmanagement 1 Planabweichungsanalyse mit PQM Auf den folgenden Seiten wird Ihnen demonstriert, wie man.
Statistisches Amt Kanton Basel-Stadt
Autor: Peter Pfeiffer Seite: Peter Pfeiffer Memeler Str Bad Oeynhausen Datentransfer Zwischen dem Eingabemodul und den mitgelieferten.
Mathematik 1. Studienjahr Modul M1: Elemente der Mathematik
„Postmaterielle Werte“
Kalibrierung eines Mikrofons unter DASYLab
ICT – Modul Textverarbeitung
Statistische Methoden in der Wirtschafts- und Sozialgeographie
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Klassifikation und Regression mittels neuronaler Netze
Software Engineering Grundlagen
Thema Name des Vortragenden Ort, Datum
Die Vereinsverwaltung unter Windows 2000 Anhand der folgenden Präsentation werden Sie mit der Verwaltung des Vereins unter Windows 2000 vertraut gemacht.
Mehrfachausführungen Schleifen in VB 2010 ee. Programmidee: Der Anwender gibt eine Zahl ein, und das Programm gibt die Mehrfachen dieser Zahl aus (das.
Die Clusteranalyse Zielsetzung Datenreduktion: Zusammenfassung einer Vielzahl von Objekten oder Variablen zu Gruppen mit möglichst ähnlichem Informationsgehalt.
Möglichkeiten der Visualisierung
Empirische Sozialforschung am Beispiel der Limburger Nordstadt
Tutorium zur Datenanalyse mit SPSS
Faktorenanalyse Tamara Katschnig.
Clusteranalyse Tamara Katschnig.
Funktionen Buffer Kathrina Schmidt Die Funktion Buffer (die „Pufferzone“ um räumliche Objekte) von Kathrina Schmidt.
1 Prozesse im Studierendenmanagement Kontext: Studierenden anlegen Sonstige Aktivitäten: Suchfunktion, s verschicken, diverse Auswertungen.
1 Prozesse im Studierendenmanagement Kontext: Studierenden anlegen Sonstige Aktivitäten: Suchfunktion, s verschicken, diverse Auswertungen.
Excel-Tool: Beschwerdeanalyse  Folie 1 von Bitte Makros aktivieren Das Excel-Tool funktioniert nur mit eingeschalteten Makros. Eventuell erhalten.
- Seite 1 TIME INTELLIGENCE ® by Zeichenrand – Löschen! Titel.
Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.
- Seite 1 TIME INTELLIGENCE ® by Titel.
Clusteranalyse Wege und Arten Entstanden im Rahmen der Seminararbeit für WS09/10 Betreuer: Prof. Jobst Hoffmann Dr. Tim Hiddemann Aachen, Januar 2010.
Aufgabenstellung  gegeben ist die zeitliche Entwicklung der global gemittelten bodennahen Temperatur im Zeitraum (Dateiname= ytemp2m.obs, ascii-
 Präsentation transkript:

(Thomas Nirschl, Stadt Nürnberg) Clusteranalyse – Softwareeinsatz anhand eines konkreten Beispiels mit SPSS (Thomas Nirschl, Stadt Nürnberg) Gliederung: 1. Vorüberlegungen und vorbereitende Schritte 2. Clusteranalyse mit SPSS Beispiel: Kleinräumige Sozialraumanalyse der Stadt Nürnberg 3. Ergebnis und Bewertung

Vorüberlegungen und vorbereitende Schritte Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Vorüberlegungen und vorbereitende Schritte Hintergrund: pragmatisch: letzte Sozialraumanalyse aus dem Jahr 2004 Zunahme der sozialräumlichen Differenzierungsprozesse  Nachfrage nach „verdichteten“ Informationen ist groß Ergebnisse einer neuen Sozialraumanalyse (inkl. Gebiets-typisierungen) sollen in das stadtinterne Monitoring einfließen Kommunalwahl 2008  Analyse des Wahlverhaltens in den sozialen Stimmbezirkstypen (Vorwahl-, Nacht- und Ergebnisheft) Ausgangspunkt für weitere Analysen  z.B. Wanderungen aus bzw. nach Sozialräumen

Vorüberlegungen und vorbereitende Schritte Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Vorüberlegungen und vorbereitende Schritte Anforderungen: Aufgabe: Kompromiss zwischen möglichst vielfältigen bzw. umfassen-den Daten einerseits und maximaler Kleinräumigkeit anderer-seits muss gefunden werden Begriffsdefinition „Sozialraum“: „vom Menschen strukturierter und geprägter, physisch klar abgrenzbarer Raum“ Ansatz: explorative quantitative Raumanalyse  Existenz eines vorher festgelegten Untersuchungsraums

Analyse der Verteilung der Merkmalsausprägungen ausgewählter Daten Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Vorüberlegungen und vorbereitende Schritte Ziel: Analyse der Verteilung der Merkmalsausprägungen ausgewählter Daten Strukturierung und Klassifizierung städtischer Teilgebiete Bereitstellung einer umfassenden, kleinräumigen und möglichst realitätsgetreuen Informationsbasis über die Lebensräume, sozialen Milieus, Wohnformen und ökonomischen Belastungen in den verschiedenen Stadtvierteln

Vorüberlegungen und vorbereitende Schritte Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Vorüberlegungen und vorbereitende Schritte Methodischer Ansatz: Hierarchisch-agglomerative Clusteranalyse Idee: Gruppenbildung anhand ausgewählter Variablen  logisch-konzeptionelle Vorüberlegungen, Korrelationsanalysen

Die EDV nimmt dem Anwender (noch) nicht die ganze Arbeit ab ! Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Vorüberlegungen und vorbereitende Schritte Methodischer Ansatz: Wichtig: Die EDV nimmt dem Anwender (noch) nicht die ganze Arbeit ab ! Einige zentrale Fragen müssen vorab geklärt werden: z.B.: „Was will ich wie und mit welchen Daten analysieren?“

Vorüberlegungen und vorbereitende Schritte Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Vorüberlegungen und vorbereitende Schritte Software: SPSS 15 (seit 2008: v.16): eigentliche Clusteranalyse Projektdatei Syntax inkl. Kommentierung Excel 2000: Darstellung der Ergebnisse Interpretationshilfe(n) ArcView 3.3: kartographische Darstellung der Ergebnisse räumliche Überprüfung (Expertenwissen)

Clusteranalyse mit SPSS Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Clusteranalyse mit SPSS Erzeugen der Grunddaten (.xls, .csv, .dbf ...) 1. Einlesen der Grunddaten je nach Format über „Datei öffnen“ (.xls, .dbf o.ä.), „Textdaten lesen“ (.csv, .txt o.ä.) 2.

Clusteranalyse mit SPSS Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Clusteranalyse mit SPSS 3. Hinweis: Kommandos über den Befehl „Einfügen“ zunächst in ein sog. Syntaxfenster kopieren und als .sps-Datei abspeichern. Dies hat den Vorteil, dass die vollzogenen Schritte dokumentiert und v.a. auch kommentiert werden. Zusätzlich kann dadurch – bei gewissen Vorkenntnissen – auch in die Befehlsstruktur von SPSS eingegriffen werden.

Clusteranalyse mit SPSS Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Clusteranalyse mit SPSS 4. Nach den Berechnungen und dem Labeln von Variablen ist ein Blick auf die Korrelationen zwischen den Variablen oft hilfreich. 5. Mit „Analysieren-Korrelation-Distanzen...“ gelangt man zu folgendem Dialogfenster, über welches die entsprechenden Einstellungen zur Ausgabe einer Korre-lationsmatrix getätigt werden können.

Clusteranalyse mit SPSS Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Clusteranalyse mit SPSS 6. In einem weiteren Fenster – dem sog.Output – erscheint das Ergebnis. Hinweis: Das Arbeiten im Output ist nicht immer komfortabel. Eine Aus-gabe z.B. nach Excel ist zu empfehlen. Dort können dann ohne größeren Aufwand For-matierungen o.ä. erfolgen.

Clusteranalyse mit SPSS Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Clusteranalyse mit SPSS 7. Distrikte mit weniger als 50 Einwohnern werden von der Clusteranalyse ausgeschlos-sen. Zudem werden vier wie-tere Distrikte als extreme Aus-reisser identifiziert und eben-falls bei der Analyse nicht be-rücksichtigt. Es gehen somit 270 Distrikte in die Clusteranalyse ein.

Clusteranalyse mit SPSS Variablenübersicht: Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Clusteranalyse mit SPSS Variablenübersicht: Soziodemographische Merkmale Sozioökonomische Merkmale Physiognomische Merkmale Migrantenanteil Anteil Haushalte deutsch an allen HH Anteil Haushalte ausländisch an allen HH Anteil Kinder von Migranten Mobilität insg. je 1.000 Anteil Senioren ohne Senioren in Heimen Jugendquote Anteil HH mit Kind(ern) an allen HH Anteil 1Personenhaushalte an allen HH Anteil 5u.m.-Personenhaushalte an allen HH Arbeitslosenanteil Anteil Arbeitsloser Ausländer Anteil Bedarfsgemein- schaften an allen HH Anteil Bed.gem. mit Kind(ern) an allen HH m.K. Anteil SGBII-Empfänger an den Erwerbsfähigen Personen in Bedarfs- gemeinschaften an allen Einwohnern Anteil Ein- und Zweifamilienhäuser an allen Wohngebäuden Bebauungsdichte

Clusteranalyse mit SPSS Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Clusteranalyse mit SPSS 8. z-Transformation aller Variablen: Basieren Variablen auf unterschiedlichen Maßeinheiten kann es bei der Cluster-analyse zu einer Vergrößerung der Distanzen zwischen den Merkmals-ausprägungen kommen. 9. Lösung: Standardisierung der Variablen Von jedem Wert wird der MW der betreffenden Variablen abgezogen und die Differenz anschließend durch б dividiert. Die standardisierten Variablen erhalten somit einen Mittelwert von „0“ und eine Standardabweichung von „1“*. * Werte mit einem pos.Vorzeichen sind als – im Vergleich zu allen anderen Werten – überdurch-schnittlich ausgeprägt zu interpretieren, während Werte mit neg. Vorzeichen als unterdurchschnittlich ausgeprägt zu verstehen sind.

Clusteranalyse mit SPSS Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Clusteranalyse mit SPSS 10. Die Korrelationsmatrix der z-transformierten Variablen wird dann aus dem Output nach Excel kopiert. Mittels bedingter Formatierungen können dann positive und negative Korre-lation sichtbar gemacht wer-den.

Clusteranalyse mit SPSS Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Clusteranalyse mit SPSS 11. „Analysieren-Klassifizieren-Hierarchische Cluster ...“ führt schließlich zum Verfahren der Clusteranalyse. In diesem Beispiel wird ein hierarchisch-agglomeratives Verfahren zur Analyse herangezogen. 12. z-transformierte Variablen Raumbezug, hier: nach Distrikten

Clusteranalyse mit SPSS Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Clusteranalyse mit SPSS 13. Die „Cluster-Methode“ bezeichnet den Algorithmus, der die Entfernung von Clustern zueinander bestimmt  Zusammenfassung von Objekten auf Basis der Distanzen Die Wahl eines geeigneten Ähnlich-keits- bzw. Distanzmaßes erfolgt im Dialog „Maß“ (hier: quadrierter euklidischer Abstand). Sollten die Variablen noch nicht z-transformiert sein, dann könnte man die Werte hier standardisieren. Unter „Neue Variable speichern“ erfolgen die Einstellungen für die Zahl der Cluster (hier: 6) 14. hier: quadrierter euklidischer Abstand zur Berechnung von Unähnlichkeiten verwendet (je größer der Betrag der Distanz, umso ähnlicher sind sich zwei Objekte).

Clusteranalyse mit SPSS Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Clusteranalyse mit SPSS 15. Die Distanzmatrix zeigt die Distanzen vor dem Zusammenführen von Fällen zu Clustern („Ausgangsdistanzmatrix“) 16.

Clusteranalyse mit SPSS Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Clusteranalyse mit SPSS 17. Nachdem die Cluster-Zugehörigkeit in eine Variable geschrieben wurde, kann nun damit begonnen werden, die Cluster zu beschreiben. 18. „Analysieren-Mittelwertevergleichen–Mittelwerte...“ liefert neben MW auch Min, Max, σ etc. für die ermittelten Cluster und dient somit der Interpretation der Ergebnisse. Alternativ kann auch eine separate und nach Clustern aggregierte Datei ausgegeben werden.

Ergebnis und Bewertung Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Ergebnis und Bewertung

Ergebnis und Bewertung Clusteranalyse – Softwareinsatz anhand eines konkreten Beispiels mit SPSS Ergebnis und Bewertung Clusteranalyse mit SPSS Vorteile Nachteile umfassendes (Standard-) Software-Paket mit vielen Funktionen Importfunktion von Daten; Export der Ergebnisse (graphisch) Dokumentation, Kommentierung und Änderungen sind über die Syntax sehr gut möglich umfangreiche Sekundärliteratur für KOSIS-Mitglieder vergünstigt Anschaffungspreis (z.B. 5 Netz- lizenzen ca. € 3.000) z.T. mit Funktionen und Optionen „überladen“ Bedienung i.d.R. nicht intuitiv (Einar- beitung bzw. Schulung nötig) mit neuen Versionen verschwinden alte gewohnte Funktionen oder werden umbenannt

„Cluster“-Modul in neuer SIKURS-Version Clusteranalyse und SIKURS – ein erster Einblick „Cluster“-Modul in neuer SIKURS-Version Ziel: demographisches Verhalten bei Prognosen differenzierter abbilden Relevante Raten und Quoten werden nicht mehr auf die Gesamtstadt bezogen  Typenbildung (Alter, Geschlecht, Bevölkerungs- gruppen)  anschließende Clusteranalyse in SIKURS berücksichtigt die strukturellen Unter- schiede in einer Stadt stärker. Mehr Informationen unter http://www.sikurs.de/