Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Wer mit wem? Netzwerkanalyse im Datenjournalismus Prof. Dr. Katharina Zweig.

Ähnliche Präsentationen


Präsentation zum Thema: "Wer mit wem? Netzwerkanalyse im Datenjournalismus Prof. Dr. Katharina Zweig."—  Präsentation transkript:

1 Wer mit wem? Netzwerkanalyse im Datenjournalismus Prof. Dr. Katharina Zweig

2 "Internet map 1024" by The Opte Project - Originally from the English Wikipedia; description page is/was here.. Licensed under CC BY 2.5 via Commons - https://commons.wikimedia.org/wiki/File:Internet_map_1024.jpg#/media/File:Internet_map_1024.jpg

3 Welche Daten sind ‚networky‘? Ein bisschen Gruppenarbeit

4 Der einfache Weg zum Graph Eine Excel-Tabelle mit einer Knotenliste (siehe Beispieldatei) … und einer Kantenliste Öffnen Sie die Excel-Datei mit yEd Wählen Sie auf dem Tab „Daten“ als Kantenrepräsentation „Kantenliste“ Markieren Sie den Kantenbereich“, zusammen mit der Eigenschaft der Kante (ga_edgelist!A34:C67), klicken Sie auf übernehmen. Markieren Sie die Quelle der Kante (ga_edgelist!A) und das Ziel (ga_edgelist!B). Das macht zwar bei sexuellen Beziehungen keinen „Sinn“, aber wir können diese Richtung nachher wieder entfernen.

5 Der einfache Weg zum Graph Wenn Sie den Knoten weitere Eigenschaften hinzufügen wollen, markieren Sie jetzt die Knotenliste samt Eigenschaft und klicken Sie auf Übernehmen (ga_edgelist!A1:B33) Unbedingt bei „Spalte der Knotenkennungen“ die richtige Spalte eintragen (ga_edgelist!A) Auf Fertigstellen klicken.

6 Eigenschaftenmapper Unter Bearbeiten auf Eigenschaften-Abbildungen gehen. Für jede Eigenschaft (Knoten oder Kante) eine „Konfiguration“ generieren. Erst links auf „Neue Knotenkonfiguration“ bzw. „Kantenkonfiguration“, dann nochmal rechts auf das obere, grüne Pluszeichen. In der Tabelle dann die Eigenschaft auswählen (z.B. Knotenname), Abbildung auf „Beschriften: Text“ wählen und Anwenden klicken. Für Geschlecht stattdessen Abbildung auf Füllfarbe und bei Umformung auf ‚einzelne Werte‘ gehen. Dann kann unten in der Tabelle für jeden Wert („Mann“, „Frau“) die Farbe einzeln angegeben werden. Kanteneigenschaft („Beziehungsart“) dann analog als Pfeildicke oder ähnlich.

7 Das Ergebnis

8 Investigative Analyse Ja, Arizona und Callie Torres sind langfristig miteinander verbandelt – Beweisfoto rechts.

9 Wer ist am zentralsten?

10 Wie könnte man Zentralität messen? Denken Sie sich mindestens zwei (quantitative!) Ideen aus, die für alle Knoten ausrechnen, wie zentral diese sind. Gruppenarbeit

11 Die beliebteste aller Zentralitäten

12 Was sagen die Handbücher? Betweenness centrality is an indicator of a node's centrality in a network. It is equal to the number of shortest paths from all vertices to all others that pass through that node. A node with high betweenness centrality has a large influence on the transfer of items through the network, under the assumption that item transfer follows the shortest paths. (Wikipedia, Betweeness Centrality)centralitynetwork yEd sagt gar nichts, berechnet Werte zwischen 0 und 1? The vertex and edge betweenness are (roughly) defined by the number of geodesics (shortest paths) going through a vertex or an edge. (igraph) Betweenness centrality of a node is the sum of the fraction of all- pairs shortest paths that pass through v (networkX)

13 Qual der Wahl Es gibt Hunderte von Zentralitäten – wann nimmt man welche?

14 Was heißt hier Zentralität? Wir sind hier fest am Modellieren! Die Kanten stellen sexuelle Beziehungen dar. Netzwerkanalyse versucht, die indirekten Auswirkungen zu quantifizieren, z.B. von Krankheitsverbreitung. Das Netzwerk selbst ist auch keine „Wahrheit“ sondern ein ausschnitthafte Repräsentation der Wirklichkeit, ein abstrahierendes Modell! Wie funktioniert Krankheitsverbreitung genau? Zufall? „Kürzeste Wege“? Je öfter, desto höher die Wahrscheinlichkeit? Wer ist zentral? Der/die mit den meisten Beziehungen?

15 Fazit Netzwerkanalyse modelliert Beziehungen zwischen Dingen, zwischen Personen oder zwischen Dingen und Personen. Es geht um die quantitative Analyse indirekter Effekte, verursacht durch Prozesse auf der Netzwerkstruktur, z.B. Informationsweitergabe, Krankheit, biologische Signale, etc. Wenn kein Prozess das Netzwerk nutzt, bitte nicht als Netzwerk darstellen. Netzwerke sind immer nur Ausschnitte und Modelle der Wirklichkeit mit den üblichen Problemen Fehlerhafte Daten Nicht alle Daten enthalten Aggregiert über zu lange Zeiträume …

16 Richtig angewendet…. …. kann sie weit mehr als nur Trivia hervorlocken….

17 Ein bisschen Angeberei Identifikation tumorhemmender Biomoleküle Analyse von Einkaufskorbdaten Bestimmung von hochsignifikant ähnlichen Dokumenten Aufreinigung von hochverrauschten (Bio-)Daten Analyse sozialer Netzwerke Vorhersage von Beziehungen zwischen zwei Nicht(!)-Mitgliedern einer sozialen Netzwerkplattform Analyse komplexen Problemlöseverhaltens Analyse ökologischer Nischen und Symbiosen … (alles eigene Projekte und echt wahr – ansonsten kann Netzwerkanalyse das Weltklima retten, Terroristen identifizieren, die bösen Kapitalisten von den guten trennen, Obamas Wiederwahl garantieren, und und und)

18 Kooperationen erwünscht! Anfragen an zweig@cs.uni-kl.de


Herunterladen ppt "Wer mit wem? Netzwerkanalyse im Datenjournalismus Prof. Dr. Katharina Zweig."

Ähnliche Präsentationen


Google-Anzeigen