Reinhard Messerschmidt, Brigitte Mathiak

Slides:



Advertisements
Ähnliche Präsentationen
Gestaltung eines Posters (Schrift: Punkt 70).
Advertisements

Dr. Helmuth Sagawe WS 2010/11 Universität Heidelberg
Aspekte der demographischen Entwicklung in der EU
Literaturrecherche Formatierung und Gliederung der Hausarbeit
Das Erstellen einer Hausarbeit
Fragetechnik statt Sagetechnik
Hauptseminar Soziophonetik Prof. Dr. Harrington Marina Meixner
Ringvorlesung Einführung in das Wissenschaftliche Arbeiten Literaturrecherche I – ZBS-OPAC und Sportdatenbanken Andreas Amendt.
Maschinelles Lernen und automatische Textklassifikation
6-Sep-2007reto ambühler1 Lifecycle-Management von Websites Gedanken zum Lebenszyklus von Websites, insbesondere zu dessen Abschluss.
Externe Bewertung in IB-Biologie
Datenstrukturen innerhalb von XML Web Services. Agenda.
Abschlussvortrag zur Studienarbeit
«Vorhang auf!» Einstieg in die Kapital-Lektüre mit PolyluxMarx
Analyse von Arbeitsaufträgen „Durch Geschichte zur Gegenwart 2“
Religiöse Vielfalt – Bedrohung oder Chance?
Quantitative Erosionsmessung im Urserental
FAU Erlangen-Nürnberg Department Geschichte Professur für Alte Geschichte Herzlich Willkommen zum ModulEinführung in die Arbeitsweise der Altertumswissenschaft.
Automatische Texterkennung
Neue Kulturen der Wissenschaft: Forschen Frauen anders
Sachlich-fachliche Auseinandersetzung (Sachanalyse)
Lernen durch Vergleiche
Herzlich Willkommen zum Modul „Das Exposé – Teil II“!
Logistik-Delphi Identifizierung der Experten im Logistikbereich Dipl.-Kff. Alessa Münchow Institut für Produktion und Industrielles Informationsmanagement.
Über die Zukunft des Buches im Zeitalter des Internets
TECHNIKEN WISSENSCHAFTLICHEN ARBEITENS
1 Partizipative Seminarplanung und -evaluation Was ist Qualität in der Lehre? Eine Lehrveranstaltung ist ein komplexes, interaktives und kommunikatives.
Zum Einfluss subjektiver und objektiver Merkmale auf die Wiedererkennung von Werbeplakaten Antje Bauer & Stefanie Frehse Institut für Allgemeine Psychologie.
Informationsrecherche & Analyse im Netz
Klassische Werke empirisch-theoretischer Soziologie
Format Zeilenabstand (doppelt) Fußnoten (oder Endnoten) mit Seitenzahl
Constraint Delaunay Triangulations
Studieneinstiegstest – Motivation, Hintergrund und Aufbau
Lymphtherapie im Sport
[BAP] Eval 1 [BAP] Kommunale Haushalts- analyse und -bewertung IFIP / TU Wien, Jänner 2005.
Visuelle Hilfsmittel Zusammengefasst von Karin Burgmann
Text Mining auf annotierten Texten
Programmiersprachen II Fortsetzung Datenstrukturen Balancierte Bäume 3 Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Die klassischen Methoden der historisch-vergleichenden Forschung Universität Zürich Soziologisches Institut Seminar: Methoden des internationalen Vergleichs.
Klausurformat: Interpretation eines Textauszuges
Hochschule für Technik, Wirtschaft und Kultur Leipzig Leipzig University of Applied Sciences Hier sollten dem Entwurf entsprechend.
Wie zitiere ich richtig???. Gliederung 1. Exakt Zitieren 2. Quellenangaben 2.1 Quellenangaben aus Büchern 2.2 Quellenangaben aus Aufsätzen 2.3 Quellenangaben.
Gereon Stock PR7277_ , S. 1 Wandel erkennen – Wandel bewältigen Wandel in Kleinbetrieben aus Sicht der EU 11. Oktober 2007, LVH Bozen Gereon Stock.
Identifying the effects of gendered language on economic behavior
Arten von Literatur für wissenschaftliche Arbeiten
Minimale Leittexte Hintergrund
Digital Divide Digitalisierung der Gesellschaft
Lifecycle-Management von Websites
Darstellung kontinuierlicher Phänomene
Universität zu Köln | Hauptseminar Annotationssysteme
Einführung in die Stadtsoziologie
Projektabschluss
in der Jahrgangsstufe Q 1
Ausgewählte Folien für Lehreinheit C3
Dr. Klaus-Rainer Brintzinger, Universität Tübingen
Seminar Von Big Data zu Data Science:
Friederike Kleinfercher Abteilung Forschung und Entwicklung
SEEL Teacher Training SEEL - Sound in European E-Learning ( DE02-KA ) Lehrer-Training – Modul 2: Die Wichtigkeit von Audios in Kursen.
Methode Risikomanagement
Enhancement Request Config Options for Driven Dimensions in AE-Features Konfiguration für gesteuerte Bemaßung in 3D-Zeichnung Pro/Engineer part / assembly.
Primärdaten Malte Dreyer Bonn,
Wie schreibe ich eine Facharbeit
Einführung in die Stadtsoziologie
Wissenschaftliches Ausarbeiten
Titel der Studien Name Vortragende/r.
Politische Theorie und politische Ordnung
Titel der Studien Name Vortragende/r.
Hinweise zur Prüfung (HAUSARBEIT)
Prof. Dr. Norbert Frieters-Reermann KatHO NRW - Aachen
 Präsentation transkript:

Reinhard Messerschmidt, Brigitte Mathiak Kontextbasierte Zitationsanalyse soziologischer Klassiker im Verlauf von 100 Jahren Reinhard Messerschmidt, Brigitte Mathiak DHd 2017, 13.-18.2., Universität Bern Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Hintergrund: eTraces-Projekt (1) BMBF Verbundprojekt von ASV Leipzig, Uni Göttingen und GESIS, Laufzeit 01.07.2011 - 30.06.2014 Thema: „Recherche und Analyse von Zitationsspuren und Wissenstransfer in sozialwissenschaftlichen Texten und deutschsprachiger Literatur“ Ziel: Training von Algorithmen für Sentimentanalyse Probleme: Komplexität, Aufwand Kodierung Trainingsdaten Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Hintergrund: eTraces-Projekt (2) trotzdem konnte Leistung von Algorithmen bei weniger komplexen deutschsprachigen Trainingsdaten (Amazon Produktreviews) im Vergleich zum state of the art verbessert werden eTraces/ GESIS hat „Pionierarbeit“ als Basis für zukünftige Forschung im Bereich Sentiments in deutschsprachigen sozialwissenschaftlichen Texten und Produktreviews geleistet und vorläufige Grenzen der Methode thematisiert DGS-Zitationsanalyse ist daher nur ein Nebenergebnis Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

DGS-Korpus Verhandlungen der Deutschen Gesellschaft für Soziologie von 1910-2010 (Tagungsbände, z.T. unregelmäßig) 6444 vorbehandelte Dokumente OCR bzw. PDF (letzte Jahrgänge) Konversion in Textformat Textaufbereitung für maschinelle Lesbarkeit Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Warum Marx, Weber und Adorno? begründet durch eTraces-Projektziel, neben Sentiments auch Text-ReUse zu analysieren, weshalb qualitativ hochwertige und (nahezu) vollständige im DGS-Korpus häufig referenzierte Quell-Textkorpora benötigt wurden also: Klassiker, deren Werke digitalisiert in guter Qualität vorliegen > Quelle: Digitale Bibliothek (CD-ROM) Gesammelte Schriften Max Weber Gesammelte Schriften Theodor W. Adorno Ausgewählte Schriften Karl Marx/Friedrich Engels (MEW) Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Methode: qualitative Codierung kontextbasiert und interpretativ in MaxQDA 10: Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Methode: Codesystem Effizienzorientiert zur schnellmöglichen Produktion von Trainingsdaten für Sentiment-Algorithmen, Text-ReUse nachrangige Priorität, Ziel: max. Output, min. Zeitaufwand anstatt gängiger Ontologien (wie z.B. CiTO) äußerst kompaktes Codierschema mit nur 5 Kategorien: + | positiv - | negativ 0 | neutral +&- | positiv UND negativ in einem Satz N | Negationsstruktur Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Herausforderungen Ungleichgewicht in Trainingssätzen z.B. bei Max Weber: 218 (+), 43 (+&-), 512 (0), 76 (-) Klassiker werden im DGS Korpus oft ohne Belege zitiert, z.B. Weber als „Ahnherr“ regelrecht kanonisiert (Definitionen etc.) oder oft einfach nur „dekorativ“ im Literaturverzeichnis Texte oft Vortragsmanuskripte mit geringeren Standards in Bezug auf korrektes wissenschaftliches Arbeiten, Qualität in Bezug auf Zitation ändert sich jedoch im zeitl. Verlauf Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Ergebnisse Teil 1: Häufigkeiten von Autorennennungen Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Ergebnisse (absolut/ formal korrekt) Im Fall Max Webers stehen nur 640 korrekte Referenzen den 7381 Fundstellen gegenüber, was einem Verlust von 91,3% entspricht alle Referenzen von den 1970er Jahren würden durch formale Defizite entsprechend heutiger Standards verloren gehen (nicht praktikabel) Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Ergebnisse (absolut pro Jahrgang) absolute Zahlen für Autoren nicht vergleichbar z.B. Maximum bei Weber 1964 bedingt durch auf ihn bezogenes Thema der Tagung, Einbruch im Jahr 2000 dagegen durch außergewöhnlich niedrige Dokumentenzahl Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Ergebnisse (durchschn./Dokument) Werden die Ergebnisse in Relation zu den Dokumenten pro Tagung berechnet, ist es schwierig z.B. eine „Weber-Renaissance“ (Glassman 1983, Hinz 1966) zu sehen Weber-Ausreißer von 1964 bleibt Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Kontext (Texte je Jahrgang, absolut) Dokumentanzahl pro Jahrgang zeigt sich Heterogenität sowie generell zunehmenden Trend, was vorgie Unterschiede relativer und absoluter Darstellung erklärt Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Kontext (Texte je Jahrgang, relativ) Wenn absolute Dokumentanzahl pro Jahrgang ins Verhältnis zur Gesamtzahl jährlicher Dokumente gesetzt wird zeigt sich abnehmender Trend für alle Autoren Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Fazit Teil 1: alle Grafiken zeigen Konstruktionen unter Hervorhebung verschiedener Aspekte, wenngleich die letzten beiden hinsichtlich der Intensität zu verschiedenen Jahrgängen informativer erscheinen als die vorangegangen trotz vager Verbindung jeweiliger Zahlen von Referenzen angesichts der zuvor dargestellten Definitionsprobleme, kein guter Grund für Präferenz einer davon nichtsdestotrotz ist keine Weber-Renaissance zu erkennen Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Ergebnisse Teil 2: Codierung von Sentiments (Bsp. Adorno) Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Sentiments Adorno (absolut/relativ) Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Fazit Teil 2: klar abnehmender Trend für Adorno lokale Maxima um 1968 (angesichts Adornos enormer Rezeption im Kontext der 68er kaum überraschend – im Gegensatz zur leichten Verzögerung bei Paraphrasen evtl. durch die zunehmende Bekanntheit seiner Werke) trotz damals hochgradiger Polarisierung der Disziplin (z.B. im „Positivismusstreit“) starken Häufigkeit neutraler Referenzen (durch spezifische Argumentationsstruktur von neutral-deskriptiven Aussagen zu nur wenig polarisierten) Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne

Vielen Dank für die Aufmerksamkeit! Kontakt: Jun.Prof. Dr. Brigitte Mathiak b.mathiak@uni-koeln.de Reinhard Messerschmidt, M.A. reinhard.messerschmidt@uni-koeln.de Universität zu Köln Cologne Center for eHumanities (CCeH) University of Cologne