Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Anwendbarkeit von Benfords Gesetz Fälschungsforschung in den Sozialwissenschaften Johannes Bauer.

Ähnliche Präsentationen


Präsentation zum Thema: "Anwendbarkeit von Benfords Gesetz Fälschungsforschung in den Sozialwissenschaften Johannes Bauer."—  Präsentation transkript:

1 Anwendbarkeit von Benfords Gesetz Fälschungsforschung in den Sozialwissenschaften Johannes Bauer

2 2 von 25 Benfordverteilte Daten

3 3 von 25 Benfordverteilung

4 4 von 25 Benfordverteilung Entstehungsfaktoren Multiplikationen – Richard Hammering (1970) Verteilungen – Theodor Hill (1995)

5 5 von 25 Fälschungen aufdecken Ansatz: Welche Daten sind benfordverteilt? Abweichungen als Indiz für Fälschungen

6 6 von 25 Was ist Benfordverteilt Datenquelle: Kölner Zeitschrift für Soziologie und Sozialpsychologie Februar 1985 bis März 2007 (mit Unterstützung des Lehrstuhl Braun, LMU München) N1. Ziffer2. Ziffer3. Ziffer4. Ziffer Unstand. Regressionen2180 xxxx χ²-Testwerte310 xxxx Logistische Regressionen2251 xx t-Verteilungen1538 xx Coxregressionen599 xx R²342 xxx Pseudo-R²248 xx- Gesamt7468 xx

7 7 von 25 Gleichverteilte Ziffern Normalverteilung Mittelwert: 3 Standardfehler: 2

8 8 von 25 Gleichverteilte Ziffern Normalverteilung Mittelwert: 3 Standardfehler: 2

9 9 von 25 Gleichverteilte Ziffern Normalverteilung Mittelwert: 3 Standardfehler: 2 N1. Ziffer2. Ziffer3. Ziffer4. Ziffer Unstand. Regressionen2180 xxx χ²-Testwerte310 xxx Logistische Regressionen2251 xx t-Verteilungen1538 xx Coxregressionen599 xx R²342 xxx Pseudo-R²248 xx- Gesamt7468 xx

10 10 von 25 Untersuchung des Lehrstuhl Braun Zu fälschende Hypothese: Je höher die Bildung einer Person, desto weniger Zigaretten raucht sie pro Tag 1. Ziffer: H o abgelehnt ( χ ²=103.39,df = 8, p = 0.000) 2. Ziffer: H o abgelehnt ( χ ²=122.59,df = 9, p = 0.000)

11 11 von 25 Untersuchung: 3. und 4. Ziffer H o abgelehnt ( χ ² = , df=9, p= 0.000) H o abgelehnt ( χ ² = , df=9, p= 0.000)

12 12 von 25 Untersuchung: Individualdaten Individuelle Abweichungen von Benfords Gesetz 1. Ziffer2. Ziffer 3. Ziffer4. Ziffer Personen absolut prozentual

13 13 von 25 Fälschungen entdecken Ansatz: Ab wann wird eine Fälschung erkannt? Vorgehensweise: 1. Empirische Verteilung gefälschter Regressionskoeffizienten 2. Ziehen von Zufallszahlen 3. Test der Zufallswerte auf Benfords Gesetz (H 0 ) χ 2 - Test Wiederholung für höhere Fallzahlen

14 Zweite gültige ZifferDritte gültige Ziffer Vierte gültige Ziffer Erste gültige Ziffer 14 von 25 Aggregatdaten Durchschnittliche Fallzahl um H 0 mit einer Wahrscheinlich- keit von 95 % abzulehnen: 1. Ziffer: 989 Fälle 2. Ziffer: 766 Fälle 3. Ziffer: 351 Fälle 4. Ziffer: 138 Fälle

15 15 von 25 Erste gültige Ziffer ~ 50 % gefälschte Daten 2. Ziffer: 3308 Fälle 3. Ziffer: 1351 Fälle 4. Ziffer: 585 Fälle Durchschnittliche Fallzahl um H 0 mit einer Wahrscheinlich- keit von 95 % abzulehnen: 1. Ziffer: 4001 Fälle Aggregatdaten

16 16 von 25 Erste gültige Ziffer ~ 10 % gefälschte Daten 2. Ziffer: Fälle 3. Ziffer: Fälle 4. Ziffer: Fälle Durchschnittliche Fallzahl um H 0 mit einer Wahrscheinlich- keit von 95 % abzulehnen: 1. Ziffer: Fälle Aggregatdaten

17 17 von 25 Benötigte Fallzahl (95 Prozent) ,2 0,4 0,6 0,8 1,0 Anteil gefälschter Daten Erste Ziffer Zweite Ziffer Dritte Ziffer Vierte Ziffer Aggregatdaten

18 18 von 25 Individualdaten Durchschnittliche Fallzahl um H 0 mit einer Wahrscheinlich- keit von 95 % abzulehnen: 1. Ziffer: 136 Fälle 2. Ziffer: 102 Fälle 3. Ziffer: 100 Fälle 4. Ziffer: 69 Fälle Erste gültige Ziffer ~ 100 % gefälschte Daten

19 19 von 25 Benötigte Fallzahl (95 Prozent) ,2 0,4 0,6 0,8 1,0 Anteil gefälschter Daten Erste Ziffer Zweite Ziffer Dritte Ziffer Vierte Ziffer Individualdaten

20 20 von 25 Kombination von Ziffern

21 21 von 25 Kombination von Ziffern

22 22 von 25 Zweiter Schritt: Gemeinsame Ziffern 1. Ziffer2. Ziffer3. Ziffer4. Ziffer Gewichtung 0,2650,2610,2520,222

23 23 von 25 Zweiter Schritt: Gemeinsame Ziffern

24 24 von 25 Zweiter Schritt: Gemeinsame Ziffern Benötigte Ziffern (95 Prozent) ,2 0,4 0,6 0,8 1,0 Anteil gefälschter Daten

25 25 von 25 Zweiter Schritt: Vergleich Gemeinsame Ziffern 4. gültige Ziffer Anteil gefälschter Daten 100% % % % % % Gemeinsame Ziffern 0, gültige Ziffer 100 / 18,5 = 5,

26 26 von 25 Ergebniszusammenfassung Fälschungserkennung mit Benfords Gesetz: Untersuchung von Individualdaten Untersuchung gemeinsamer Ziffern Anwendung von Anpassungstests, welche stärker auf die Stichprogengröße reagieren (hier χ²-Anpassungstest) Die Effektivität des Verfahrens ist stark abhängig von der Vorgehensweise des Fälschers.

27 27 von 25 Vorschläge Fälschungserkennung mit Benfords Gesetz: Erfassen möglichst vieler metrischer Kennwerte Verwenden der Gleichverteilung Fälschertypen bilden Konzentration auf Abweichungen Konzentration auf die Ziffernreihenfolge

28 28 von 15 Literatur Surowiecki, James, 2004: The Wisdom of Crowds. Why the Many are Smarter than the Few. New York: Doubleday. Nigrini, Mark, 1999: Ive Got Your Number. How a Mathematical Phenomenon can Help CPAs uncover Fraud and Other Irregularities, in: Journal of Accountancy: Newcomb, Simon, 1881: Note on the Frequency of use of the Different Digits in Natural Numbers, in: American Journal of Mathematics 4(1), Diekmann, Andreas, 2007: Not the First Digit! Using Benfords Law to Detect Fraudulent Scientific Data, in: Journal of Applied Statistics 34(3), Busta, Bruce/Weinberg, Randy, 1998: Using Benfords law and neural networks as a review procedure, in: Managerial Auditing Journal 13(6), Benford, Frank, 1938: The Law of Anomalous Numbers, in: Proceedings of the American Philosophical Society 78(4), Hill, Theodore P., 1995: Base-invariance implies Benfords law, in: Proceedings of the American Philosophical Society 78,


Herunterladen ppt "Anwendbarkeit von Benfords Gesetz Fälschungsforschung in den Sozialwissenschaften Johannes Bauer."

Ähnliche Präsentationen


Google-Anzeigen