Datentabelle für 2 Merkmale
Kontingenztafel der absoluten Häufigkeiten Y X
Kontingenztafel der relativen Häufigkeiten Y X
Betriebe und hinterzogene Steuer Kontingenztabelle X: Art des Betriebes 1 = Handelsbetriebe 2 = Freie Berufe (Leistungsbetriebe) 3 = Fertigungsbetriebe Y: Art der hinterzogenen Steuer 1 = Lohnsteuer 2 = Einkommenssteuer 3 = Umsatzsteuer 4 = Sonstiges
Kontingenztafel Streudiagramm
Korrelationsrechnung
G. Gelbrich: Statistik für Anwender. Shaker
Kovarianz Merkmal Datensatz Merkmal Datensatz
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig
X größer Y größer X größer Y kleiner
Positiver strikter Zusammenhang Negativer strikter Zusammenhang
Korrelationskoeffizient bei verschiedenen Konstellationen von Ausprägungen
Korrelationskoeffizient: 1.00
Korrelationskoeffizient: 0.19
Korrelationskoeffizient: 0.00
Vorsicht beim Gebrauch des Korrelationskoeffizienten! Fibonacci-Zahlen Störche und Geburten
Regressionsrechnung Lineare Regression
Datentabelle für 2 Merkmale
Mögliche Funktionenklassen für die Regressionsrechnung
Lineare Funktionen Polynome Exponentialfunktionen (Exponentielles Wachstum; x ist die Zeit) Gompertz-Kurven Logistische Funktionen
Approximation durch eine Gerade
Prinzip der kleinsten Quadrate (Kleinst-Quadrat-Schätzung) Man sucht in der betrachteten Klasse diejenige Funktion f, so dass die Summe der Abweichungsquadrate minimiert wird: Bestimme f, so dass minimal !!
Aufgaben der Regressionsrechnung 1. Extrapolation Stellt man sich für den Moment x als die Zeit vor, so möchte man die beobachteten Werte auf die „Zukunft“ extrapolieren. Man erstellt eine „Prognose“. Dazu bedient man sich der gefundenen Funktion f, um für eine „Zeit“ x der “Zukunft“ den Wert y = f(x) zu schätzen.
2. Interpolation Man interessiert sich für den Wert von y = f(x) für Zwischenwerte von x, d. h. für Werte x, die zwischen 2 beobachteten Werten liegen: Wieder bedient man sich der Funktion f, um eine Interpolation der Werte durchzuführen.
Lineare Regression Finde reelle Zahlen a und b,so dass der Wert von minimal wird! Mit anderen Worten: Finde den „Punkt“ (a ,b), an dem die Funktion ihr Minimum annimmt!
Steigung der Regressionsgeraden Schnitt der Regressionsgeraden mit der y-Achse bei
Bestimmtheitsmaß Maß für die Güte der Anpassung der Daten an die Regressionsfunktion Dabei ist
In einem Kaufhauskonzern mit 10 Filialen soll die Wirkung von Werbeausgaben auf die Umsatzsteigerung untersucht werden. Die Daten sind: X: Werbeausgaben in 1000 Euro Y: Umsatzsteigerung in 10 000 Euro
Demonstrationsbeispiel Lineare Regression Varianzen Mittelwerte Kovarianz
Steigung der Regressionsgeraden Schnitt der Regressionsgeraden mit der y-Achse bei