Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Ökonometrie und Statistik Datamining und Big Data anhand von Fallbeispielen Dr. Bertram Wassermann.

Ähnliche Präsentationen


Präsentation zum Thema: "Ökonometrie und Statistik Datamining und Big Data anhand von Fallbeispielen Dr. Bertram Wassermann."—  Präsentation transkript:

1 Ökonometrie und Statistik Datamining und Big Data anhand von Fallbeispielen
Dr. Bertram Wassermann

2 Fallbeispiel 1a: Controlling und Reporting, Aufgabe
Sie arbeiten im Controlling eines großen Einzelhändlers, wie z.B. einer Lebensmittelkette, mit vielen Filialen. Ihre Aufgabe ist es die Jahresumsätze der einzelnen Filialen miteinander besser vergleichbar zu machen. Ganz offensichtlich gibt es bei Umsätzen zwischen Filialen Unterschiede. Manches davon ist naheliegend: große vs. kleine Filialen Aber nicht alles ist offensichtlich. Möglichst viele Faktoren sollen identifiziert und die Größe ihres Einflusses quantifiziert werden. Besseres Verstehen des Filialsystems Bewertung einzelner Filialen (Performance Bewertung) Unterstützung bei der Performance Planung im nächsten Jahr Planungsunterstützung bei Neugründungen Fraud Detection

3 Fallbeispiel 1a: Controlling und Reporting, Daten
Welche Daten werden Sie dafür benötigen? Die Filiale Größe: anhand von QM oder Anzahl MA oder Lagerfläche Parkplätze bzw. Tiefgarage Angebot: gibt es Spezialangebote, die eine Filiale von anderen unterscheidet? Mitarbeiterstruktur: Erfahrung, Spezialisten, … Segmentierung: Sie haben bereits intern eine bestehende Segmentierung Der Markt Größe: anhand von QM des Einzugsgebietes oder Anzahl potentieller Kunden Siedlungsstruktur: Großstadt bis ländlich Verkehrslage Bevölkerungsstruktur: Waldviertel v. 7ter Bezirk in Wien Die Mitbewerber Anzahl und welche Größe: anhand von QM oder Anzahl Mitarbeiter Angebot Sonstiges Allgemeine ökonomische, regionale Kennzahlen (Inflation, Arbeitslosigkeit, Wachstum, etc.) Wetter

4 Fallbeispiel 1a: Controlling und Reporting, Quellen
Woher bekommen Sie die Daten? Die Filiale Buchhaltung DWH Marketing Der Markt Markforschung Geomarketing Firmen Eigene Datenanbieter Die Mitbewerber Mitbewerbsbeobachtung (intern und extern) Sonstiges Entsprechende Informationsanbieter Statistik Austria ZAMG

5 Fallbeispiel 1a: Controlling und Reporting, Methode
Mit welcher Methode kann man die Fragestellung lösen? Multiple lineare Regression

6 Fallbeispiel 1b: Controlling und Reporting, Aufgabe
Sie arbeiten in einem Immobilienbüro in einer großen Stadt. Sie möchten besser verstehen, was am Markt die Mieten von Wohnungen beeinflusst. In welchen Faktoren spiegeln sich die Mieten? So etwas nennt man einen Mietspiegel. Sie engagieren dazu einen Konsulenten für Operations Research, der Ihnen bei der Lösung der Aufgabe helfen soll. Zunächst tritt er mit folgenden Fragen an Sie heran, da Sie das nötige Fachwissen haben werden. Von welchen Faktoren ist der Mietpreis abhängig? Wie wirken die Faktoren, Mietpreis erhöhend oder vermindernd? Sind die Faktoren voneinander unabhängig oder gibt es Zusammenhänge? Wenn Abhängigkeiten bestehen, welche? Wie stark ist der Einfluss des Faktors? Haben Sie die Daten bereits bzw. woher kommen die Daten dazu? Welches Skalenniveau haben diese Faktoren?

7 Fallbeispiel 1b: Controlling und Reporting, Aufgabe
Sie führen mit dem Konsulenten einen Workshop durch und beantworten diese Fragen: Lage / Bezirk 1. Bezirk besser 10 Bez. Schlechter stark Größe der Wohnung, sehr stark Baujahr Je jünger desto teurer Letzte Sanierung / Sanierungsbedarf? Balkon / Garten / Freifläche Umgebungsausstattung / Pool Verkehrsanbindung Parkplatz /Garage vorhanden Möbliert (teurer wenn ja) Stockwerk (Erdgeschoß eher billiger) Lift ja /nein Art der Heizung Höhe der Nebenkosten

8 Fallbeispiel 1b: Controlling und Reporting, Aufgabe
Zahlreiche deutsche Städte erstellen sogenannte Mietspiegel, um Mietern, Vermietern, Mietberatungsstellen und Sachverständigen eine objektive Entscheidungshilfe in Mietfragen zur Verfügung zu stellen. Die Mietspiegel werden dabei insbesondere zur Ermittlung der ortsüblichen Vergleichsmiete (Nettomiete in Abhängigkeit von Wohnungsgröße, -ausstattung, -alter, etc.) herangezogen. Bei der Erstellung von Mietspiegeln wird aus der Gesamtheit aller in Frage kommenden Wohnungen eine repräsentative Zufallsstichprobe gezogen (im Fall der Stadt München durch Infratest), und die interessierenden Daten werden von Interviewern anhand von Fragebögen ermittelt. Der vorliegende Datensatz stellt einen Ausschnitt aus dem Mietspiegel München des Jahres 2003 dar und enthält die Daten von 1000 Wohnungen.

9 Fallbeispiel 1b: Controlling und Reporting, Aufgabe
Im vorliegenden Datensatz wurden folgende Variablen erhoben. Wie wirken die Faktoren, Mietpreis erhöhend oder vermindernd? Sind die Faktoren voneinander unabhängig oder gibt es Zusammenhänge? Wenn Abhängigkeiten bestehen, welche? Wie stark ist der Einfluss des Faktors? Bestimmen Sie die Skalenniveaus. Ankürzung Beschreibung Wirkung Abhängigkeit Stärke Skalenniveau nm Nettomiete in EUR Metrisch wfl Wohnfläche in m² +  rooms Sehr s metrisch  rooms Anzahl der Zimmer in der Wohnung  wfl Stark bj Baujahr der Wohnung  +  zh0, ww0 Schwach wohngut Gute Wohnlage? (J=1,N=0)  -wohnbest Sehr stark Nominal, dichotom wohnbest Beste Wohnlage? (J=1,N=0)  - wohngut ww0 Warmwasserversorgung vorhanden? (J=0,N=1)  -  zh0, bj zh0 Zentralheizung vorhanden? (J=0,N=1)  ww0, bj badkach0 Gekacheltes Badezimmer? (J=0,N=1) badextra Besondere Zusatzausstattung im Bad? (J=1,N=0) kueche Gehobene Küche? (J=1,N=0)

10 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Univariate Voranalysen Nm: ø ~ € 575, Rechtschief, ! Ausreißer Wfl: ø ~ 70 m², Rechtschief, ! Ausreißer BJ: Sehr ungleich verteilt, Min = 1918 mit 200 von 1000 Wohnungen -> nicht nachvollziehbar. Vermutlich sind alle Wohnungen vor 1918 mit BJ 1918 erfasst worden. Konsequenz: Nicht Intervallskaliert -> Kategorien bilden. BJ.kat: 3 Kategorien 1: Bis : 1939 – : nach 1980 Rooms: Wohnung mit mehr als 4 räumen eher Ausnahmen. Einzimmerwohnungen mit 10% recht häufig. Dichotome Varialben: Sehr häufig: Gute Wohnlage und Badezimmer nicht gekachel Alle anderen unter 10%

11 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Bivariate Voranalysen mit Zielvariable Nettomiete Korrelationsmatrix mit Heatmap Welche Variablen sind mit der Zielvariable wie korreliert? Welche erklärenden Variablen sind miteinander korreliert? Es gilt zu klären warum, was ist der Zusammenhang? Scatterplots, Regressionsgerade und Residuenplot für „echte“ metrische Variablen Wohnfläche hat den stärksten Zusammenhang mit NM: €7 / m², R² ~ 50%, Residuen zeigen auffallendes Trichtermuster (Heteroskedastizität). Nicht gut für Hochrechnung. Ausreißer ! Sehr große Wohnungen mit Miete unter € 500 Anzahl Zimmer auch stark, aber deutlich geringer € 132 / Zimmer, R² ~28% Ausreißer! Einzimmerwohnung mit € Loft?

12 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Bivariate Voranalysen mit Zielvariable Nettomiete Baujahr zeigt bei einer linearer Regression kaum Zusammenhang, R² < 1% Aber, Voranalyse legte nahe aus Baujahr eine kategorielle Variable zu machen Varianzanalyse mit bj.kat zeigt einen stärkeren Zusammenhang: R² ~ 8% Allerdings, Zusammenhang ist nicht linear: Wohnungen vor 1939 und nach 1980 haben im Durchschnitt höhere Mieten als Wohnungen zwischen 1939 und (60er Jahre Bauten) Die dichotomen Variablen zeigen die erwarteten Zusammenhänge. Badezimmerausstattung und gehobene Küche haben die größten Werte für R², ~ 7% und 5%.

13 Einschub: Varianzanalyse
Ist eine lineare Regression mit metrischer Zielvariable und kategorialer erklärender Variable (möglichst wenig Kategorien) Für jede Kategorie wird ein eigener Koeffizient geschätzt (daher möglichst wenig Kategorien) Geeignete grafische Darstellung im bivariaten Fall: gruppierter Boxplot Obwohl lineare Regression bietet die Möglichkeit nicht-lineare Zusammenhänge zu modellieren

14 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Bivariate Voranalysen mit Zielvariable Nettomiete Dichotome Variablen zeigen durchaus Einfluss, was man an den Varianzanalysen sieht. Die Erklärungskraft ist aber nicht groß. Max 7,3% Besondere Badezimmerausstattung 4,5% Gehobene Küche 4% Zentralheizung nicht vorhanden Alle anderen < 3% Die Variablen habe auch nicht besonders viele Ausprägungen, differenzieren also nicht so stark.

15 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Bivariate Voranalysen erklärende Variablen untereinander Wie zu erwarten gibt es eine starke Korrelation zwischen Wohnfläche und Anzahl Räume. ! Ausreißer: Einzimmerwohnung mit fast 150m² -> also ein Loft. Baujahr und Wohnfläche: Die Wohnungen sind früher durchschnittlich eher etwas größer gebaut worden … … und hatten mehr Räume. 50% der neueren Wohnungen haben maximal 2 Zimmer. Ist das ein Trend zu Single – Wohnungen?

16 Einschub: Interaktion im linearen Modell
Typische grafische Darstellung im Falle von zwei metrischen und eine dichotomen bzw. kategoriellen Variable: Gruppierter Scatterplot Auch 2 kategorielle Variablen sind mögliche. Differenzierung mittels Farbe und Form (Kreis, Dreieck, Quadrat etc.) Ab 3 kategoriellen und 2 metrischen Variablen wird es dann schwierig Grafisch bekommt jede Teilwolke für sich eine eigene Gerade angepasst. Rechnerisch lassen zwei Fälle unterscheiden (Interaktion? Ja oder nein.) 𝑌=𝑏+ 𝑋+ 𝐷 = 𝑌=𝑏+ 𝑎 𝑋 𝑤𝑒𝑛𝑛 𝐷=0 𝑌= 𝑏+𝑐 + 𝑎 𝑋 𝑤𝑒𝑛𝑛 𝐷=1 (parallele Geraden) 𝑌=𝑏+ 𝑋+ 𝐷∗𝑋= 𝑌=𝑏+ 𝑎 𝑋 𝑤𝑒𝑛𝑛 𝐷=0 𝑌= 𝑏+𝑐 + 𝑎+𝑑 ∗𝑋 𝑤𝑒𝑛𝑛 𝐷=1 (Interaktion) Ist der Koeffizient d signifikant von 0 verschieden, dann liegt eine Interaktion vor. Ist nur c signifikant von 0 verschieden, dann gibt es zwar keine Interaktion, aber die dichotome Variable hat Einfluss.

17 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Multivariate Voranalysen, 2 metrische und 1 dichotome Variable Am Beispiel, siehe Bericht Auswertung Multivariat mit Zielvariable.pdf Sind die Geraden ident, parallel oder mit unterschiedlicher Steigung? Seite 4 und 5: 𝑛𝑚 ~ 𝑤𝑓𝑙+𝑏𝑎𝑑𝑒𝑥𝑡𝑟𝑎 oder 𝑛𝑚 ~ 𝑤𝑓𝑙+𝑤𝑓𝑙∗ 𝑏𝑎𝑑𝑒𝑥𝑡𝑟𝑎 ? Grafisch sind sie verschieden aber parallel. Also keine Interaktion. Rechnerisch Koeff. von badextra sign. von 0 verschieden (Seite 4) Koeff. von wfl:badextra nicht sign. von 0 verschieden (Seite 5) Spricht für Modell 1, keine Interaktion aber verschiedene Geraden Interpretation: Extra Badezimmerausstattung verursacht eine Aufschlag von durchschnittlich € 86. Der Preis / m² bleibt gleich. Verschiedene aber parallele Geraden bedeuten inhaltlich in dem Beispiel, dass die dichotome Variable einen Auf- oder Abschlag auf den gesamten Mietpreis verursacht.

18 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Multivariate Voranalysen, 2 metrische und 1 dichotome Variable Am Beispiel, siehe Bericht Auswertung Multivariat mit Zielvariable.pdf Sind die Geraden ident, parallel oder mit unterschiedlicher Steigung? Seite 6 und 7: 𝑛𝑚 ~ 𝑤𝑓𝑙+𝑘𝑢𝑒𝑐ℎ𝑒 oder 𝑛𝑚 ~ 𝑤𝑓𝑙+𝑤𝑓𝑙∗𝑘𝑢𝑒𝑐ℎ𝑒 ? Grafisch haben die beiden Geraden unterschiedliche Steigung. Das spricht für eine Interaktion Rechnerisch Koeff. von wfl:kueche auf Seite 7 ist sign. von 0 verschieden. R² ist im 2. Modell ein wenig höher. Spricht für Modell 2, Interkation Interpretation: Die besondere Küchenausstattung wirkt sich auf den Preis pro m² aus. Er ist höher. Die Nettomiete nimmt mit der Wohnfläche stärker zu. Nicht parallele Geraden bedeuten inhaltlich in dem Beispiel, dass die dichotome Variable einen Einfluss auf den m² Preis hat.

19 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Multivariate Voranalysen, 2 metrische und 1 kategorielle Variable Bericht Auswertung Multivariat mit Zielvariable.pdf Nettomiete, Wohnfläche und Anzahl Räume (Seite 2 und 4) Vorsicht ist geboten. Wohnfläche und Anzahl Räume sind stark korreliert. Grafisch: sehr auffallend, Steigung für 6 Zimmerwohnungen praktisch 0 Alle anderen Geraden eher parallel, kaum versetzt, eher identisch Rechnerisch: R² des Interaktionsmodell (Seite 3) ist größer als der des einfachen Modells (Seite 2). F-Statistik sinkt, ist aber signifikant von 0 verschieden. Koeffizienten sind aber nur für 3 und 6 Zimmerwohnungen signifikant. 3 Zimmer: Die Miete wächst stärker mit der Größe der Wohnung. Der m² Preis ist um fast € 3 höher. Warum? 6 Zimmer: Die Miete hängt nicht von der Größe der Wohnung ab. Allerdings gibt es nur 6 Zimmerwohnungen ab 100m². Und es gibt auch nur 10 solche Wohnungen. (10 von 1000 ist 1%)

20 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Multivariate Voranalysen, 2 metrische und 1 kategorielle Variable Bericht Auswertung Multivariat mit Zielvariable.pdf Nettomiete, Wohnfläche und Lage (Seite 9 und 10) Grafisch: drei Geraden, deutlich zu sehen, beste Wohnlage ist nicht parallel zu den beiden anderen -> wir erwarten Interaktion. Schwer zu sagen ist, ob eine gute Wohnlage einen anderen Einfluss auf die Miete hat als normale Lage. Jedenfalls ist der Einfluss nicht sehr relevant. Rechnerisch: R² des Interaktionsmodell (Seite 9) ist größer als der des einfachen Modells (Seite 8), spricht für Interaktion. F-Statistik sinkt, ist aber signifikant von 0 verschieden. Steigung für beste Lage ist signifikant von 0 verschieden -> Interaktion. Steigung für gute Lage ist nicht signifikant. Ergebnis entspricht der grafischen Interpretation. Interpretation: Für beste Wohnlage wird ein höherer m² Preis verlangt.

21 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Multivariate Voranalysen, 2 metrische und 1 kategorielle Variable Bericht Auswertung Multivariat mit Zielvariable.pdf Nettomiete, Wohnfläche und Baujahr (Seite 12 und 13) Grafisch: drei Geraden, deutlich zu sehen, Mietpreise für Neubauten sind nicht parallel zu den beiden anderen -> wir erwarten Interaktion. Aber auch die Gerade für 60er Jahre Bauten scheint nicht parallel zu den Altbauten zu. Erstaunlich, im Gegensatz zu den Voranalysen scheinen größere 60er Jahre Bauten höhere Mieten als entsprechende Altbauten zu erzielen. Rechnerisch: R² des Interaktionsmodell ist größer als der des einfachen Modells, spricht für Interaktion. F-Statistik sinkt, ist aber signifikant von 0 verschieden. Alle Koeffizienten des Interaktionsmodells sind signifikant von 0 verschieden -> Interaktion. Interpretation: Preise für Altbauwohnungen beginnen auf einem höheren Niveau (für kleinere Wohnungen) steigen aber nicht so stark mit der Größe.

22 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Multivariate Voranalysen, 2 metrische und 1 dichotome Variable Bericht Auswertung Multivariat mit Zielvariable.pdf Nettomiete, Wohnfläche und Bad nicht gekachelt (Seite 14 und 15) Grafisch: Schwer zu sagen. Sie erscheinen nicht parallel, da sie sich bei großen Wohnungen kreuzen. Allerdings: große, ungekachelte Wohnungen sind eher selten. Rechnerisch: R² wächst minimal, spricht nicht für Interaktion. F-Statistik sinkt, ist aber signifikant von 0 verschieden. Steigungskoeffizienten für die Interaktion ist nicht signifikant von 0 verschieden -> keine Interaktion. Im einfachen Modell negativer Koeffizient für fehlende Kacheln Interpretation: Ca. € 70 Abschlag, falls im Badezimmer die Kacheln fehlen.

23 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Multivariate Voranalysen, 2 metrische und 1 dichotome Variable Bericht Auswertung Multivariat mit Zielvariable.pdf Nettomiete, Wohnfläche und Bad nicht gekachelt (Seite 14 und 15) Grafisch: Schwer zu sagen. Sie erscheinen nicht parallel, da sie sich bei großen Wohnungen kreuzen. Allerdings: große, ungekachelte Wohnungen sind eher selten. Rechnerisch: R² wächst minimal, spricht nicht für Interaktion. F-Statistik sinkt, ist aber signifikant von 0 verschieden. Steigungskoeffizienten für die Interaktion ist nicht signifikant von 0 verschieden -> keine Interaktion. Im einfachen Modell negativer Koeffizient für fehlende Kacheln Interpretation: Ca. € 70 Abschlag, falls im Badezimmer die Kacheln fehlen.

24 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Multivariate Voranalysen, 2 metrische und 1 dichotome Variable Bericht Auswertung Multivariat mit Zielvariable.pdf Nettomiete, Wohnfläche und kein Warmwasser oder keine Zentralheizung (Seite 16 bis 19) Grafisch: Beide Variablen liefern nicht parallele Geraden und sprechen somit für eine Interaktion, also einen niedrigeren m² Preis, falls das eine oder andere nicht vorhanden ist. Rechnerisch: Beide Interaktionsmodelle sind signifikant und bestätigen somit die grafische Interpretation. R² ist für fehlendes Warmwasser etwas höher als bei fehlender Zentralheizung Interpretation: Fehlendes Warmwasser senkt den m² Preis um ca. € 3, fehlende Zentralheizung um € 2. Was wenn sowohl Warmwasser als auch Heizung fehlen? Sinkt der m² Preis dann um €5?

25 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Multivariate Voranalysen, 2 metrische und 2 dichotome Variable Bericht Auswertung Multivariat mit Zielvariable.pdf Nettomiete, Wohnfläche und kein Warmwasser und keine Zentralheizung (Seite 20 bis 23) Grafisch: Vier Geraden, die nicht parallel verlaufen. Dabei unterscheiden sich 2 kaum: Wenn kein Warmwasser vorhanden ist, scheint das fehlen der Zentralheizung keinen besonderen Effekt mehr zu haben. Nur wenn wohl Warmwasser da ist aber die Heizung fehlt, hat diese einen Effekt. Rechnerisch: Es ergeben sich 4 Modelle, Ohne jegliche Interaktion, rein linear (Seite 19) Eine Interaktion der einen Variable und keine mit der anderen (2 Modelle) (Seite 20 und 21) Beide haben eine Interaktion mit der Wohnfläche. (Seite 22)

26 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Multivariate Voranalysen, 2 metrische und 2 dichotome Variable Bericht Auswertung Multivariat mit Zielvariable.pdf Nettomiete, Wohnfläche und kein Warmwasser und keine Zentralheizung (Seite 20 bis 23) R² und F Test: R² mit beiden Variablen ist im Vergleich mit den Modellen mit nur einer Variable um mehr als einen Prozentpunkt höher. Am höchsten ist er für das Modell mit beiden Interaktionen (Seite 22) Allerdings nur um 0,01 im Vergleich zum Modell auf Seite 21, wo die Interaktion von Wohnfläche und Zentralheizung fehlt. Dafür ist der Wert der F – Statistik deutlich höher. R² und F-Statistik für das Modell auf Seite 20 sind hingegen im Vergleich niedriger. Das Modell ohne jede Interaktion (Seite 19) hat zwar die höchste F-Statistik aber einen um 0,007 kleineren R². Favoritenmodell -> 𝑛𝑚 ~ 𝑤𝑓𝑙+𝑧ℎ0+ 𝑤𝑓𝑙∗𝑤𝑤0, eine Interaktion

27 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Multivariate Voranalysen, 2 metrische und 2 dichotome Variable Bericht Auswertung Multivariat mit Zielvariable.pdf Nettomiete, Wohnfläche und kein Warmwasser und keine Zentralheizung (Seite 20 bis 23) Favoritenmodell -> 𝑛𝑚 ~ 𝑤𝑓𝑙+𝑧ℎ0+ 𝑤𝑓𝑙∗𝑤𝑤0, eine Interaktion Koeffizienten: In diesem Modell sind die Koeffizienten für die Steigung von wfl*ww0 (Steigung für WFL wenn Warmwasser nicht vorhanden), zh0 (Abschlag, wenn Zentralheizung fehlt) und wfl signifikant von 0 verschieden. Gegen das Modell 𝑛𝑚 ~ 𝑤𝑓𝑙+𝑤𝑓𝑙∗𝑧ℎ0+ 𝑤𝑓𝑙∗𝑤𝑤0 mit beiden Interaktionen spricht auch, dass der Koeffizient von 𝑤𝑓𝑙∗𝑧ℎ0 nicht signifikant von 0 verschieden ist.

28 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Multivariate Voranalysen, Interaktionen Übersicht Im Einfluss auf die Nettomiete zeigt die Wohnfläche Interaktionen zu… Anzahl Räume (3 oder 6 Räume gegenüber allen anderen) Besonderer Küchenausstattung Beste Wohnlage Baujahr kein Warmwasser vorhanden. Diese Faktoren führen zu einer Veränderung des Quadratmeterpreises Im Einfluss auf die Nettomiete führen die folgenden Faktoren … Extra Badezimmerausstattung Badezimmer nicht gekachelt Gute Wohnlage keine Zentralheizung vorhanden zu einem Auf- oder Abschlag bei der gesamten Nettomiete. Der Quadratmeterpreis ändert sich nicht.

29 Fallbeispiel 1b: Controlling und Reporting, Report
Der Konsulent analysiert die Daten, erstellt einen Report und bespricht diesen mit Ihnen durch. Gesamtmodell Basierend auf diesen Voranalysen lässt sich nun ein erstes Gesamtmodell formulieren: 𝑛𝑚 ~ 𝑤𝑓𝑙 ∗ 1+𝑅𝑎𝑢𝑚.𝑘𝑎𝑡+𝑘𝑢𝑒𝑐ℎ𝑒+𝑤𝑜ℎ𝑛𝑏𝑒𝑠𝑡+𝑏𝑗.𝑘𝑎𝑡+𝑤𝑤0 + 𝑏𝑎𝑑𝑒𝑥𝑡𝑟𝑎+𝑏𝑎𝑑𝑐𝑘𝑎𝑐ℎ0+𝑤𝑜ℎ𝑛𝑔𝑢𝑡+𝑧ℎ0 Siehe Bericht Gesamtmodell.pdf. R² konnte auf 64,3% Erklärkraft gesteigert werden. Alle wesentlichen Koeffizienten sind zumindest auf einem Niveau von 0,1 signifikant von 0 verschieden. Der Residuenplot zeigt immer noch das auffallende Trichtermuster. Conclusio: Ein erstes, brauchbares Modell, dass aber noch Verbesserung benötigt.

30 Fallbeispiel 1b: Controlling und Reporting, Report
Mögliche Schritte zur Verbesserungen Variabilität der Residuen dämpfen -> Logarithmierung der ZV Ausreißer suchen und behandeln Zusätzliche Informationen aufnehmen: Segmentierung der Wohnungen, z.B. Single Wohnung Familienwohnung Seniorenwohnung Luxuswohnung Damit Berücksichtigung des Einflusses der Nachfrage auf den Mietpreis Was des einen beste Wohnlage, ist des anderen zu vermeiden Gegend. Manche wollen inmitten von vielen Menschen, Geschäften und Lokalen wohnen, wo sich richtig was abspielt. Andere liebe die Ruhe und Grünlage.


Herunterladen ppt "Ökonometrie und Statistik Datamining und Big Data anhand von Fallbeispielen Dr. Bertram Wassermann."

Ähnliche Präsentationen


Google-Anzeigen