Ein Generalized Neural Logit-Modell zur Prognose von

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Auswertung der Befragung
Übersicht zu Verfahren des Soft Computing
Genetische Algorithmen für die Variogrammanpassung
Die Deutschen im Herbst 2008
OpenCount 510 – Verbindungsdatenmanagement
Theorie psychometrischer Tests, III
EFQM European Foundation for Quality Management Claudius Ullrich
Entscheidungstheorien
Entscheidungstheorie für Unentschlossene Indecision Theory.
Java: Objektorientierte Programmierung
FH-Hof Effizienz - Grundlagen Richard Göbel. FH-Hof Inhalt Einführung Aufwand für Anfragen ohne Indexierung Indexstrukturen für Anfragen an eine Tabelle.
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Optimale Kombination mehrerer Datenquellen durch Kriging
Agglomerationseffekte und regionale Standortpolitik
Proseminar „Algorithmen auf Graphen“
Ganzzahligkeit in LP-Modellen
Flughafen- und Zugangsverkehrsmittelwahl in Deutschland
Herzlich willkommen beim 1. Workshop der AG Methodik
Latente Variablen – Kennwerte zur Beurteilung von Modellen
Strukturgleichungsmodelle
Intelligentes Crawling im WWW mit Hilfe intuitiver Suchbedingungen
Lohnentwicklung im Lebenszyklus
Tutorium
Tutorium Aufgabe 1 Informationen in Designmatrix in: - Darin sind die Prädiktoren enthalten - Aber sagt uns noch mehr! Untersuchungsdesign darin.
5. Abbildende versus erklärende Modelle –
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Christian Schulz, Marc Thielbeer, Sebastian Boldt
Self Organizing Tree Algorithm
Porsche.
Ausgleichungsrechnung I
DataMining Von Daten zu Informationen und Wissen
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Grundlagen: Lichtleistung Sonne
Westeuropäische Liga KBH. Geschichte des Vereins 1993 – Bewegungsanfang in Deutschland 1999 – Entstehen der Liga, die in der Osteuropäischen Welt anerkannt.
Erläuterungen: Klick auf Landeshauptstadt = Arbeitslosenentwicklung

Statistik: Mehr zur Regression.
Kapitel 16 Ökonometrische Modelle
Kapitel 14 Trends und Unit-root-Tests
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Sprechen – 2 Minutes to review your notes
Landeskunde der BRD die Hauptstädte (die Regierungsitze)
Master Bahningenieurwessen Master Bahningenieurwessen

Teilnahme der 12 Gemeinden in Deutschland Berlin Bonn Düsseldorf & Detmold Frankfurt Gießen Hamburg & Bremerhaven Hannover München Nürnberg Stuttgart.
Multivariate Statistische Verfahren
FIFA-Weltpokal FIFA-Weltpokal 2006 WM = Weltmeisterschaft Die Fußballweltmeisterschaften finden ab Juni 2006 in Deutschland statt. Die Mannschaft.
Design Dario Besirevic.
Germany Slide 1: Land and Text Slide 2: Land Political
Begriff der Zufallsgröße
Inklusion/Exklusion von Menschen mit Behinderung
Statistik – Regression - Korrelation
Die Clusteranalyse Zielsetzung Datenreduktion: Zusammenfassung einer Vielzahl von Objekten oder Variablen zu Gruppen mit möglichst ähnlichem Informationsgehalt.
OpenCount 530 – Verbindungsdatenmanagement
Deutsch. A B C D E F G H I J K L M N O P Q R S T.
Hauptstadt Berlin Bundesrepublik Deutschland
Evolutionärer Entwurf neuronaler Netze
1)Inwieweit können die Werte in Y auf der Basis zweier unabhängiger Variablen X1 und x2 „erklärt“ werden? 2)Kann auf der Basis der vorliegenden Stichprobenergebnisse.
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Prognose von Zeitreihen Hans Nübel Hans Nübel Prognose von Zeitreihen Aufbau 1.Motivation 2.Holt-Winters-Verfahren 3.Prognose.
Außenhandelsbeziehungen zwischen China, USA, EU Makroökonometrie Vorlesung Dr. Oliver Bode.
Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.
, M I E D Z Y Deutschland stellt sich vor , RENEM I ODRA.
Deutschland.
2017/2018 Bayern München Leipzig Dortmund Hoffenheim Köln Berlin
Deutsche Bahn GASA Deutsche Bahn - ის წარმომადგენლობა
Die Bundeslander Deutschlands Федеральные Земли Германии ТО «Мир немецкого.
 Präsentation transkript:

Ein Generalized Neural Logit-Modell zur Prognose von Flughafen- und Zugangsverkehrsmittelwahl Dipl.-Kfm. Marc Ch. Gelhausen

„Key Aspects“ Theorie der Modellierung diskreter Entscheidungen Diskretes Entscheidungsmodell Konzept der Gruppen Allgemeines Modell zur Prognose von Flughafen- und Zugangsverkehrsmittelwahl Theorie der Modellierung diskreter Entscheidungen Neuartige Lösung eines bestehenden Problems

Agenda Theorie diskreter Entscheidungsmodelle Konzept der Gruppen Generalized Neural Logit-Modell Allgemeines Modell zur Prognose von Flughafen- und Zugangsverkehrsmittelwahl Theorie diskreter Entscheidungsmodelle Konzept der Gruppen Generalized Neural Logit-Modell Allgemeines Modell zur Prognose von Flughafen- und Zugangsverkehrsmittelwahl

Prognosephilosophie Diskretes Entscheidungsmodell: Interne individuelle Sicht Entscheidungsträger: „Welche Alternative ist für mich die optimale?“ Nutzenbewertung anhand entscheidungsrelevanter Kriterien Eigenschaften der Alternativen, wie z.B. Zugangskosten, etc. Diskretes Entscheidungsmodell: „Modellhafte Abbildung von individuellem nutzenmaximierenden Entscheidungsverhalten, welches aus externer Perspektive nur unvollständig beobachtbar ist.“ mangelnde Beobachtbarkeit, Messfehler, etc. Externe individuelle Sicht Prognostiker: „Welche Alternative ist für ihn wahrscheinlich die optimale?“ Auswahlwahrscheinlichkeiten der Alternativen Aggregation über homogene Populationen Externe aggregierte Sicht Relative Anteile der einzelnen Alternativen nach Marktsegment Theorie diskreter Entscheidungsmodelle

Logit- und nested Logit-Modell Entscheidungskriterium: Nutzen einer Alternative i: Ui = Vi + εi Aus externer Sicht deterministischer bzw. stochastischer Alternativennutzen V ist eine beliebige Funktion, z.B. linear-separabel: Vi = alti + ∑ bk • xk, i k Alternativenauswahlwahrscheinlichkeiten: Logit-Modell εi sind unabhängig und identisch Gumbel-verteilt Modus  f() Nested Logit-Modell PKW Taxi Mietwagen Bus S-Bahn Fernzug Individualverkehr Öffentlicher Verkehr P(PKW) = P(IV) • P(PKW | IV) P(i | ck) = exp(μVi) / ∑exp(μVj) jÎck P(ck) = exp(μkVk) / ∑exp(μlVl ) l c Vk = 1/μ ln∑exp(μVj) E(Max. Nutzen eines Clusters ck): j P(i) = exp(μVi) / ∑exp(μVj) Keine Abbildung von stochastischen Korrelationen möglich! Theorie diskreter Entscheidungsmodelle

IIA-Eigenschaft Independence from Irrelevant Alternatives (IIA): Nested Logit-Modell und IIA? Independence from Irrelevant Alternatives (IIA): „Das Verhältnis zweier Auswahlwahrscheinlichkeiten ist (im Logit-Modell) ausschließlich von den Eigenschaften der beiden betrachteten Alternativen abhängig.“ ∑exp(μVj ) jÎc1 exp(μV1) jÎc2 exp(μV2) P(c1) • P(1 | c1) P(c2) • P(2 | c2) = ∑exp(μlVl ) l c exp(μ1V1) exp(μ2V2) • ∑exp(μVj ) jÎc1 exp(μV1) jÎc2 exp(μV2) P(c1) • P(1 | c1) P(c2) • P(2 | c2) = ∑exp(μlVl ) l c exp(μ1V1) exp(μ2V2) • Zwei Fälle werden unterschieden: Beide Alternativen aus demselben Cluster  ja Beide Alternativen aus verschiedenen Clustern  nein exp(μVi) exp(μVj) exp(μVi) / ∑exp(μVj) k exp(μVj) / ∑exp(μVj) P(i) P(j) = exp(μVi) exp(μVj) exp(μVi) / ∑exp(μVj) k exp(μVj) / ∑exp(μVj) P(i) P(j) = Schätzung der generischen Modellparameter auf einer Alternativenteilmenge möglich Modellparameterschätzung auf einer Alternativenteilmenge möglich? Theorie diskreter Entscheidungsmodelle

Theorie diskreter Entscheidungsmodelle Konzept der Gruppen Generalized Neural Logit-Modell Allgemeines Modell zur Prognose von Flughafen- und Zugangsverkehrsmittelwahl

Cluster- und Alternativengruppen Ziel: Entwicklung eines allgemeinen szenariotauglichen Modells Evaluierung bisher nicht-existenter Alternativen Vorgehen: Gruppierung der Alternativen bzw. Cluster Identische Varianz-Kovarianz-Matrix Alternativenspezifische Variablen μk alti Konzept der Gruppen

Flughafen (IATA-Code) Flughafenkategorien Kategorie Flughafen (IATA-Code) FH1 Frankfurt a. M. (FRA) München (MUC) FH2 Düsseldorf (DUS) Hamburg (HAM) Köln/Bonn (CGN) Stuttgart (STR) FH3 Bremen (BRE) Dortmund (DTM) Dresden (DRS) Erfurt (ERF) Frankfurt Hahn (HHN) Friedrichshafen (FDH) Hannover (HAJ) Karlsruhe/Baden (FKB) Leipzig/Halle (LEJ) Lübeck (LBC) Münster/Osnabrück (FMO) Niederrhein (NRN) Nürnberg (NUE) Paderborn/Lippstadt (PAD) Saarbrücken (SCN) Frankfurt/Main Düsseldorf Dortmund Köln … Flughafen Klassisch: Durchschnittliche Angebotsstruktur (absolut): Durchschnittliche Angebotsstruktur (in %): Flüge pro Woche Anzahl Ziele LCBRD CCBRD LBRD LCEUR CCEUR LEUR LCINT CCINT LINT NUMBRD NUMEUR NUMINT FH1 106 16 756 32 225 2138 49 517 19 144 83 FH2 104 7 348 129 153 487 11 17 80 12 FH3 3 1 47 25 39 6 22 LCBRD CCBRD LBRD LCEUR CCEUR LEUR LCINT CCINT LINT NUMBRD NUMEUR NUMINT FH1 3,18 0,43 20,39 0,87 5,83 55,81 0,00 1,24 12,25 8,31 60,27 31,42 FH2 8,97 0,58 28,27 11,65 11,76 37,24 0,02 0,71 0,79 16,23 74,62 9,16 FH3 1,29 0,86 39,22 32,57 15,57 10,05 0,42 19,94 78,90 1,16 Nachfrageorientierte Perspektive Kohonen‘s Self Organizing Maps Frankfurt/Main Düsseldorf Dortmund Köln … Flughafen / Flughafenkategorie FH1 FH2 FH3 FH2 … Generisch: LC: Low-Cost Carrier BRD: Deutschland CC: Charter Carrier EUR: Europa L: Liniencarrier INT: Interkontinental NUM: Anzahl Ziele „Flughafenkategorien entsprechen Produkttypen“ Konzept der Gruppen

Theorie diskreter Entscheidungsmodelle Konzept der Gruppen Generalized Neural Logit-Modell Allgemeines Modell zur Prognose von Flughafen- und Zugangsverkehrsmittelwahl

Funktionale Form der Nutzenfunktion Korrelationsstruktur Motivation des GNL Deterministische Nutzenkomponente Stochastische Nutzenkomponente Kombinationen von Nutzenfunktionen A priori nicht zu spezifizierende nichtlineare Nutzenfunktion Abbildung beliebiger Korrelationsstrukturen Künstliche neuronale Netze Bessere Abbildung individuellen Entscheidungsverhaltens Funktionale Form der Nutzenfunktion Korrelationsstruktur Nicht-konstanter Grenznutzen Interdependente Eigenschaftsbewertungen Komplexer Einfluss nicht-messbarer Alternativeneigenschaften Generalized Neural Logit-Modell

Pi = exp(ViLK) / ∑exp(VjLK) Elemente des GNL Nutzenfunktion Linearkombinationen Logit-Funktion Nutzenfunktion Linearkombinationen Logit-Funktion Nutzenfunktion Linearkombinationen Logit-Funktion Nutzenfunktion Linearkombinationen Logit-Funktion x x (a) Keine Präferenzkorrelationen (b) Vollständige Präferenzkorrelationen (c) Präferenzkorrelationen innerhalb von Clustern (d) Vollst. restr. Präferenzkorrelationen ex 1/x x x tanh(x) x x x ViLK = ∑γij • Vj jÎApLK Vi = f(xi) Pi = exp(ViLK) / ∑exp(VjLK) j Generalized Neural Logit-Modell

Komplexitätsgrad der Nutzenfunktion? Netzwerkspezifikation Komplexitätsgrad der Nutzenfunktion? 1. Schritt: Genetische Suche + Cross Validation 2. Schritt: Finale Parameterschätzung Ziel: Optimale Generalisierungsfähigkeit bei maximaler Information Overfitting f(x) x Underfitting Optimum zu wenige - Anzahl verdeckter Neuronen + zu viele Generalized Neural Logit-Modell

Theorie diskreter Entscheidungsmodelle Konzept der Gruppen Generalized Neural Logit-Modell Allgemeines Modell zur Prognose von Flughafen- und Zugangsverkehrsmittelwahl

Generalized Neural Logit-Modell Basisalternativen Alternativengruppen Abkürzung FH1/Pkw selbstgefahren FH1PKW FH1/Pkw gebracht FH1PKWG FH1/Mietwagen FH1MW FH1/Taxi FH1TAXI FH1/Bus FH1BUS FH1/S-Bahn FH1SB FH1/Fernzug FH1FZ FH2/Pkw selbstgefahren FH2PKW FH2/Pkw gebracht FH2PKWG FH2/Mietwagen FH2MW FH2/Taxi FH2TAXI FH2/Bus FH2BUS FH2/S-Bahn FH2SB FH2/Fernzug FH2FZ FH3/Pkw selbstgefahren FH3PKW FH3/Pkw gebracht FH3PKWG FH3/Mietwagen FH3MW FH3/Taxi FH3TAXI FH3/Bus FH3BUS FH3/S-Bahn FH3SB FH3/Fernzug FH3FZ FHi IVi ÖVi FHiPKW FHiPKWG FHiMW FHiTAXI FHiBUS FHiSB FHiFZ i=1, 2, 3 … Generalized Neural Logit-Modell Nested Logit-Modell Logit-Modell Allgemeines Modell zur Prognose von Flughafen- und Zugangsverkehrsmittelwahl

Modellschätzung und -anwendung Gruppierung der Alternativen Bildung von Teilsamples und Alternativenteilmengen Bildung eines neuen Gesamtsamples aus Teilsamples Schätzung der gruppenspe-zifischen Modellparameter Modellschätzung Auswahl von Flughäfen und Zugangsverkehrsmitteln Zuordnung der Alternativen zu Gruppen mit entspr. Parametern Durchführung der aufgaben-abhängigen Modellrechnungen Modellanwendung Konkreter Anwendungsfall Anwendbar auf beliebige Flughafen/Zugangsverkehrsmittelkombinationen Keine Begrenzung der Alternativenzahl Vorteile: Marktsegmente: BRD Europa Interkont Privat Geschäft Insgesamt jeweils 7 Marktsegmente Insgesamt 21 Modelle geschätzt: 7 Logit-Modelle 7 nested Logit-Modelle 7 Generalized Neural Logit-Modelle Beispiel: Studie für die Deutsche Bahn AG Untersuchungsgegenstand: Flughafen- und Zugangsverkehrsmittelwahl in Deutschland + Szenarien bezüglich der Flughafenanbindung Anzahl Flughäfen: 22 Anzahl Kombinationen Flughafen/Zugangsverkehrsmittel: 122 real, 154 potentiell Generische Variablen Alternativenspezifische Variablen Zugangsverkehrsmittelwahl am Flughafen München von Heidelberg aus Ohne Transrapidanschluss: Mit Transrapidanschluss: Teilsample Flughäfen (IATA-Code) BRE DTM FDH FKB HHN LBC LEJ NUE PAD FRA, HAM, BRE FRA, DUS, DTM MUC, STR, FDH FRA, STR, FKB FRA, DUS, HHN FRA, HAM, LBC FRA, HAM, LEJ MUC, STR, NUE FRA, DUS, PAD Clusterspezifische Variablen Allgemeines Modell zur Prognose von Flughafen- und Zugangsverkehrsmittelwahl

Vergleich der Modellansätze R2(null) in % R2(const) Marktsegment MNL NL GNL Diff. zu NL BRD P 55,94 57,41 61,35 3,94 42,71 43,82 49,74 5,92 BRD G 52,78 54,10 58,13 4,03 40,42 40,47 47,16 6,69 EUR K 50,74 52,40 58,09 5,69 41,22 41,94 49,99 8,05 EUR U 50,55 52,29 56,51 4,22 37,58 38,22 45,10 6,88 EUR G 45,81 48,58 51,96 3,38 34,34 35,96 41,79 5,83 INT P 45,36 48,89 55,10 6,21 29,43 32,86 42,01 9,15 INT G 44,41 47,46 56,01 8,55 25,76 28,30 41,26 12,96 R2(const) bis zu 45% (NL) bzw. 60% (MNL) höher Entspricht einem R2 der linearen Regression von 82% bis 92% Allgemeines Modell zur Prognose von Flughafen- und Zugangsverkehrsmittelwahl

Zusammenfassung und Fazit Wissenschaftliche und praxisbezogene Aspekte: Nested Logit-Ansatz Bester „konventioneller“ Ansatz Angewendet im Rahmen der strategischen Planung der DB AG Reviewed Presentation ATRS World Conference 2006, Nagoya/Japan Generalized Neural Logit-Ansatz Gleichbleibend hohe Modellgüte über alle Marktsegmente Ausgezeichnet mit dem Neil Mansfield Award auf der European Transport Conference 2006, Strasbourg/Frankreich Verfahren zur Entwicklung allgemeiner szenariotauglicher Modelle Neues flexibles diskretes Entscheidungsmodell Flughafen- und Zugangsverkehrsmittelwahlanalyse und -prognose Neuartige Lösung eines bestehenden Problems