13 2. Eine Anwendung der Spline-Glättung in der Versicherungsmathematik: Geographische Prämienschätzung durch räumliche Whittaker-Glättung 2.1 Vorbemerkungen.

Slides:



Advertisements
Ähnliche Präsentationen
Christian Scheideler SS 2009
Advertisements

Punkt-in-Polygon-Verfahren III (R/R+-Baum)
Definition [1]: Sei S eine endliche Menge und sei p eine Abbildung von S in die positiven reellen Zahlen Für einen Teilmenge ES von S sei p definiert.
Rekursion: Rekurrenz: Algorithmen rufen sich selbst (rekursiv) auf.
Falls Algorithmen sich selbst rekursiv aufrufen, so kann ihr Laufzeitverhalten bzw. ihr Speicherplatzbedarf in der Regel durch eine Rekursionsformel (recurrence,
Eine dynamische Menge, die diese Operationen unterstützt,
Stochastik und Markovketten
Gruppenwettbewerb. Gruppenwettbewerb Aufgabe G1 (8 Punkte)
Algebraische Zahlen: Exaktes Rechnen mit Wurzeln
Schnelle Matrizenoperationen von Christian Büttner
Vom graphischen Differenzieren
11. Matrizen. 11. Matrizen Eine mn-Matrix ist ein Raster aus mn Koeffizienten, die in m Zeilen und n Spalten angeordnet sind. = (aij)1  i  m, 1.
Default Logiken Zhao Li
Genetische Algorithmen für die Variogrammanpassung
Seminar „Extrapolationsmethoden für zufällige Felder“
1 1. Splineglättung 1.1 Motivation 1.2 Notation 1.3 Splineglättung
Theorie psychometrischer Tests, III
Algorithmentheorie 04 –Hashing
WS Algorithmentheorie 02 - Polynomprodukt und Fast Fourier Transformation Prof. Dr. Th. Ottmann.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Kapitel 5 Stetigkeit.
Kapitel 1 Das Schubfachprinzip
Kapitel 6 Differenzierbarkeit. Kapitel 6: Differenzierbarkeit © Beutelspacher Juni 2005 Seite 2 Inhalt 6.1 Die Definition 6.2 Die Eigenschaften 6.3 Extremwerte.
Beispiele für Gleichungssysteme
Ganzzahligkeit in LP-Modellen
Das freie Randwertproblem von Stokes
Christian Schindelhauer
Algorithmen des Internets 2005 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität 1 Materialien zu Übung 9 Bälle in Körbe Ranged.
F FnFn z Prof. Dr. Johann Graf Lambsdorff Universität Passau SS a. Anhang zur Bestimmung der optimalen Taylor-Regel.
Quaternionen Eugenia Schwamberger.
Konfidenzintervalle Intervallschätzung
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C( ) der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit,
Statistische Methoden I SS 2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.
Statistische Methoden I WS 2007/2008 Donnerstag, 31. Januar 2008 und Freitag, 1. Februar 2008 Probeklausur nächste Woche - statt Vorlesungen -
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird auf Montag, den 17. Mai verlegt! Zeit: 16 Uhr Ort: Kiste Nächste Woche!!!!
III. Induktive Statistik
Die Vorlesung am 14. Mai (Tag nach Himmelfahrt) wird verlegt. Der Nachholtermin wird noch bekannt gegeben.
Maximum-Likelihood-Schätzer ( diskreter Fall) Likelihood-Funktion mit oder M-L-Schätzer.
Heute: Scherenzange zeichnen
Folie 1 § 30 Erste Anwendungen (30.2) Rangberechnung: Zur Rangberechnung wird man häufig die elementaren Umformungen verwenden. (30.1) Cramersche Regel:
Tutorium
Tutorium
Vorlesung Biometrie für Studierende der Veterinärmedizin Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Variationsformalismus für das freie Teilchen
Effiziente Algorithmen
§24 Affine Koordinatensysteme
Ausgleichungsrechnung II
Beschreibung der energetischen Zustände der Elektronen
Regionalisierte Variablen und Kriging
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/ /23.1.
Information und Kommunikation
Information und Kommunikation
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Folie 1 Kapitel IV. Matrizen Inhalt: Matrizen als eigenständige mathematische Objekte Zusammenhang zwischen Matrizen und linearen Abbildungen Produkt von.
Polynome und schnelle Fourier-Transformation
Lineare Algebra, Teil 2 Abbildungen
Wahrscheinlichkeit Zufallsexperiment:
Kapitel 18 Dynamische Modelle: Schätzen der Parameter
Vorlesung Mai 2000 Konstruktion des Voronoi-Diagramms II
Strategie der Modellbildung
Lösen von quadratischen Ungleichungen
Analyseprodukte numerischer Modelle
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Informatik III Christian Schindelhauer Wintersemester.
Analyse der Laufzeit von Algorithmen
Vom graphischen Differenzieren
Klassen von Flächen Costa-Fläche
Der Wiener Prozess und seltene Ereignisse
Geoinformationssysteme
 Präsentation transkript:

13 2. Eine Anwendung der Spline-Glättung in der Versicherungsmathematik: Geographische Prämienschätzung durch räumliche Whittaker-Glättung 2.1 Vorbemerkungen Daten, deren Risiko ortsbedingt variiert (wie z.B. Diebstahl-Raten in der Hausratsversicherung) können fehlerhaft sein. Um eine Zuverlässige Schätzung dieser Daten zu erlangen, muss eine räumliche Glättung vorgenommen werden. Hierzu wird in der Versicherungs-Mathematik Whittaker-Graduation angewandt.

14 Unterteilung des Beobachtungsfensters in Postleitzahlengebiete. Fehler in den beobachteten Daten Unterschiede des Risikos in benachbarten Postleitzahlengebieten Diese Fehler müssen geglättet werden um den Einfluss des zugrundeliegenden geographischen Merkmals realistisch zu schätzen. 1989: Taylor wandte 2-dimensionale Spline-Funktionen auf dieses Problem an 1994: Boskow und Verall: Glättung der Daten benachbarter Regionen, die Fehler berücksichtigt. Hier wird nun ein ähnliches, aktuariell anerkanntes Verfahren vorgestellt, das einen Kompromiss zwischen Glätte und genauer Anpassung an die Beobachtungsdaten schließt.

Modell und Notation Wir betrachten eine Zufallsvariable X t 1,...t n, die durch n (n N) Parameter charakterisiert wird. Dabei bezeichne ein Parameter (z.B. t 1 )die räumlichen Koordinaten (x 1,x 2 ). Sei (n N) (Bei diesem Modell stellt die Zufallsvariable X t 1,...t n beispielsweise die Forderungs-Häufigkeit dar, und die Koordinaten ( x 1,x 2 ) repräsentieren das Zentrum einer Postleitzahlenregion)

16 Wir beschränken uns nun hier auf 3 Parameter i, j, k; Sei i = t 1, j = t 2, k = t 3, wobei i die räumlichen Koordinaten (x 1,x 2 ) der Postleitzahlenregion, und j und k andere, ortsunabhängige Einflussfaktoren (z.B.:Alter, Geschlecht einer Person) bezeichnen. Durch spezifische Werte von i, j, k wird nun eine Menge von Daten definiert. (Dabei seien die N ijk deterministische Größen; z.B. Dauer der Prämienzahlungen) Sei

17 Wir nehmen nun an, dass man den Erwartungswert folgendermaßen zerlegen kann: Dabei gehen wir davon aus, dass die jk aus früheren Schätzprogrammen bekannt sind und die i zu schätzen sind.

18 Definiere: (Dabei können die Y i als normierte Summe von Beobachtungen in der Region i aufgefasst werden.) Es gilt ==> Y i isoliert den Einfluss räumlicher Faktoren. Es wird angenommen, dass gilt Wobei ²>0 und

19 Beispiel: Seien N ijk X ijk unabhängig und Poisson-Verteilt: N ijk X ijk ~ Poi(N ijk ijk ) (dabei bezeichne X die Forderungs-Häufigkeit) Dann gilt: Wobei Wir werden nun i = (x i ), und Y i = Y(x i ) (x i R²) schreiben; da,Y: R² R Funktionen der räumlichen Koordinaten darstellen.

Whittaker-Glättung Historisches Whittaker entwickelte 1923 die Whittaker-Graduation 1932 wurde sie von Henderson in die aktuarielle Literatur eingeführt; anfangs nur 1-dimensionale Glättung; McKay und Wilkin verallgemeinerten das Verfahren auf 2 Dimensionen

21 Wir betrachten nun Punkte x i R²; Ziel der Whittakerglättung ist es glatte Schätzer f(x i ) für Y(x i ) zu finden. Wir Definieren ein Maß des Fehlers der beobachteten Daten: Die Menge{N i } als Menge von Gewichten zu verwenden ist dabei durchaus sinnvoll, da Var[Y i ]= ²/N i. (verallgemeinerte Methode der kleinsten Quadrate Gewichte w i =1/Var(x i ) )

22 Definiere: F = D +pJ Wobei J ein passendes Maß der Glätte von f(·) ist und p (p>0) eine Relativitätskonstante. vgl. Minimierungsproblem der Spline-Glättung Diese Konstante wird oft erfahrungsgemäß gewählt, obwohl es auch analytische Methoden gibt (Taylor (1992) und Verall (1993)) Kern der Whittaker-Glättung ist also {f (x i )} so zu wählen, daß F minimiert wird.

23 J hat dabei folgende Form: Mit f=f(x 1,x 2 ) Näherungsweise gilt dann mit und wobei e 1 =(1,0) und e 2 =(0,1)

Anwendung Wir sind bisher davon ausgegangen, dass die Punkte x i, an denen Werte vorliegen, in einem gleichmäßigen Gitter angeordnet sind. In der Realität sind die Punkte aber (meist) unregelmäßig verteilt, es lässt sich also keine Struktur erkennen. Problem: Wie sollen die Differenzen ² pq f(x i ) berechnet werden? Im Gitter-Modell waren sechs Werte von Y erforderlich, um die 3 Terme ² pq f(x i ) an einem festen x zu bestimmen. Wir brauchen also 6 Punkte, um f lokal durch eine quadratische Form Q x i (·) zu approximieren.

25 Eine mögliche Lösung wäre 5 Punkte nahe bei einem festen x i zu wählen, um eine quadratische Form an diese 6 Punkte anzupassen. Problem dabei: Hohe Sensibilität gegenüber Messfehlern an diesen Punkten große Unterschiede zwischen Funktionen Q x i (·), die durch verschiedene Punkte definiert werden. Alternative: Q x i (·) wird durch mehr als 6 Punkte bestimmt; sei m (m>6) die Anzahl dieser Punkte.

Anpassen einer quadratischen Funktion an m Punkte Betrachte eine quadratische Funktion Q: R² R. Seien x 1,...x m R² und y 1,...,y m R die beobachteten Werte : Explizit ausgeschrieben: mit x=(x 1,x 2 ), und gilt:

26 Also Durch Anwendung der Methode der kleinsten Quadrate erhält man den folgenden Schätzer q^ von q: ^ q^=Ay, Wobei A=(X T X) -1 X T, y=( y 1,...,y m ) T und X ist eine m 6 Matrix, die den Vektor [x j ] T in der j-ten Zeile hat.

Berechnen des Glättemaßes J Sei Mit x=(x 1,x 2 ) T, Koeffizientenvektor q und mit Seien x x i 1,...x x i m die m Punkte, die x i am nächsten liegen, mit x x i 1 = x i, und sei f x i =[f(x x i 1 ),...,f(x x i m )] T Vorher haben wir gesehen, dass q x i =A x i f x i, wobei A=(X x i T X x i ) -1 X x i T und X x i eine m 6 Matrix, die den Vektor [x j ] T in der j-ten Zeile hat.

29 Nun muss q x i =A x i f x i, anders geschrieben werden: q x i =B x i f Wobei f=[f( x 1 ),...,f(x n )] der Vektor ist, der alle beobachteten Werte Y(x i ) enthält, i=1,...,n; Und B x i ist die 6 n Matrix, die die m Spalten von A x i an derselben Stelle enthält, an der die m Komponenten von f x i in f vorkommen, und in allen anderen Spalten den Nullvektor stehen hat. Nun können die ² pq f(x) näherungsweise durch die entsprechenden Differenzen der Q x (x) berechnet werden, welche durch die ersten drei Komponenten von q x gegeben sind: (~ steht hier für nimm die ersten 3 Zeilen von)

30 Nun lässt sich J(x i ) als Quadratische Form von q x i ausdrücken: mit C=diag(1,2,1) Mit : Also ist J= J(x i ):

Whittaker-Glättung Das Whittaker-Kriterium F=D+pJ kann man auch in Matrix-Form schreiben: mit Durch Differenzieren nach f und Gleichsetzen der Ableitung mit Null, erhält man den glatten Vektor

32 Da F quadratisch ist in Y und f, löst eine Skalenveränderung in Y dieselbe Skalenveränderung in f aus, vorausgesetzt, p wird passend geändert. Dies erlaubt das nützliche Hilfsmittel, Y i durch zu ersetzen, wobei der Gesamtdurchschnitt aller i ist. Dadurch werden die Beobachteten Werte von Y i um die 1 verschoben, und für Erwartungswert und Varianz gilt nun:

Beispiel Beispiel Die folgenden Karten zeigen Residuenverhältnisse einer Regression. Die Residuenverhältnisse sind wie folgt definiert: Modell: X ijk : Forderungshäufigkeit Die Y i wurden wie oben beschrieben verändert, so dass sie alle um die 1 verteilt liegen. Die Legende zeigt die Residuenverhältnisse r in Prozent. m=10.

34

35