Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Ausgleichungsrechnung II Gerhard Navratil Geostatistik Einführung Statistische Grundbegriffe Geostatistische Begriffe Variogramm Explorative Datenanalyse.

Ähnliche Präsentationen


Präsentation zum Thema: "Ausgleichungsrechnung II Gerhard Navratil Geostatistik Einführung Statistische Grundbegriffe Geostatistische Begriffe Variogramm Explorative Datenanalyse."—  Präsentation transkript:

1 Ausgleichungsrechnung II Gerhard Navratil Geostatistik Einführung Statistische Grundbegriffe Geostatistische Begriffe Variogramm Explorative Datenanalyse Prädiktion und Krigen

2 Ausgleichungsrechnung II Gerhard Navratil Was ist Geostatistik? Statistik, die sich auf die Erde bezieht Problem: Erde hält sich nicht immer an mathematisch wünschenswerte Eigenschaften (Stetigkeit) In verschiedenen Geowissenschaften ange- wendet (Geographie, Geologie, Geophysik etc.) Noel Cressie: Statistische Theorie im Zusam- menhang mit Prozessen, die mit räumlichen Indizes behaftet sind.

3 Ausgleichungsrechnung II Gerhard Navratil Definition Geostatistik (1) Modellierung von Daten als Realisierung eines Zufallsprozesses {Z(x):x D} wobei D der d-dimensionale Raum ist und x darin variieren kann. In der Praxis: Schätzungen aufgrund weniger Proben

4 Ausgleichungsrechnung II Gerhard Navratil Definition Geostatistik (2) Zeitlich-räumlicher Prozess: Dann definiert über {Z(x,t):x D, t T} Im folgenden: Datenbereich rein räumlich, auch wenn über größerer Zeitraum erhoben Gezeigt wird: Schließen von Daten an bekannten Orten auf den Prozess

5 Ausgleichungsrechnung II Gerhard Navratil Definition Geostatistik (3) Geostatistik = Anwendung stochastischer Prozesse in den Geowissenschaften Dient Analyse und Modellierung raum- bezogener Daten Bei einfacher Ausgleichungsrechnung Raumbezug nicht verwendet

6 Ausgleichungsrechnung II Gerhard Navratil Geostatistik = Arbeit im Team Daten verschiedenster Herkunft Teamarbeit, z.B. Geologe, Montanist, Finanzmanager, Statistiker Aufgaben des Statistikers –Erstellen eines Probenplanes –Zusammenfassen/Visualisieren der Daten –Suche nach Ausreißern/räuml. Strukturen –Schätzen von Gesamt-/Durchschnittswerten –Inter- und Extrapolation

7 Ausgleichungsrechnung II Gerhard Navratil Beispiele Exploration von Erzlagerstätten oder Erdölvorkommen Analyse von Bodenverunreinigungen Niederschlagsmengen/Temperaturwerte prädizieren Grundwassermodellierung

8 Ausgleichungsrechnung II Gerhard Navratil Datengewinnung z.B. Entnahme von Bodenproben Erfassung mittels Messgeräten Direkte Beobachtung

9 Ausgleichungsrechnung II Gerhard Navratil Verwendetes Beispiel Aus Cressie: Statistics for Spatial Data Messungen des Kohlengehaltes auf dem Gelände der Robena-Mine (Pennsylvania) Nahezu regelmäßiger Raster mit einer Maschenweite von 2500ft (~750m) Kein rechteckiges Gebiet

10 Ausgleichungsrechnung II Gerhard Navratil Statistische Grundbegriffe Momente einer Verteilung Quartil Median Interquartiler Bereich Quantile

11 Ausgleichungsrechnung II Gerhard Navratil Momente einer Verteilung Mittelwert (Moment 1. Ordnung) Streuung oder Standardabweichung (zentrales Moment 2. Ordnung) Schiefe (zentrales Moment 3. Ordnung) Normalverteilung charakterisiert durch Mittelwert und Streuung – nicht robust!

12 Ausgleichungsrechnung II Gerhard Navratil Quantil Wert, der den -Anteil der Daten von den übrigen (1- ) Daten abtrennt: -Quantil Angabe in Prozent: Perzentil Median: 50%-Perzentil oder 0,5-Quantil Quartile: –Unteres Quartil = 0,25-Quantil –Oberes Quartil = 0,75-Quantil

13 Ausgleichungsrechnung II Gerhard Navratil Interquartiler Bereich Bereich zwischen unterem und oberem Quartil (0,75-Quantil – 0,25-Quantil) Umfasst 50% der Daten Vergleichbar mit Streuung – hohe Stabilität Bei exakter Normalverteilung gilt

14 Ausgleichungsrechnung II Gerhard Navratil Geostatistische Begriffe Regionalisierte Zufallsvariable –Zufallsvariable –Zufallsprozess –Regionalisierte Zufallsvariable –Realisierung einer Zufallsvariable Stationarität

15 Ausgleichungsrechnung II Gerhard Navratil Zufallsvariable Z Ist eine (veränderliche) Größe Wird in einem zufälligen Versuch untersucht Nimmt verschiedene Werte an Hat eine Verteilung (also Erwartungswert, Streuung, etc.)

16 Ausgleichungsrechnung II Gerhard Navratil Zufallsprozess Z(t) Ist eine Zufallsvariable Nach einem Parameter t geordnet (meist nach der Zeit) Besitzt somit statistische Verteilung und zeitliche Struktur (=Abhängigkeit) Abhängigkeit beschrieben durch Kovarianzfunktion

17 Ausgleichungsrechnung II Gerhard Navratil Regionalisierte Zufallsvariable Auch: Räumlicher Zufallsprozess Z(x) Zufallsvariable mit räumlicher Struktur Parameter x ist ein Ortsvektor im d- dimensionalen Raum Besitzt somit statistische Verteilung und räumliche Struktur (=Abhängigkeit) Abhängigkeit beschrieben durch Variogramm bzw. Kovariogramm Keine Vergangenheit/Gegenwart/Zukunft Dimension (theoretisch) nicht beschränkt

18 Ausgleichungsrechnung II Gerhard Navratil Realisierung einer Zufallsvariablen Ist im allgemeinen ein skalarer Wert z(x) Kann ein geometrischer Messwert sein Aber auch: Schadstoffgehalt der Luft, Gesteinsdichte, Lärmpegel, etc.

19 Ausgleichungsrechnung II Gerhard Navratil Geostatistik Statistische Untersuchung von Daten- sätzen, die mit Orten verknüpft sind, also regionalisierte Zufallsvariablen Annahme: Bestimmte Struktur, also Korrelation zwischen z(x) und z(x+h) Beschrieben durch Variogramm/Kovario- gramm

20 Ausgleichungsrechnung II Gerhard Navratil Stationarität Bestimmung der Parameter der Ver- teilungsfunktion: Mehrere Datensätze an jedem Punkt nötig Ist meist nicht möglich (mehrere Boden- proben?) oder zu teuer Annahme: Eigenschaften ändern sich nicht mit dem Ort – ist meist erfüllt wenn vorausgehende Transformationen erlaubt (Elimination des Trend)

21 Ausgleichungsrechnung II Gerhard Navratil Intrinsische Stationarität (1) Für jedes Z(x) existiert ein Erwartungswert E(Z(x)), der unabhängig vom Ort x ist Insbesondere gilt auch also frei von einem Trend Erwartungswert geschätzt aus Proben zu

22 Ausgleichungsrechnung II Gerhard Navratil Intrinsische Stationarität (2) Für jedes Z(x) existiert eine Varianz Var(Z(x)), die unabhängig vom Ort x ist Varianz kann aus empirischen Proben geschätzt werden zu

23 Ausgleichungsrechnung II Gerhard Navratil Intrinsische Stationarität (3) Die Varianz der Differenz Z(x 1 ) – Z(x 2 ) ist nur von der relativen Lage der Orte abhängig mit h=x 1 –x 2 Wenn alle drei Bedingungen erfüllt: homogen und isotrop

24 Ausgleichungsrechnung II Gerhard Navratil Variogramm (1) Beschreibt die Korrelation zwischen räumlich strukturierten Realisierungen einer regionalisierten Zufallsvariablen Für homogene, isotrope Felder definiert als Aus empirischen Daten für Abstand h (lag) geschätzt als Anzahl der Messwertpaare mit Abstand h

25 Ausgleichungsrechnung II Gerhard Navratil Variogramm (2) Praktische Berechnung: Oft Einteilung in Abstandsklassen - Aus n Werten alle n(n-1) / 2 Paare gebildet, für jedes Paar Abstand und Quadrat der Messwertdifferenz gebildet in äquidistente Klassen geteilt Variogrammwert dann Variogramm definiert als 2, Semi- Variogramm ist das halbe Variogramm

26 Ausgleichungsrechnung II Gerhard Navratil Eigenschaften (1) Verhalten im Bereich des Ursprungs: (0)=0 In der Praxis: Bei Messwerten mit kleinem Abstand tritt Differenz auf = Nugget Effekt Ursachen: Letzte Information zu Nullpunkt extrapoliert, Medium hat kleinste Körnung (Microscale Effect), Messgenauigkeit Microscale und Messgenauigkeit als stochastisch unabhängig modelliert

27 Ausgleichungsrechnung II Gerhard Navratil Eigenschaften (2) Varianz des Zufallsfeldes Mit wachsendem h steigt das Variogramm Oft ab Schwellenwert konstant (Kovarianz gleich Null) Korrelationsweite (range): Ab hier Differenz zwischen Funktionswert und Varianz kleiner als gewählter Wert Grenzwert: Schwellenwert (sill)

28 Ausgleichungsrechnung II Gerhard Navratil

29 Ausgleichungsrechnung II Gerhard Navratil Theoretische Variogramme (1) Nugget Effekt aus kürzesten Paaren er- mittelt, über Paare in bestimmtem Abstand diskrete Funktionswerte für 2, aber keine eindeutige Funktion! Ergebnis kann sich mit anderen Klassen- größen erheblich ändern Funktion muss bestimmte Bedingungen erfüllen, unterschiedliche Modelle entwickelt

30 Ausgleichungsrechnung II Gerhard Navratil Theoretische Variogramme (2) Lineares Modell kein Schwellenwert Sphärisches Modell Exponentielles Modell Schwellenwert

31 Ausgleichungsrechnung II Gerhard Navratil Theoretische Variogramme (3) Rational-quadratisches Modell Wellen-Modell Potenz-Modell

32 Ausgleichungsrechnung II Gerhard Navratil Linear Spärisch Exponentiell Rational-quadratisch Wellen Potenz

33 Ausgleichungsrechnung II Gerhard Navratil Anisotrope Variogramme Bisher h immer Vektor – sinnvoll, wenn ab- hängig von Richtung (Staubimmissionen und Wind) Anisotropie oft mit Transformationen behebbar Im Allgemeinen: Isotrope Variogramme mit (d,d)-Matrix A zur Transformation geometrische Anisotropie

34 Ausgleichungsrechnung II Gerhard Navratil Kovariogramm/Korrelogramm (1) Kovariogramm beschreibt wie Variogramm die räumliche Struktur. Bei Stationarität definiert durch Entspricht Autokovarianzfunktion bei Zeitprozessen Korrelogramm: Normieren, also

35 Ausgleichungsrechnung II Gerhard Navratil Kovariogramm/Korrelogramm (2) Beziehungen Variogramm und Kovariogramm können ineinander übergeführt werden, wenn stationär

36 Ausgleichungsrechnung II Gerhard Navratil Explorative Datenanalyse Datenmaterial prüfen auf –Ausreißer –Verteilung –räumliche Struktur Grundsätzlich: Daten, die nicht zum Modell passen, sollen erkannt werden Modell meist Gaußsches Modell Ausreißer über bekannte Tests Räumlicher Modellanteil: Daten die nicht zu ihren Nachbarn passen

37 Ausgleichungsrechnung II Gerhard Navratil Visualisierung Einfache Methoden: Histogramme, Stamm-und-Blatt Darstellung, Box-Plot Kandidaten für Ausreißer über Betrachten der Darstellung Nächster Schritt: Visualisierung der räumlichen Struktur – z.B. Lageplots der Messpunkte, Tabellen mit Messwerten, axonometrische 3D-Darstellung Stationarität, Trend

38 Ausgleichungsrechnung II Gerhard Navratil Unterscheidet sich stark von den Übrigen Werten – Ausreißer?

39 Ausgleichungsrechnung II Gerhard Navratil

40 Ausgleichungsrechnung II Gerhard Navratil Ausreißer fast nicht sichtbar!

41 Ausgleichungsrechnung II Gerhard Navratil Trendermittlung (1) Bisherige Methoden: Veranschaulichung Reihen- und spaltenweises Ermitteln von Mittelwert und Median: Trend bzw. nicht stationäre Stellen Stationär: Median = Mittelwert Ausreißer: Überdurchschnittlich große Differenz

42 Ausgleichungsrechnung II Gerhard Navratil Trendermittlung (2) Annahme: Werte unabhängig und gleich- verteilt, Erwartungswert, Varianz, Dichtefunktion f Mittelwert: Median: Es gilt und normiert die Differenz

43 Ausgleichungsrechnung II Gerhard Navratil Anscheinend Trend in Ost-West-Richtung In einigen Zeilen/Spalten Abstand Mittelwert-Median Groß – Ausreißer?

44 Ausgleichungsrechnung II Gerhard Navratil Bivariater Scatter-Plot (1) Methode um Ausreißer sichtbar zu machen X-Achse: Werte z(x) Y-Achse: Werte z(x+h) Ausreißer fallen deutlich aus dem Schema

45 Ausgleichungsrechnung II Gerhard Navratil Bivariater Scatter-Plot (2)

46 Ausgleichungsrechnung II Gerhard Navratil Prädiktion und Krigen (1) Bisher Daten an vorhandenen Stellen beurteilt Jetzt: Schätzen von Daten an Stellen, an denen nicht gemessen wurde Ausgang: Zufallsprozess von dem n Daten z(x i ) erhoben wurden, Daten werden verwendet um Prozess zu beschreiben Ziel: Prädiktion einer bekannten Funktion g

47 Ausgleichungsrechnung II Gerhard Navratil Prädiktion und Krigen (2) Einfachster Fall: Punktschätzung Häufig auch: Schätzen des Durchschnittes eines Blocks Gestaltung der Funktion ermöglicht Glättung, Filterung und Prädiktion Krigen: Prädiktionsform, abgeleitet von Methode der kleinsten Quadrate

48 Ausgleichungsrechnung II Gerhard Navratil Prädiktion und Krigen (3) Best: wirksam Linear: lineare Schätzfunktion Unbiased: erwartungstreu Estimator: Schätzer Kollokation war ähnlich aber ohne Erwartungstreue

49 Ausgleichungsrechnung II Gerhard Navratil Prädiktor (1) Prädiktor p(Z;x 0 ) schätzt Wert Z(x 0 ) auf- grund der Daten Z=(Z(x 1 ), …, Z(x n )) Verlustfunktion (loss function) L(Z(x 0 ),p(Z;x 0 )) Abweichung tatsächlicher Wert – prädizierter Wert Optimaler Prädiktor, wenn Bayessches Risiko E{L} minimal Häufige Verlustfunktion: Quadratfehler- verlust (squared-error loss)

50 Ausgleichungsrechnung II Gerhard Navratil Prädiktor (2) Lineare und nicht-lineare Ansätze möglich Im Folgenden: Linear, also Parameter l 1, …, l n, k so zu bestimmen, dass Erwartungswert minimal Eingesetzt in Verlustfunktion: Bayessches Risiko wird

51 Ausgleichungsrechnung II Gerhard Navratil Prädiktor (3) Mit und mit erhalten wir Minimaler Prädiktionsfehler: Diese Form der Prädiktion: Simple Kriging (einfaches Krigen) – nicht erwartungstreu aber geringster Prädiktionsfehler

52 Ausgleichungsrechnung II Gerhard Navratil Gewöhnliches Krigen (1) Wieder Daten an n Punkten bekannt, Prädiktionsfunktion wie vorher Weitere Annahmen: 1. Bed.: Mittelwert für alle Werte gleich stationärer Zufallsprozess, Beschreibung durch Variogramm 2. Bed.: Erwartungstreue

53 Ausgleichungsrechnung II Gerhard Navratil Gewöhnliches Krigen (2) Verlustfunktion wie vorher Zu minimieren ist Unter der Bedingung können wir schreiben

54 Ausgleichungsrechnung II Gerhard Navratil Gewöhnliches Krigen (3) Wenn das Modell gilt, können wir schreiben Ableitung nach i und m gleich Null gesetzt gibt

55 Ausgleichungsrechnung II Gerhard Navratil Gewöhnliches Krigen (4) In Vektorform Aufgelöst nach i ergibt sich Ergebnis ändert sich nicht, wenn statt Variogramm (h) das Variogramm (h)+c verwendet wird (ev. stabilere Numerik) Mittlerer Prädiktionsfehler (Krige-Varianz)

56 Ausgleichungsrechnung II Gerhard Navratil A-priori-Prädiktion Wenn Variogramm bekannt, kann ein geplanter Probenplan a priori untersucht werden Notwendige Koeffizienten ergeben sich aus Abstand der Punkte und Variogramm

57 Ausgleichungsrechnung II Gerhard Navratil Einfluss des Nugget-Effektes (1) Aufgliederung notwendig: Abweichungen (x) setzen sich zusammen aus stationärem Prozess und Messrauschen: Wenn Z(x) mit dem vorigen Formelapparat prädiziert, dann Wert mit Störeinflüssen eigentlich nur erlaubt wenn (x)=0 Anteil aufgrund eines stationären Prozesses Anteil aufgrund des Messrauschens

58 Ausgleichungsrechnung II Gerhard Navratil Einfluss des Nugget-Effektes (2) Richtiger: Messfehlerfreie Version von Z prädizieren (richtiger Wert ist gesucht!) Es gilt oder Dann gilt Zu minimieren ist also Und man kommt auf

59 Ausgleichungsrechnung II Gerhard Navratil Universal Kriging Erweitert die Theorie des Ordinary Kriging Statt neue Annahme Summe: Linearkombination aus bekannten Werten mit unbekannten Parametern, die den Mittelwert beschreibt Besteht aus beliebigen Funktionen p, daher sehr universell

60 Ausgleichungsrechnung II Gerhard Navratil ENDE


Herunterladen ppt "Ausgleichungsrechnung II Gerhard Navratil Geostatistik Einführung Statistische Grundbegriffe Geostatistische Begriffe Variogramm Explorative Datenanalyse."

Ähnliche Präsentationen


Google-Anzeigen