Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Wie schätzt man die Zahl der Fische in einem See? (Maximum-Likelihood-Schätzung) Prof. Dr. Michael Schürmann April 2007.

Ähnliche Präsentationen


Präsentation zum Thema: "Wie schätzt man die Zahl der Fische in einem See? (Maximum-Likelihood-Schätzung) Prof. Dr. Michael Schürmann April 2007."—  Präsentation transkript:

1 Wie schätzt man die Zahl der Fische in einem See? (Maximum-Likelihood-Schätzung) Prof. Dr. Michael Schürmann April 2007

2 1.Schätzen 2. Maximum-Likelihood 3. Testen

3 1. Schätzen

4 Das Gourmant-Restaurant Zum Fröhlichen Karpfen verfügt über einen hauseigenen Fischteich, dessen Bestand in den letzten Jahren nicht mehr kontrolliert wurde. Was könnten sie tun? Die Restaurantbesitzer möchten sich nun einen ungefähren Überblick über den Fischbestand ihres Teiches verschaffen.

5 Vorschläge Sie könnten ein U-Boot einsetzen und jeden vorbeischwimmenden Fisch fotografieren. Bei der späteren Auswertung müssten dann Doppel- zählungen erkannt werden. Sie könnten das Wasser des Teiches abpumpen. Wenn der Teich fast leer ist, sollte es möglich sein, die (armen) Fische direkt zu zählen. Sie könnten eine Woche ununterbrochen angeln. Die Ausbeute soll dann mithilfe der berühmten Formel des bekannten Statistikers Prof. Dr. Reiner Unsinn auf die geschätzte Gesamtzahl der Fische im Teich hochgerechnet werden.

6 Bessere Idee Die Restaurantbesitzer gehen so vor: Sie fahren mit dem Ruderboot auf den Teich heraus und fangen mit dem Spezialnetz eine größere Anzahl von Fischen, die sie, ohne diese zu verletzen, mit einem kleinen weißen Punkt markieren. Danach geben sie die markierten Fische zurück in den Teich. (Achtung Tierschützer: Die Farbe ist biologisch abbaubar und vollkommen neutral gegenüber der empfindlichen Fischhaut!)

7 Nachdem einige Tage vergangen sind, fahren die Restaurantbesitzer wieder hinaus auf den Teich, um erneut eine bestimmte Anzahl von Fischen zu fangen. n Zahl der Fische im Teich N Zahl der markierten Fische m Zahl der beim 2. Mal gefangenen Fische k Zahl der markierten Fische beim 2. Fang bekannt unbekannt Sie notieren die Zahl der Fische, die bei diesem 2. Fang eine Markierung aufweisen.

8 Für diejenigen, die ausschmückender Text eher verwirrt, formulieren wir das Problem noch einmal etwas trockener als Urnenproblem. Die Zahl n der (weißen) Kugeln in einer Urne soll bestimmt werden. Dazu zieht man N Kugeln und ersetzt sie durch rote Kugeln, d. h. in der Urne befinden sich jetzt N rote und n – N weiße Kugeln. (Dazu muss natürlich n größer als N sein.) Dann zieht man erneut, diesmal m Kugeln, und notiert die Anzahl k der roten Kugeln bei dieser 2. Ziehung. Gut mischen!

9 n Zahl der Kugeln in der Urne N Zahl der roten Kugeln m Zahl der beim 2. Mal gezogenen Kugeln k Zahl der roten Kugeln bei der 2. Ziehung bekannt unbekannt

10 Offenbar kann k jeden Wert annehmen zwischen 0 und m, wenn die Zahl N größer oder gleich m ist (was wir annehmen). Es ist nun nahe liegend zu vermuten, dass der prozentuale Anteil der roten Kugeln in der Urne mit dem der roten Kugeln bei der 2. Ziehung annähernd übereinstimmt, dass also der Quotient aus m und k ungefähr gleich dem Quotienten aus n und N sein sollte: Dies führt zu der Schätzung

11 Schätzung für die Gesamtzahl der Fische im See: Dabei bezeichnet die rechte Seite die größte natürliche Zahl kleiner oder gleich m/k N. (Man könnte auch diejenige natürliche Zahl nehmen, die dem Wert m/k N am nächsten kommt.)

12 Wir wollen ausrechnen, wie groß die Wahrscheinlichkeit ist, k rote Kugeln zu ziehen, wenn die Werte für n, N und m festliegen. Mathematischer Hintergrund Wir überlegen uns zunächst, wie viele Möglichkeiten es überhaupt gibt, m Kugeln aus n Kugeln auszuwählen.

13 Dazu stellen wir uns vor, dass die m Kugeln der Reihe nach vor uns liegen. (Nachher müssen wir noch berücksichtigen, dass es auf die Reihenfolge nicht ankommt und wir des- wegen jetzt zunächst einige Fälle mehrfach zählen.) Für die erste Kugel gibt es noch n Möglichkeiten, für die zweite dann n – 1, für die dritte n – 2 u. s. w. Schließlich gibt es für die Kugel Nr. m n – m + 1 Möglichkeiten insgesamt also n (n – 1 ) (n – 2 ) … (n – m + 1 ) Möglichkeiten. …………

14 Diese Zahl müssen wir noch wegen der erwähnten Mehrfachzählungen durch m (m – 1 ) … dividieren...

15 Binomialkoeffizienten Wir erhalten den Binomialkoeffizienten Anzahl der Möglichkeiten, aus n Kugeln m auszuwählen

16 Anzahl der Möglichkeiten, bei der zweiten Ziehung genau k rote Kugeln (d. h. k rote und m – k weiße Kugeln) zu ziehen: Also: (Hypergeometrische Verteilung)

17 2. Maximum-Likelihood

18 Likelihood-Funktion Der Quotient der Likelihood-Funktion für 2 aufeinander- folgende Werte ergibt sich zu Eine weitere Rechnung zeigt: Rechnen!

19 Schlägt genau um bei unserem Schätzwert !! Maximum-Likelihood-Schätzer

20 Die Wahrscheinlichkeit für das beobachtete k wird bei unserem geschätzten Wert für n am größten.

21 Sternschnuppen Man möchte eine Schätzung abgeben über die Zahl der Sternschnuppen, die in einer (sternenklaren) Nacht zwischen 11 und 1 Uhr beobachtet werden können. Dazu teilen wir das Zeitintervall von 2 Stunden in genügend kleine Teilintervalle, 111 so dass man nicht mehr als eine Sternschnuppe in einem Teilintervall beobachten kann, z. B.

22 2 x 60 min = 120 min 4000 gleich lange Teilintervalle Ein Teilintervall dauert dann 120 min : 4000 = 0,03 min = 0,03 x 60 sec = 1,8 sec Außerdem nehmen wir an, dass sich die Zahl der beobachteten Sternschnuppen in den einzelnen Teilintervallen nicht beeinflussen, dass also z. B. die Zahl der Sternschnuppen im 10. Intervall keinen Einfluss auf die Zahl der Sterschnuppen im 19. Intervall hat.

23 Zahl der beobachteten Sternschnuppen im 1., …., Intervall Zahl der insgesamt von 11 bis 1 Uhr beobachteten Sternschnuppen Wahrscheinlichkeit, k Sternschnuppen zu beobachten (Binomialverteilung)

24 p ist die Wahrscheinlichkeit, dass in einem Intervall eine Sternschnuppe kommt. Man kann annehmen, dass die Wahrscheinlichkeit, eine Sternschnuppe in einem kleinen Intervall zu beobachten, proportional zur Länge des Intervalls ist. Da die Länge eines Teilintervalls bei n gleich langen Intervallen gleich 120 x 60 sec : n ist, können wir annehmen, dass p proportional zu 1 : n ist, d. h. p n ist gleich einer Konstanten, die wir λ nennen. Dann ist 1 - p die Wahrscheinlichkeit, dass in einem Intervall keine Sternschnuppe kommt.

25 Poisson-Verteilung

26 Problem: Man schätze λ ! Dazu führen wir unsere Beobachtung der Zahl der Sternschnuppen in 4 verschiedenen Nächten durch und erhalten die folgende Tabelle: Abend Nr. Zahl Sternschnuppen

27

28 Likelihood-Funktion

29 Maximum bei der mittleren Anzahl der Sterschnuppen, d. h. bei ( ) : 4 = 1,5 Maximum-Likelihood-Schätzung für λ ist somit 1,5 Mit der Formel kann man nun die geschätzten Wahrscheinlichkeiten dafür angeben, dass in einer Nacht k Sternschnuppen gesehen werden.

30 Zum Beispiel ergibt sich für 4 Sternschnuppen eine geschätzte Wahrscheinlichkeit von

31 3. Testen

32 TESTS

33 Obstbauer Meyer Obstbauer Meyer aus Halberstadt Müller möchte die Äpfel nur dann kaufen, wenn ein Apfel im Durchschnitt nicht wesentlich weniger als 140 g wiegt. Da die beiden im Herbst nicht jeden Apfel wiegen können (um dann das durchschnittliche Gewicht zu berechnen), kommen sie überein, den folgenden Test durchzuführen: Werbespruch: Wer keine weiche Birne hat, kauft harte Äpfel aus Halberstadt! Obstgroßhändler Müller verhandelt mit dem Obstgroßhändler Müller über die Abnahme der diesjährigen Apfelernte.

34 Sie werden 16 zufällig herausgegriffene Äpfel der in Frage kommenden Ernte wiegen. Liegt nun der Durchschnitt der 16 Apfelgewichte über 140 g, so will Müller kaufen, liegt er unter 140 g, dann schließt er das Geschäft mit einem anderen Obstbauern ab.

35 Damit ist Meyer nicht einverstanden. Will es der Zufall, so erwischen die beiden besonders leichte Äpfel, und das Durchschnittsgewicht gibt die wahren Verhältnisse nicht wieder. Meyer meint, hier müsse ein anderer Weg beschrit- ten werden! Müller, der BWL studiert hat und sich seiner Statistik- kenntnisse erinnert, sinniert:

36 Dann müssten wir uns vorher einigen, wie groß diese Wahrscheinlichkeit maximal sein darf, und dann müssten wir entsprechend den Schwellenwert des Gewichts festlegen, der meine Entscheidung bestimmt. Man müsste die Wahrscheinlichkeit berechnen, dass ich mich aufgrund der gemessenen Apfelgewichte gegen den Kauf entscheide, obwohl die Äpfel in Wirklichkeit ein mittleres Gewicht von über 140 g aufweisen.

37 Ablehnungsbereich Es wird ein mittleres Gewicht gemessen, das unter dem Schwellengewicht liegt. Annahmebereich Es wird ein mittleres Gewicht gemessen, das über dem Schwellengewicht liegt. Test der Nullhypothese, dass das Gewicht über 140 g liegt

38 Hypotheseakzeptiert Hypothese abgelehnt Hypothesewahr Hypothese falschEntscheidungRealität Fehler 1. Art Fehler 2. Art

39 Bei den Verhandlungen über die Irrtumswahrscheinlichkeit (Fehler 1. Art) einigen sich Meyer und Müller auf die üblichen 5%. Verteilung des Apfelgewichtes: Gauß-Verteilung (= Normalverteilung) Wahrscheinlichkeit, dass ein Ei weniger als 55 g wiegt = rote Fläche unter der Kurve Leider keine Apfelkurve gefunden …

40 Die Gauß-Verteilung besitzt zwei Parameter:

41 Erwartungswert Varianz

42 Die Gauß- oder Normalverteilung

43 Beispiel Äpfeln Gewicht von Äpfeln Gewicht von Äpfeln aus Meyers Obstplantage Schätzer von : (angenommene Varianz: 249,64)

44 Durchschnittsgewicht der 16 Äpfel Schwellengewicht, unter dem Müller ablehnt Das Schwellengewicht, so dass diese Wahrscheinlichkeit gerade bei 0,05 Normalverteilung liegt, lässt sich mit Hilfe der Normalverteilung berechnen.

45 Es ergibt sich: In unserem Beispiel beträgt das Durchschnittsgewicht der 16 Äpfel ca. 133, 06 g und liegt damit knapp unter dem Schwellengewicht 133, 5 g. Müller wird also den Handel mit Meyer nicht abschließen.


Herunterladen ppt "Wie schätzt man die Zahl der Fische in einem See? (Maximum-Likelihood-Schätzung) Prof. Dr. Michael Schürmann April 2007."

Ähnliche Präsentationen


Google-Anzeigen