Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Die Regression als Werkzeug in der angewandten Mathematik Die Methode der kleinsten Quadrate gerechnet mit dem Solver von Excel. Linz 2009 Friedrich Tinhof.

Ähnliche Präsentationen


Präsentation zum Thema: "Die Regression als Werkzeug in der angewandten Mathematik Die Methode der kleinsten Quadrate gerechnet mit dem Solver von Excel. Linz 2009 Friedrich Tinhof."—  Präsentation transkript:

1 Die Regression als Werkzeug in der angewandten Mathematik Die Methode der kleinsten Quadrate gerechnet mit dem Solver von Excel. Linz 2009 Friedrich Tinhof BHAK Eisenstadt

2 Die Regression als Werkzeug in der angewandten Mathematik In der Praxis ist es oft notwendig einen formalen Zusammenhang zwischen zwei Variablen zu berechnen. Ein Beispiel dafür ist der Zusammenhang zwischen Körpergröße und Körpermasse. Mit der Regressionsanalyse wird versucht, den Zusammenhang von quantitativen Merkmalen in Form einer mathematischen Funktion anzugeben.

3 Die Regression als Werkzeug in der angewandten Mathematik Es geht dabei um: Erkennen und Nachweis von Zusammenhängen Beispiel: Beeinflusst die Einnahme ein neues Medikament die Höhe des Blutdruckes? Schätzung der Art und Größe von Zusammenhängen Beispiel: Wie stark beeinflusst die Einnahme einer bestimmten Dosis ein neues Medikament die Höhe des Blutdruckes? Prognose fehlender oder zukünftiger Werte Beispiel: Wie wird sich der Wert des Blutdrucks entwickeln, wenn man die Dosis des Medikamentes um 20% erhöht? (Man nimmt dabei an, dass sich die gemessene/berechnete Entwicklung fortsetzt.)

4 Die Regression als Werkzeug in der angewandten Mathematik Beispiel 1 Von fünf zufällig gewählten Schülerinnen wurden Körpergröße X und Körpermasse (Gewicht) Y gemessen. Gibt es einen (linearen) Zusammenhang zwischen den Merkmalen Körpergröße und Körpermasse? Welche Gerade ist für die Beschreibung des Zusammenhanges am besten geeignet? Gesucht ist eine Trendlinie, die den Zusammenhang der Merkmale X und Y am besten wiedergibt.

5 Die Regression als Werkzeug in der angewandten Mathematik Die Frage, welche die beste Näherungsgerade ist, klären wir zunächst mit Excel und erklären dann die Hintergründe. 1.Schritt: Geeignetes Punkt(XY) – Diagramm erstellen. 2.Schritt: Trendlinie hinzufügen (Mit rechter Maustaste Punkt anklicken) 3.Schritt: Typ und Optionen wählen und Trendlinie zeichnen

6 Die Methode der kleinsten Quadrate Ein kurzer Blick auf die Hintergründe Excel passt die Gerade mit der Gleichung y = a·x + b so an die Punkte des Streudiagrammes an, dass die Summe F der Fehlerquadrate e i (der vertikalen Abweichungen) minimal ist. Die Fehler e i heißen Residuen. Die Residuen sind die Differenz zwischen den Messwerten y i und den Modellwerten Y i = y(x i ). e1e1 e2e2 e3e3 e4e4 e5e5 Residuen e i lineare Funktion: Summe der Fehlerquadrate F(a,b): Residuen e i allgemein: Messwert y i Modellwert Y i = y(x i ) Schätzung des y-Wertes auf der Trendlinie Trendlinie Regressionsgerade

7 Die Methode der kleinsten Quadrate Ein kurzer Blick auf die Hintergründe F wird minimal, wenn Mit CAS können diese partiellen Ableitungen berechnet und das Gleichungssystem kann gelöst werden.

8 Wir berechnen zunächst die Streuung der Messwerte y i um den Mittelwert M der Messwerte. Varianz der y-Werte: Die Methode der kleinsten Quadrate Güte der Anpassung – das Bestimmtheitsmaß Abweichung vom Mittelwert = y i - M Messwert y i

9 Für jeden einzelnen x-Wert der Datenpunkte existiert auch ein dazugehöriger Schätzwert (Modellwert y(x i )) auf der Regressionsgeraden. Auch diese Modellwerte Y i = y(x i ) streuen um den Mittelwert M. Diese Streuung wird nun berechnet. Varianz der Modellwerte: Die Methode der kleinsten Quadrate Güte der Anpassung – das Bestimmtheitsmaß Modellwert Y i = y(x i ) Regressionsgerade y(x)

10 Die Güte der Regression ergibt sich aus dem Quotienten der Varianz der Modellwerte und der Varianz der Messwerte. Dieser Quotient wird Bestimmtheitsmaß R² genannt. Die Methode der kleinsten Quadrate Güte der Anpassung – das Bestimmtheitsmaß

11 Bestimmtheitsmaß R² R² ist genau dann gleich 1, wenn alle Datenpunkte auf der Regressionskurve mit y(x) liegen. In diesem Fall stimmen Datenpunkte und Modellwerte genau überein. Wenn die Streuung der Modellwerte gleich der Streuung der Datenpunkte ist, nimmt R² den maximal möglichen Wert 1 an. Streuung Datenwerte Streuung Modellwerte Streuung Datenwerte = Streuung Modellwerte R² = 1

12 Bestimmtheitsmaß R² Je weiter die Messwerte von der Trendlinie entfernt sind, umso größer ist die die Streuung der Datenpunkte im Verhältnis zur Streuung der Modellwerte. Es gilt 0 R² 1. R 2 ist das Verhältnis von erklärter Varianz zur Gesamtvarianz. Streuung der Residuen (nicht erklärte Streuung) Streuung der Modellwerte (erklärte Streuung) Gesamtstreuung

13 Regression mit EXCEL Der Solver von Excel ist ein leistungsstarkes Werkzeug zur Lösung von Optimierungsproblemen. Wir verwenden den Solver als Black Box. Der Solver wird bei der Standardinstallation von Excel (bis 2003) nicht automatisch installiert. In >Extras>Add-Ins…> Verfügbare Add-Ins muss der Solver ein- malig aktiviert werden.

14 Regression mit dem Solver von EXCEL Beispiel 1: Körpergröße 1.Schritt: Tabelle in Excel eingeben und den Mittelwert der Messwerte berechnen. 2.Schritt: Parameter a und b an geeigneter Stelle vorgeben. Die vorgegebenen Werte sind die Startwerte für den Solver. 3.Schritt: Spalte mit Modellwerten Y berechnen. D3: =$I$3*B3+$I$4

15 Regression mit dem Solver von EXCEL 4.Schritt: Spalte mit den Fehlerquadraten (y – Y)² erstellen und Spaltensumme berechnen. E3: =(C3-D3)^2 5.Schritt: Solver aufrufen 6.Schritt: Minimierung Zielzelle: E9 Veränderbare Zellen: I3:I4

16 Regression mit dem Solver von EXCEL Optional ist die Berechnung von R² Spalte mit (Y – M)² berechnen. (Streuung der Modellwerte)² F3: =(D3-$C$9)^2 Spalte mit (y – M)² berechnen. (Gesamtstreuung)² G3: =(C3-$C$9)^2 Spaltensummen und Quotienten der Spaltensummen berechnen. I5: =F8/G8

17 Regression mit dem Solver von EXCEL Hinweis: In Excel 2007 finden Sie den Solver bei den Analyse-Tools. Die Funktionsweise ist identisch wie in Excel 2003.

18 Regression mit dem Solver von EXCEL Beispiel 2: Berechnung der quadratischen Nachfragefunktion. Welchen maximalen Eintritt sind Sie bereit für eine bestimmte Ausstellung zu bezahlen?

19 Regression mit dem Solver von EXCEL Beispiel 2: Welchen maximalen Eintritt sind Sie bereit für eine bestimmte Ausstellung zu bezahlen? Weiterführende Berechnungen für x 190 : E(x) = p(x)·xErlösfunktion K(x) = 3x +150Gesamtkostenfunktion G(x) = E(x)- K(x)Gewinnfunkton Gewinnmaximum? Erlösmaximum?

20 Regression mit dem Solver von EXCEL Beispiel 3: Logistische Regression Entwicklung der Anzahl der Leser einer Tageszeitung

21 Regression mit dem Solver von EXCEL Beispiel 3: Logistische Regression

22 Regression mit dem Solver von EXCEL Beispiel 3: Weitere Berechnungen Für die folgenden Berechnungen verwenden wir die ermittelte Regressionsfunktion. a) Wie hoch ist die Sättigungsmenge? M 2,8 Mio. Leser b) Wann wurden 2 Mio. Leser erreicht? Für x = 20,14 wurden 2 Mio. Leser erreicht. Das war etwa 1980.

23 Regression mit dem Solver von EXCEL Beispiel 3: Weitere Berechnungen c) Wann war der Zuwachs der Leseranzahl maximal? Für x = 15,8 wurde ein Zuwachs von ca. 0,14 Mio. Leser erreicht. Das war ca.1975.

24 Regression mit dem Solver von EXCEL Beispiel 4: Sinusregression Ziel ist es eine Näherungsfunktion in der Form y = A·sin(B·x + C) +D für die Berechnung der Tageslänge zu finden.

25 Regression mit dem Solver von EXCEL Beispiel 4: Sinusregression Wichtig: Bei komplizierteren Regressionsrechnungen findet der Solver von Excel die optimalen Werte nur nach Vorgabe geeigneter Startwerte!

26 Regression mit dem Solver von EXCEL Beispiel 4: Sinusregression y = 224,077·sin(-0,01681·x -1,8169) + 729,719

27 Regression mit dem Solver von EXCEL Beispiel 4: Berechnungen mit der ermittelten Funktion y(x) = 224,077·sin(-0,01681·x -1,8169) + 729,719 a) An welchem Tag ist nach diesem Rechenmodell der längste Tag? Maximale Tageslänge am 173. Tag. Das ist der 22 Juni.

28 Regression mit dem Solver von EXCEL Beispiel 4: Weitere Berechnungen y(x) = 224,077·sin(-0,01681·x -1,8169) + 729,719 b) An welchem Tag ist nach diesem Rechenmodell der die größte Zunahme/Abnahme der Tageslänge zu beobachten? Größte Zunahme der Tageslänge am 79. Tag. Das ist der 20. März. Größte Abnahme der Tageslänge am 266. Tag. Das ist der

29 Regression mit dem Solver von EXCEL Beispiel 5: Arzneistoffe in Körper Ein Arzneistoff wird einmalig oral verabreicht. A(t) ist die Arzneistoffmenge, die zur Zeit t am Ort der Resorption (Depot; Mund, Magen, Darm) zur Aufnahme zur Verfügung steht. E(t) ist die Gesamtmenge des bereits ausgeschiedenen Arzneistoffes. Im Kompartiment X (Blut) erfolgt eine Absorption aus dem Depot A mit der Absorptionskonstanten k a. Gleichzeitig kommt es aber auch zu einer Elimination des Arzneistoffes mit der Eliminationskonstanten k e.

30 Regression mit dem Solver von EXCEL Beispiel 5: Arzneistoffe in Körper Für den zeitlichen Verlauf der Konzentration C(t) des Arzneistoffs im Blut gilt die Bateman-Funktion:

31 Regression mit dem Solver von EXCEL Beispiel 5: Propranolol oral Berechnung der Bateman–Funktion: Einer Versuchsperson wird einmalig oral eine Dosis des Betablockers Propranolol verabreicht. Die Konzentration C(t) des Arzneimittels im Blut wird gemessen und ist in der Tabelle rechts abzulesen. Die Bateman-Funktion ist zu ermitteln. Quelle: ETH Zürich 2006; Urs Kirchgraber und Heidi Wunderli–Allenspach;

32 Regression mit dem Solver von EXCEL Beispiel 5: Propranolol oral Berechnung der Bateman–Funktion

33 Regression mit dem Solver von EXCEL Beispiel 5: Propranolol oral Berechnung der Bateman–Funktion C3: =$H$2*$H$3/($H$3-$H$4)*(EXP(-$H$4*A4)-EXP(-$H$3*A4))

34 Regression mit dem Solver von EXCEL Beispiel 5: Propranolol oral Berechnung der Bateman–Funktion Für Propranolol ergaben sich die Werte k a 0,5 h –1 ; k e 0,18 h –1 und C 0 62 μg/l.

35 Regression mit dem Solver von EXCEL Beispiel 5: Berechnungen mit der ermittelten Funktion a) Wann ist die Konzentration im Blut am höchsten? Wie hoch ist sie? Die maximale Konzentration ist nach ca. 3,19 Stunden mit 34.9 μg/l erreicht. b) Wann ist die Konzentration unter die Nachweisgrenze von 0,2 μg/l gesunken? Nach ca. 34,3 Stunden ist die Konzentration unter 0.2 μg/l gefallen.

36 Regression mit dem Solver von EXCEL Beispiel 5: Weitere Berechnungen c) Wie lange wirkt das Medikament, wenn dazu eine Mindestkonzentration von 5 μg/l im Blut benötigt wird? Berechnen Sie die Wirkzeit. Wirkzeit – 0.17 = Stunden Latentzeit 0.17 Stunden (10 Min)

37 Regression mit dem Solver von EXCEL Beispiel 5: Propranolol oral d) Zu welchem Zeitpunkt ist die Aufnahmerate (Zunahme der Konzentration) am höchsten? Wann die Ausscheidungsrate (Abnahme der Konzentration)? Zu berechnen ist hier die maximale Änderung der Konzentration C. Wir berechnen die Extrema der ersten Ableitung der Bateman– Funktion. Die Aufnahmerate ist zum Zeitpunkt t = 0 maximal. Die Ausscheidungsrate ist nach t 6.39 h maximal (Wendepunkt).

38 Regression mit dem Solver von EXCEL Danke für Ihre Aufmerksamkeit!


Herunterladen ppt "Die Regression als Werkzeug in der angewandten Mathematik Die Methode der kleinsten Quadrate gerechnet mit dem Solver von Excel. Linz 2009 Friedrich Tinhof."

Ähnliche Präsentationen


Google-Anzeigen