Die Regression als Werkzeug in der angewandten Mathematik

Slides:



Advertisements
Ähnliche Präsentationen
Steigung m berechnen Man kann die Steigung auch berechnen,
Advertisements

Gruppenwettbewerb. Gruppenwettbewerb Aufgabe G1 (8 Punkte)
Physikalische Messgrößen
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Einführung Übersicht Einsatz der Zielwertsuche Einsatz des Solvers
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
WS Algorithmentheorie 08 – Dynamische Programmierung (2) Matrixkettenprodukt Prof. Dr. Th. Ottmann.
Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.
Nicht-Lineare Regression
Mehrfachregressionen
Quantitative Methoden I
2. Univariate Regressionsanalyse 2.1 Das statische Regressionsmodell
Willkommen zum Plenum.
K. Desch - Statistik und Datenanalyse SS05
Excel Kurs Teil II Allgemeines zu Excel-Funktionen, SUMME, MIN, MAX Mehrwertsteuer-Berechnungen, absolute und relative Bezüge F. Bäumer.
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Mögliche Funktionenklassen
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Rechenregeln für Mittelwert, Varianz und Streuung.
Datenmatrix.
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.
Datentabelle für 2 Merkmale
Zusammenfassen von Funktionen
zu Ihrer Weiterbildung! - Krankenhauswirtschaft -
Univariate Statistik M. Kresken.
(Gini-Koeffizient, Lorenz-Kurve)
Einfache Regressionsgleichung
Multikollinearität Wann spricht man von Multikollinearität?
Wiederholung: Einfache Regressionsgleichung
Chi Quadrat Test Tamara Katschnig.
Mathematik STATISTIK Viktoria Kozdron, 5AK VBS Augarten.
o. Univ.-Prof. Dr. H.-W. Holub und Mag. Dr. Janette Walde
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Kurvendiskussion Los geht´s Klick auf mich! Melanie Gräbner.
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Hartmut Klauck Universität Frankfurt SS
Klicken Sie in der Meldungsleiste auf Bearbeitung aktivieren,
Statistik: Mehr zur Regression.
Lineare Restriktionen
Einfache und multiple Regression
Ökonometrie I Modellvergleich (Übersicht) Ökonometrie I2 Vergleich von Modellen Fragestellungen für Modellvergleich 1.Fehlende Regressoren.
STATISIK LV Nr.: 0021 WS 2005/ November 2005.
Einführung ins Lösen von Textaufgaben (Textgleichungen)
Lineare Funktionen und ihre Schaubilder, die Geraden
Grundlagen der Datenanalyse
Bivariate Statistik M. Kresken.
Grundlagen des Solvers
Strategie der Modellbildung
Wirtschaftsmathematik
Stetige Kleinste-Quadrate-Approximation
Schnittpunkt von zwei Geraden
Fortgeschrittene Techniken
Computeria Wallisellen
Musterlösung zum Arbeitsblatt Nr. 1
Statistik – Regression - Korrelation
Vom graphischen Differenzieren
Einführung zur Fehlerrechnung
Die einfache/multiple lineare Regression
setzt Linearität des Zusammenhangs voraus
Die einfache/multiple lineare Regression
Geostatistik Kriging Sarah Böckmann.

Begriffe Ableitungen Rechnen mit Excel
Aufgabenstellung  gegeben ist die zeitliche Entwicklung der global gemittelten bodennahen Temperatur im Zeitraum (Dateiname= ytemp2m.obs, ascii-
Jennifer Staubmann 5 AK 2012/2013 Regressionsanalyse.
Ausgleich nach der Methode der kleinsten Quadrate
Die einfache/multiple lineare Regression
Wahlteil 2009 – Geometrie II 1
Microsoft Excel S-Verweis Excel: SVerweis.
 Präsentation transkript:

Die Regression als Werkzeug in der angewandten Mathematik Die Methode der kleinsten Quadrate gerechnet mit dem Solver von Excel. Linz 2009 Friedrich Tinhof BHAK Eisenstadt tinhof@wellcom.at

Die Regression als Werkzeug in der angewandten Mathematik In der Praxis ist es oft notwendig einen formalen Zusammenhang zwischen zwei Variablen zu berechnen. Ein Beispiel dafür ist der Zusammenhang zwischen Körpergröße und Körpermasse. Mit der Regressionsanalyse wird versucht, den Zusammenhang von quantitativen Merkmalen in Form einer mathematischen Funktion anzugeben.

Die Regression als Werkzeug in der angewandten Mathematik Es geht dabei um: Erkennen und Nachweis von Zusammenhängen Beispiel: „Beeinflusst die Einnahme ein neues Medikament die Höhe des Blutdruckes?“ Schätzung der Art und Größe von Zusammenhängen Beispiel: „Wie stark beeinflusst die Einnahme einer bestimmten Dosis ein neues Medikament die Höhe des Blutdruckes?“ Prognose fehlender oder zukünftiger Werte Beispiel: „Wie wird sich der Wert des Blutdrucks entwickeln, wenn man die Dosis des Medikamentes um 20% erhöht?“ (Man nimmt dabei an, dass sich die gemessene/berechnete Entwicklung fortsetzt.)

Die Regression als Werkzeug in der angewandten Mathematik Beispiel 1 Von fünf zufällig gewählten Schülerinnen wurden Körpergröße X und Körpermasse (Gewicht) Y gemessen. Gibt es einen (linearen) Zusammenhang zwischen den Merkmalen Körpergröße und Körpermasse? Welche Gerade ist für die Beschreibung des Zusammenhanges am besten geeignet? Gesucht ist eine „Trendlinie“, die den Zusammenhang der Merkmale X und Y am besten wiedergibt.

Die Regression als Werkzeug in der angewandten Mathematik Die Frage, welche die beste Näherungsgerade ist, klären wir zunächst mit Excel und erklären dann die Hintergründe. 1.Schritt: Geeignetes Punkt(XY) – Diagramm erstellen. 2.Schritt: Trendlinie hinzufügen (Mit rechter Maustaste Punkt anklicken) 3.Schritt: Typ und Optionen wählen und Trendlinie zeichnen

Trendlinie Regressionsgerade Die Methode der kleinsten Quadrate Ein kurzer Blick auf die Hintergründe Excel passt die Gerade mit der Gleichung y = a·x + b so an die Punkte des Streudiagrammes an, dass die Summe F der Fehlerquadrate ei (der vertikalen Abweichungen) minimal ist. Die Fehler ei heißen Residuen. Die Residuen sind die Differenz zwischen den Messwerten yi und den Modellwerten Yi = y(xi). e1 e2 e3 e4 e5 Residuen ei lineare Funktion: Residuen ei allgemein: Trendlinie Regressionsgerade Summe der Fehlerquadrate F(a,b): Modellwert Yi = y(xi) Schätzung des y-Wertes auf der Trendlinie Messwert yi

Die Methode der kleinsten Quadrate Ein kurzer Blick auf die Hintergründe F wird minimal, wenn Mit CAS können diese partiellen Ableitungen berechnet und das Gleichungssystem kann gelöst werden.

Die Methode der kleinsten Quadrate Güte der Anpassung – das Bestimmtheitsmaß Wir berechnen zunächst die Streuung der Messwerte yi um den Mittelwert M der Messwerte. Varianz der y-Werte: Abweichung vom Mittelwert = yi - M Messwert yi

Regressionsgerade y(x) Die Methode der kleinsten Quadrate Güte der Anpassung – das Bestimmtheitsmaß Für jeden einzelnen x-Wert der Datenpunkte existiert auch ein dazugehöriger Schätzwert (Modellwert y(xi)) auf der Regressionsgeraden. Auch diese Modellwerte Yi = y(xi) streuen um den Mittelwert M. Diese Streuung wird nun berechnet. Varianz der Modellwerte: Regressionsgerade y(x) Modellwert Yi = y(xi)

Die Methode der kleinsten Quadrate Güte der Anpassung – das Bestimmtheitsmaß Die Güte der Regression ergibt sich aus dem Quotienten der Varianz der Modellwerte und der Varianz der Messwerte. Dieser Quotient wird Bestimmtheitsmaß R² genannt.

Bestimmtheitsmaß R² R² ist genau dann gleich 1, wenn alle Datenpunkte auf der Regressionskurve mit y(x) liegen. In diesem Fall stimmen Datenpunkte und Modellwerte genau überein. Wenn die Streuung der Modellwerte gleich der Streuung der Datenpunkte ist, nimmt R² den maximal möglichen Wert 1 an. Streuung Datenwerte Streuung Modellwerte Streuung Datenwerte = Streuung Modellwerte R² = 1

R2 ist das Verhältnis von erklärter Varianz zur Gesamtvarianz. Bestimmtheitsmaß R² Je weiter die Messwerte von der Trendlinie entfernt sind, umso größer ist die die Streuung der Datenpunkte im Verhältnis zur Streuung der Modellwerte. Es gilt 0 ≤ R² ≤ 1. R2 ist das Verhältnis von erklärter Varianz zur Gesamtvarianz. Gesamtstreuung Streuung der Modellwerte (erklärte Streuung) Streuung der Residuen (nicht erklärte Streuung)

Regression mit EXCEL Der Solver von Excel ist ein leistungsstarkes Werkzeug zur Lösung von Optimierungsproblemen. Wir verwenden den Solver als „Black Box“. Der Solver wird bei der Standardinstallation von Excel (bis 2003) nicht automatisch installiert. In >Extras>Add-Ins…> Verfügbare Add-Ins muss der Solver ein- malig aktiviert werden.

Regression mit dem Solver von EXCEL Beispiel 1: Körpergröße Schritt: Tabelle in Excel eingeben und den Mittelwert der Messwerte berechnen. Schritt: Parameter a und b an geeigneter Stelle vorgeben. Die vorgegebenen Werte sind die Startwerte für den Solver. Schritt: Spalte mit Modellwerten Y berechnen. D3: =$I$3*B3+$I$4

Regression mit dem Solver von EXCEL Schritt: Spalte mit den Fehlerquadraten (y – Y)² erstellen und Spaltensumme berechnen. E3: =(C3-D3)^2 Schritt: Solver aufrufen Schritt: Minimierung Zielzelle: E9 Veränderbare Zellen: I3:I4

Regression mit dem Solver von EXCEL Optional ist die Berechnung von R² Spalte mit (Y – M)² berechnen. (Streuung der Modellwerte)² F3: =(D3-$C$9)^2 Spalte mit (y – M)² berechnen. (Gesamtstreuung)² G3: =(C3-$C$9)^2 Spaltensummen und Quotienten der Spaltensummen berechnen. I5: =F8/G8

Regression mit dem Solver von EXCEL Hinweis: In Excel 2007 finden Sie den Solver bei den Analyse-Tools. Die Funktionsweise ist identisch wie in Excel 2003.

Regression mit dem Solver von EXCEL Beispiel 2: Berechnung der quadratischen Nachfragefunktion. Welchen maximalen Eintritt sind Sie bereit für eine bestimmte Ausstellung zu bezahlen?

Regression mit dem Solver von EXCEL Beispiel 2: Welchen maximalen Eintritt sind Sie bereit für eine bestimmte Ausstellung zu bezahlen? Weiterführende Berechnungen für x ≤ 190: E(x) = p(x)·x Erlösfunktion K(x) = 3x +150 Gesamtkostenfunktion G(x) = E(x)- K(x) Gewinnfunkton Gewinnmaximum? Erlösmaximum?

Regression mit dem Solver von EXCEL Beispiel 3: Logistische Regression Entwicklung der Anzahl der Leser einer Tageszeitung

Regression mit dem Solver von EXCEL Beispiel 3: Logistische Regression

Regression mit dem Solver von EXCEL Beispiel 3: Weitere Berechnungen Für die folgenden Berechnungen verwenden wir die ermittelte Regressionsfunktion. a) Wie hoch ist die Sättigungsmenge? M ≈ 2,8 Mio. Leser b) Wann wurden 2 Mio. Leser erreicht? Für x = 20,14 wurden 2 Mio. Leser erreicht. Das war etwa 1980.

Regression mit dem Solver von EXCEL Beispiel 3: Weitere Berechnungen c) Wann war der Zuwachs der Leseranzahl maximal? Für x = 15,8 wurde ein Zuwachs von ca. 0,14 Mio. Leser erreicht. Das war ca.1975.

Regression mit dem Solver von EXCEL Beispiel 4: Sinusregression http://www.zamg.ac.at/klima/sonne_mond/index.php?jahr=2009&ort=eise Ziel ist es eine Näherungsfunktion in der Form y = A·sin(B·x + C) +D für die Berechnung der Tageslänge zu finden.

Regression mit dem Solver von EXCEL Beispiel 4: Sinusregression Wichtig: Bei komplizierteren Regressionsrechnungen findet der Solver von Excel die optimalen Werte nur nach Vorgabe geeigneter Startwerte!

Regression mit dem Solver von EXCEL Beispiel 4: Sinusregression y = 224,077·sin(-0,01681·x -1,8169) + 729,719

Regression mit dem Solver von EXCEL Beispiel 4: Berechnungen mit der ermittelten Funktion y(x) = 224,077·sin(-0,01681·x -1,8169) + 729,719 a) An welchem Tag ist nach diesem Rechenmodell der längste Tag? Maximale Tageslänge am 173. Tag. Das ist der 22 Juni.

Regression mit dem Solver von EXCEL Beispiel 4: Weitere Berechnungen y(x) = 224,077·sin(-0,01681·x -1,8169) + 729,719 b) An welchem Tag ist nach diesem Rechenmodell der die größte Zunahme/Abnahme der Tageslänge zu beobachten? Größte Zunahme der Tageslänge am 79. Tag. Das ist der 20. März. Größte Abnahme der Tageslänge am 266. Tag. Das ist der 23. 09.

Regression mit dem Solver von EXCEL Beispiel 5: Arzneistoffe in Körper Ein Arzneistoff wird einmalig oral verabreicht. A(t) ist die Arzneistoffmenge, die zur Zeit t am Ort der Resorption (Depot; Mund, Magen, Darm) zur Aufnahme zur Verfügung steht. E(t) ist die Gesamtmenge des bereits ausgeschiedenen Arzneistoffes. Im Kompartiment X (Blut) erfolgt eine Absorption aus dem Depot A mit der Absorptionskonstanten ka. Gleichzeitig kommt es aber auch zu einer Elimination des Arzneistoffes mit der Eliminationskonstanten ke.

Regression mit dem Solver von EXCEL Beispiel 5: Arzneistoffe in Körper Für den zeitlichen Verlauf der Konzentration C(t) des Arzneistoffs im Blut gilt die Bateman-Funktion:

Regression mit dem Solver von EXCEL Beispiel 5: Propranolol oral Berechnung der Bateman–Funktion: Einer Versuchsperson wird einmalig oral eine Dosis des Betablockers Propranolol verabreicht. Die Konzentration C(t) des Arzneimittels im Blut wird gemessen und ist in der Tabelle rechts abzulesen. Die Bateman-Funktion ist zu ermitteln. Quelle: ETH Zürich 2006; Urs Kirchgraber und Heidi Wunderli–Allenspach; www.educeth.ch

Regression mit dem Solver von EXCEL Beispiel 5: Propranolol oral Berechnung der Bateman–Funktion

Regression mit dem Solver von EXCEL Beispiel 5: Propranolol oral Berechnung der Bateman–Funktion C3: =$H$2*$H$3/($H$3-$H$4)*(EXP(-$H$4*A4)-EXP(-$H$3*A4))

Regression mit dem Solver von EXCEL Beispiel 5: Propranolol oral Berechnung der Bateman–Funktion Für Propranolol ergaben sich die Werte ka ≈ 0,5 h–1; ke ≈ 0,18 h–1 und C0 ≈ 62 μg/l.

Regression mit dem Solver von EXCEL Beispiel 5: Berechnungen mit der ermittelten Funktion a) Wann ist die Konzentration im Blut am höchsten? Wie hoch ist sie? Die maximale Konzentration ist nach ca. 3,19 Stunden mit 34.9 μg/l erreicht. b) Wann ist die Konzentration unter die Nachweisgrenze von 0,2 μg/l gesunken? Nach ca. 34,3 Stunden ist die Konzentration unter 0.2 μg/l gefallen.

Regression mit dem Solver von EXCEL Beispiel 5: Weitere Berechnungen c) Wie lange wirkt das Medikament, wenn dazu eine Mindestkonzentration von 5 μg/l im Blut benötigt wird? Berechnen Sie die Wirkzeit. Wirkzeit ≈ 16.44 – 0.17 = 16.27 Stunden Latentzeit ≈ 0.17 Stunden (≈10 Min)

Regression mit dem Solver von EXCEL Beispiel 5: Propranolol oral d) Zu welchem Zeitpunkt ist die Aufnahmerate (Zunahme der Konzentration) am höchsten? Wann die Ausscheidungsrate (Abnahme der Konzentration)? Zu berechnen ist hier die maximale Änderung der Konzentration C. Wir berechnen die Extrema der ersten Ableitung der Bateman– Funktion. Die Aufnahmerate ist zum Zeitpunkt t = 0 maximal. Die Ausscheidungsrate ist nach t ≈ 6.39 h maximal (Wendepunkt).

Regression mit dem Solver von EXCEL Danke für Ihre Aufmerksamkeit! tinhof@wellcom.at