Hans HUMENBERGER Universität Wien

Slides:



Advertisements
Ähnliche Präsentationen
Einstieg in die Integralrechnung
Advertisements

Christian Scheideler SS 2009
Falls Algorithmen sich selbst rekursiv aufrufen, so kann ihr Laufzeitverhalten bzw. ihr Speicherplatzbedarf in der Regel durch eine Rekursionsformel (recurrence,
Polynomial Root Isolation
Steigung m berechnen Man kann die Steigung auch berechnen,
Vom graphischen Differenzieren
Wilhelm-Raabe-Schule Fachbereich: Mathematik Thema: Lineare Funktionen
Wilhelm-Raabe-Schule Fachbereich: Mathematik Thema: Lineare Funktionen
Fachreferat in Mathematik
Ein Modellansatz zur Beschreibung von Vagheiten
Dynamische Mathematik
Klicke Dich mit der linken Maustaste durch das Übungsprogramm!
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Kapitel 5 Stetigkeit.
Kapitel 6 Differenzierbarkeit. Kapitel 6: Differenzierbarkeit © Beutelspacher Juni 2005 Seite 2 Inhalt 6.1 Die Definition 6.2 Die Eigenschaften 6.3 Extremwerte.
Es ist kaum einzusehen, warum die Jugend von heute mit den Mitteln von gestern für das Leben von morgen qualifiziert werden soll. Es ist was Wahres dran,
2. Univariate Regressionsanalyse 2.1 Das statische Regressionsmodell
High Performance = Innovative Computer Systems + Efficient Algorithms Friedhelm Meyer auf der Heide 1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen.
Algorithmen des Internets 2005 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität 1 Materialien zu Übung 9 Bälle in Körbe Ranged.
Statistische Methoden II
Konfidenzintervalle Intervallschätzung
Die Student- oder t-Verteilung
Die Steigung m In der allgemeinen Funktionsgleichung y=mx+b
Tutorium
Wiederholung und Beispiele
Vorlesung: ANOVA I
Eigenschaften der OLS-Schätzer
Variationsformalismus für das freie Teilchen
Histogramm/empirische Verteilung Verteilungen
Christoph Kemetmüller
Einführung Differentialrechnung
Exponential- u. Logarithmusfunktionen
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Effiziente Algorithmen
Effiziente Algorithmen
Effiziente Algorithmen
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/ /23.1.
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Information und Kommunikation
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Hartmut Klauck Universität Frankfurt WS 06/
Gleichungen und Gleichungssysteme
Fuzzymengen – Was ist das?
Theorie psychometrischer Tests, II
Newton Verfahren.
Stetige Kleinste-Quadrate-Approximation
Schnittpunkt von zwei Geraden
Vom graphischen Differenzieren
setzt Linearität des Zusammenhangs voraus
Institut für Informationssysteme Technische Universität Braunschweig Institut für Informationssysteme Technische Universität Braunschweig Verdrängung von.
Kap. 7: Die quadratische Funktion – numerisch, graphisch, theoretisch
Bevölkerung in der 3. Welt
Vorstellen und Herleiten der Horner Schemas
 Präsentation transkript:

Hans HUMENBERGER Universität Wien „Gruppen-Screening“ – ein Paradebeispiel für Anwendungsorientierung und Vernetzungsmöglichkeiten im Mathematikunterricht Hans HUMENBERGER Universität Wien

Mit einfachen schulmath. Mitteln: ein Problem aus der Realität modellieren Verbindung von elementarer Stochastik (EW einer ZG) und Analysis schaffen (Funktionen, Graphen, Extremwerte, Grenzwerte, Kurvendiskussionen) Prinzip der Approximation veranschaulichen, (Näherungsverfahren, Näherungsformel) das Verhältnis zwischen diskreten und kontinuierlichen Problemen beleuchten ein CAS gut einsetzen

Einzel-Tests vs. Paar-Tests Aufgabe 1: Nach einem großen Sportfest sollen alle Sportler Proben (Blut, Urin) abgeben: Dopingkontrolle! Es werden 2 Möglichkeiten vorgeschlagen: Jede Probe wird einzeln überprüft. Je 2 Proben werden zusammengeschüttet und das Resultat getestet; falls nötig Einzeltests.

a) Wie viele Tests sind beim „Paartest“ unter welchen Umständen nötig (pro Paar) ? Paar-Test negativ: beide „sauber“; 1 Test nötig Paar-Test positiv: 1. Person allein getestet: Negativ: 2. Person hat gedopt (2 Tests) Positiv: auch die 2. Person muss getestet werden (3 Tests)

b) Vergleich für 2n Personen: Einzeltests: 2n Personen, 2n Tests Paar-Tests: jedenfalls n Tests für die n Paare Extremfälle: Bei allen Paaren reicht 1 Test: n Bei allen Paaren 3 Tests nötig: 3n Klar: Paar-Test bringt dann Vorteile, wenn wenige positive Proben zu erwarten sind.

Was ist alles aus diesem Diagramm zu entnehmen? Aufgabe 2: Sportfest-Diagramm: Anzahl der Paare, bei denen 1, 2, 3 Tests benötigt wurden. Was ist alles aus diesem Diagramm zu entnehmen? 80 + 30 + 10 = 120 Paare, d. h. 240 TN Tests: 80 + 30  2 + 10  3 = 170 , ca. 0,71 T/TN, - 29 % zwischen 40 und 50 Sportler/innen gedopt, Dopingquote: 16,7 % – 20,8 %

Aufgabe 3: (Erwartungswert) Wie viele nötige Tests sind pro Paar zu erwarten, wenn aus langjähriger Erfahrung bekannt ist, dass der Anteil p aller Sportler/innen Doping betreibt? E = (1 – p)²  1 + (1 – p) p  2 + p  3 = – p² + 3p + 1

Gruppentests bei Krankheiten „Krankheitsanteil in der Bevölkerung ist p“ Modellannahme: n Individuen seien unabhängig voneinander und mit jeweils gleicher WS p von dieser Krankheit befallen Auswahl der Testpersonen = Bernoulli-Exp. Bei Einzelprüfung: 1 Test pro Person bzw. k Tests für k Personen 1

2-stufiger Gruppentest nach Dorfman 1. Stufe (Gruppentest): Mischen des Blutes von jeweils Personen Gruppentest neg.: alle Personen gesund nur 1 Test für diese k Personen b) Gruppentest pos.: mind. 1 Person krank: jede Blutprobe in der Gruppe wird anschließend (2. Stufe) einzeln untersucht: insgesamt k + 1 Tests.

Problem: Gruppengröße k (. ), so dass insges Problem: Gruppengröße k (?), so dass insges. möglichst wenige Tests zu erwarten sind: 2 minimale zu erwartende Kosten Ergebnisse sollen möglichst schnell vorliegen.

q := 1 – p P(gesund) , „Gesundheitsanteil“ der Bev. k  2 die gewählte Gruppengröße EW einer Zufallsgröße, zunächst in einer k-Gruppe: X := Anzahl der nötigen Analysen in einer k-Gruppe X kann nur die Werte 1 und k + 1 annehmen:

Gesamtzahl: n Individuen, (n/k) viele k-Gruppen, insgesamt E(X) für verschiedene k nicht gerecht vergleichbar; nicht allein. Krit.: je größer k, desto größer E(X)! Gesamtzahl: n Individuen, (n/k) viele k-Gruppen, insgesamt zu erwartende Tests für alle n Personen. Zur Vereinfachung sinnvoll: Division durch die feste Zahl n, „Normieren“ (pro Person), „relativer EW “ 3

EW der Anzahl der nötigen Untersuchungen PRO PERSON (Gruppengr. k  2 ) Diese Funktion (Term) müssen wir genauer untersuchen!

Genau bei bringt Gruppenbildung auf lange Sicht einen Vorteil gegenüber Einzeluntersuchung. Bei festem q  (0 ; 1) suchen wir k0  2 (k0  N) mit: f (q,k0) < 1 (Ersparnis geg. Einzelunt.) f (q,k0) ist minimal

f (q,k) als Fkt. in kontinuierlichen Var.: obwohl ja eigentlich Ein eigentlich diskretes Problem wird in ein kontinuierliches verwandelt: kontinuierliche Graphen, Kraft der Analysis z. B. beim Suchen der Minimumstelle 4

Wir setzen festes q  (0,1) voraus, d. h. f(q,k) ist eine Funktion in einer Variable k (Gruppengröße) : Kurvenschar, Funktionenschar mit Parameter q !

für k  (0,50): von oben nach unten: q = 0.4; 0.6; 0.7; 0.8; 0.85 Für kleinere q-Werte q < 0.7 scheint zu gelten: 5 Uninteressanter Bereich – keine Ersparnis gegenüber Einzeluntersuchungen!

k  (0,50), größere q : 2 Schnittp. mit y = 1, asympt. Annäh. v. oben eindeutiges Min. zw. 0 und 1: Min.stelle interessant (opt. Gruppengröße!) Wo liegt diese Stelle? 1) Ablesen: CAS-Graph 2) analyt. Überlegungen

1. Versuch: 1. Ableitung von y = ln k hat mit einer Gerade y = mk + b „klarer Weise“ höchstens 2 Schnittpunkte  (ln immer negativ d. h. nach rechts gekrümmt!) hat höchstens zwei lokale Extremstellen! 6

Aber: nicht geschlossen lösbar für welche q gibt es 0, 1, 2 Lösungen? (Näherungslösungen!) für welche q ergibt sich ein Min/Max/Sattelpunkt?

Analog: höchstens 2 Schnittpunkte (Lösungen) ! Zur weiteren Begründung Schon nicht geschlossen lösbar: höchstens 2 Schnittpunkte (Lösungen) ! Zur weiteren Begründung und deren Ableitung besser vermeiden!

Die Teilfunktionen von Wohlbekannte Funkt. aus der Mittelstufe: Hyperbel: Exponentialfunktion: (fallend: 0 < q < 1) Interessant nur (Ersparnis!) : 7

Zunächst: 0, 1, 2 Schnittp., je nach q q groß  fällt flach: für (Berührwert)  2 Schnittp.

Damit klar : Bei ist für Begründung des 2. Schnittpunktes auch für durch „de l‘Hospital“ 8 Oben: höchstens 2 Schnittpunkte, damit genau 2 für !

„Rechnung“, Lösung des GLS: Berührkonstellation lässt sich sogar genau bestimmen: einfache, traditionelle, klassische „Rechnung“, Lösung des GLS: CAS auf Knopfdruck (z. B. MAPLE, auch per Hand, DERIVE nicht: bei nichtlinearen GLS nur numerisch gut): Einzelgleichungen nicht geschlossen nach k auflösbar, d. h. die beiden Gleichungen „passen“ gut zueinander. 9

Bis jetzt: Für ist , d. h. Gruppentests schlechter als Einzeltests (im Durchschnitt, „Erwartungswert“) ! Auch für bringt Gruppenbildung im Durchschnitt keine Ersparnis: Erst ab kann Gruppenbildung im Durchschnitt überhaupt Ersparnis bringen (d. h. bei einem Gesundheitsanteil von mind. ca. 70%, so eine Grenze auch intuitiv zu erwarten)!

Noch zu zeigen: hat für in genau 1 Minimumstelle k* Oben: hat höchstens 2 lokale Extremstellen Im Folgenden: hat für mindestens eine lokale Minimumstelle k* in und eine lokale Maximumstelle  genau diese beiden lokalen Extremstellen!

Begründung für k* und k**: 10 besser „getrennt“: Bei : Differenz , dazwischen < 0 ! stetig   Min.stelle in bei k* (betraglich Differenz dort maximal !)

„Rechts“ von : Salopp: Bei und im Limes : Differenz „dazwischen“ :   Max.-stelle in : bei k**

I. A.: : k0 = [k*] oder k0 = [k*] + 1 Bei k* sehr flacher Graphverlauf, d. h. ziemlich gleichgültig, ob k0 = [k*] oder k0 = [k*] + 1

Konkrete Lösung mit CAS (MAPLE, DERIVE o. ä Konkrete Lösung mit CAS (MAPLE, DERIVE o. ä.) bei gegebenem Wert q > qB : Zeichnen des Graphen von fq(k): k* und k0 (die „bessere“ der natürlichen Nachbarzahlen) einfach ungefähr ablesen! oder die Gleichung wird näh.w. gelöst (CAS: mit „beliebiger“ Genauigkeit möglich), 2 Lösungen k* < k** ; k0 = [k*] oder k0 = [k*] + 1 (je nach kleinerem Funktionswert von fq ) 11 12

Konkrete Lösung mit oder ohne CAS Durch obige analyt. Überlegungen klar: fq(k) bis k* fallend, dann „steigend bis 1“ Die Suche nach k0 kann sich also (begründet!) auf das Probieren einiger ganzzahliger Werte reduzieren: Ab welchem k werden die Funktionswerte fq(k) wieder größer?

1) Zusammenhang q  k0 (geschlossene Formel unmöglich!) Weitere Möglichkeiten: 1) Zusammenhang q  k0 (geschlossene Formel unmöglich!) Man könnte für viele einzelne q-Werte das Problem lösen: q gegeben, k0 gesucht: q 0,7 0,8 0,85 0,9 0,92 0,94 0,96 0,98 0,99 0,995 0,999 k0 3 4 5 6 8 11 15 32 Ersp.% 1 18 28 41 47 53 62 73 80 86 94 11 punktuelle Fälle gelöst, aber bei q = 0,93 ???

k0 vorgegeben, zugehöriger q-Bereich gesucht 13 Umgekehrt: k0 vorgegeben, zugehöriger q-Bereich gesucht Z. B.: für welche q ist 4 die optimale Gruppengröße? A priori klar: k0 monoton wachsend mit q (bei mehr Gesunden kann die optimale Gruppengröße nicht kleiner sein) ! Wo liegt q4 / 5? („Trenn-q“ zw. k0 = 4 und k0 = 5) Idee: für welches q sind 4 und 5 gleich gute Gruppengrößen: fq(4) = fq(5): CAS: q4 / 5  0,934

Durch wenige Trenn-q-Werte großer q-Bereich abgedeckt Zusammenhang effizienter beschrieben:

2) Elementare Numerik Näherungsverf. bei Gleichungen, nicht nur black box (CAS), sondern konkretes Verfahren! Trenn-q-Werte: „Fixpunktgleichung“ „Iterationsverfahren“ Analytischer Nachweis möglich (Wahlpflichtfach): Konvergenz bei Startwert 1 qk / k+1 ist anziehender Fixpunkt (flacher Schnitt) !

3) Gruppengröße k = 2 ist für KEIN q optimal ! 14 q als Variable: für k = 2 und k = 3: Differenz: f(q,2) – f(q,3) f(q,2) – f(q,3) > 0 leicht analytisch zu begründen

4) Näherungsformel für k0 (kleine p!) 15 Wie gut ist diese Näherungsformel? Wie kann man sie plausibel machen? q 0,7 0,8 0,85 0,9 0,92 0,94 0,96 0,98 0,99 0,995 0,999 k0 3 4 5 6 8 11 15 32 2 10

Plausibilitätsbetrachtung (p statt q !) Ersetze für kleine p den „unangenehmen“ Teilterm [ k im Exp! ] durch eine einfachere Funktion: Fkt. v. p (p klein!) 16 „Lok. Linearisieren“ : Tangente in (0|1) Für kleine p :

Damit für kleine p Approx. möglich: hat das einzige Minimum bei Die Werte sind für kleine p und praktische Zwecke genau genug für ! Dorfman: ; 80,443 % Ersparnis Näherung: ; 80,438 % Ersparnis

Potenzial dieses Themas: Kernaufgabe von Schülern selbständig zu lösen; ausbaufähig in viele Richtungen Bei Begründungen gestufte Niveaus möglich Intensität des CAS-Einsatzes sehr variabel k = 2 ist nie optimal Numerische Mathematik: „Umkehrfrage“, Iterationsverfahren, explizite Näherungsformel

„The main goal of all science is first to observe and then to explain phenomena. In mathematics the explanation is the proof.” (D. GALE, 1990)

Literatur Humenberger / Henn (2004): Gruppenscreening - ein Paradebeispiel für Vernetzungsmöglichkeiten im MU. In: Biehler/Engel/Meyer (Hrsg.): Neue Medien und innermathematische Vernetzungen in der Stochastik. Anregungen zum Stochastikunterricht, Band 2, S. 19 – 32; Franzbecker, Hildesheim.