Statistik – Regression - Korrelation

Slides:



Advertisements
Ähnliche Präsentationen
Quanti Tutorium
Advertisements

Univariate Statistik M. Kresken.
Kosmologie mit Supernovae 1a
Lagemaße kritische Fragen
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Physikalische Messgrößen
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Gliederung Definition des Wahrscheinlichkeitsbegriffes
Gliederung Der Begriff der Stichprobe, Stichprobenfehler
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen Halbzeit: Was haben wir bisher gelernt? Prof. Th. Ottmann.
Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.
Mehrfachregressionen
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Konfidenzintervalle Intervallschätzung
Die Student- oder t-Verteilung
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Median Merkmal Geordneter Datensatz
Streuungsparameter Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Die Vorlesung Mathematik I (Prof. Kugelmann) findet heute um 14:30 Uhr im Hörsaal Loefflerstraße 70 statt.
Datenmatrix.
Quantile.
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Datentabelle für 2 Merkmale
Streuungsparameter Median Mittlere Abweichung vom Median
Quantile.
Univariate Statistik M. Kresken.
Diagnostische Statistik
Tutorium
(Gini-Koeffizient, Lorenz-Kurve)
Wiederholung und Beispiele
Eigenschaften der OLS-Schätzer
Multikollinearität Wann spricht man von Multikollinearität?
Wiederholung: Einfache Regressionsgleichung
Ausgleichungsrechnung I
Ausgleichungsrechnung II
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
§3 Allgemeine lineare Gleichungssysteme
Mittelwert und Standardabweichung
Die Gaußverteilung.
Versuch zur Messung der Geschwindigkeit
STATISIK LV Nr.: 1375 SS März 2005.
STATISIK LV Nr.: 0028 SS Mai 2005.
Kapitel 10 Multikollinearität
Kapitel 19 Kointegration
Referat über das Thema STOCHASTIK.
1 Stichprobenverfahren zur Qualitätssicherung Hilfestellung der Statistik in der Wirtschaftsprüfung.
Data Mining Georg Pölzlbauer.
Der Zentralwert.
Forschungsmethodik II, SS 2010 Vesna Pavlovski & Julia Pichlhöfer
Veranstaltung 4.
Messergebnis Das Messergebnis ist der Näherungswert für den wahren Wert der Messgröße, der durch Auswertung der mit einer Messeinrichtung gewonnenen Messwerte.
Einführung zur Fehlerrechnung
Mathematik für BiologInnen WS 05
setzt Linearität des Zusammenhangs voraus
K. Desch - Statistik und Datenanalyse SS05
Verteilungen, Varianz Tamara Katschnig.
Geostatistik Kriging Sarah Böckmann.
Auswertung analytischer Daten - Auswertungsziele
Die Gaussverteilung.
Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)
Statistik III Statistik III 2. Streuungsmaße (Dispersionsmaße)
PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Ausgleich nach der Methode der kleinsten Quadrate
Univariate Statistik M. Kresken.
 Präsentation transkript:

Statistik – Regression - Korrelation

Vorgehensweise in der Analytik Auswahl der Methode Erstellen einer repräsentativen Probe  Probennahme Herstellen einer Laborprobe Wiederholungsprobe Lösen der Probe Eliminieren von Interferenzen Messung von Analyt-Eigenschaften und Analytmengen Berechnung der Resultate Bewertung der Verlässlichkeit der Resultate Jede Messung ist mit Fehlern behaftet. Suche nach dem „wahren Wert“, allerdings ist dieser immer unbekannt, aber mit Hilfe statistischer Kenngrößen kann mit einer gewissen Wahrscheinlichkeit auf den „wahren Wert“ geschlossen werden.

Fehlerarten Vermeidbare Fehler (auch: systematische Fehler) Unidirektional, gerichtet z.B.: verschmutzte Analysenwaage, falsche Eichung systematische Fehler sind reproduzierbar, aber trotzdem nicht richtig  Einfluss auf die „Richtigkeit“ (engl. accuracy) Zufällige Fehler Bei zufälligen Fehlern handelt es sich um nicht beeinflussbare Größen, z.B. elektrisches „Rauschen“. Fluktuationen (Rauschen) beeinflussen die „Präzision“ (engl. precision, Reproduzierbarkeit) um einen zentralen Wert ( ungerichtet)

Richtigkeit und Präzision Low accuracy Low precision High accuracy High precision

Definition der Präzision und Streuung – zufällige Fehler Aliquote Aliquote sind homogene Anteile einer Probe, mit denen gleiche (replikate) Messungen durchgeführt werden. Bedingungen werden nicht verändert. Für einfache Analysen sind 2-5 replikate Messungen ausreichend. Cross-errors Darunter versteht man „grobe Fehler“, die zu „statistischen Ausreißern“ führen. Kommen selten vor, z.B. Abschreibfehler. Lösung bzw. Überprüfungsmöglichkeit: Duplikat der fraglichen Messung machen! Einzelmessung

Arithmetisches Mittel(engl. mean/average)

Präzision Die Präzision wird durch die Standardabweichung beschrieben. Die Standardabweichung ist ein so genanntes Streuungsmaß. Für kleine Probenzahlen gilt: s besitzt die Einheit des Messwerts

Varianz Die Varianz entspricht dem Quadrat der Standardabweichung (s2). Sie stellt ein besseres Maß als die Standardabweichung dar, ist aber schlechter vorstellbar, da die Dimension der Einheit dem Quadrat der Einheit des Messwerts entspricht. RSD% (relative standard deviation) Auch Variationskoeffizient (CV, engl. coefficent of variance) genannt.

Median Entspricht der Mitte. Es befinden sich gleich viele Elemente oberhalb und unterhalb des Medians. Werte werden geordnet; bei gerader Anzahl der Elemente wird der Median aus dem Mittelwert der zwei mittleren Elemente gebildet. 1 2 3 4 5  Median = 3 1 2 3 4 5 6  Median = = 3,5

Beziehung zwischen zwei Datenreihen Gibt es eine Relation zwischen Messgröße und interessanter Größe? Wenn ja, wie groß/stark ist die Beziehung und welcher Art ist sie?

Kein wie, nur ob eine Verknüpfung vorhanden ist Beziehung Stärke. Kein wie, nur ob eine Verknüpfung vorhanden ist Art Korrelation Regression

Regression Allgemeine Geraden-Gleichung: b entspricht der Steigung der Geraden: Beispiel: Ist die am besten angepasste Kurve für die untenstehenden Messwerte? Lösung: Berechnung der Residuen (Reste). Residuen stellen den Abstand des Messwerts zur Geraden dar:

Regression Erstellung einer Kalibrationskurve möglich. Die Steigung b der Kalibrationskurve entspricht der Empfindlichkeit der Methode. Je steiler die Kurve, desto empfindlicher die Methode. Im linearen Bereich ist b konstant, außerhalb ist b eine Funktion der Konzentration (dynamischer Bereich). Im dynamischen Bereich sind quantitative Messungen möglich.

Regression

Korrelation Beispiel anhand zweier Datenmengen x und y, wobei x = Konzentration und y = Messsignal sind (typisch für eine photometrische Messung mit Standards x und einem Signal y).

Korrelation

Korrelation Der lineare Korrelationskoeffizient ist eine dimensionslose Zahl, die eine Aussage über einen (vorhandenen) linearen Zusammenhang liefert. Werte können zwischen ±1 korrelieren, liegen alle Werte ideal linear auf einer Geraden so ist der Korrelationskoeffizient k=1. Das Vorzeichen des Korrelationskoeffizienten gibt die Steigung an.

Korrelation Dabei gilt: treten kleine x mit kleinen y und große x mit großen y gemeinsam auf, so ist das Vorzeichen positiv (+) treten kleine x mit großen y und große x mit kleinen y gemeinsam auf, so ist das Vorzeichen negativ (-) Ist k=0 existiert kein linearer Zusammenhang