Statistik – Regression - Korrelation

Slides:

Advertisements

Ähnliche Präsentationen

Quanti Tutorium

Advertisements

Univariate Statistik M. Kresken.

Kosmologie mit Supernovae 1a

Lagemaße kritische Fragen

Streuungsmaß 3: absolute Abweichung vom Mittelwert

Physikalische Messgrößen

Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.

Gliederung Definition des Wahrscheinlichkeitsbegriffes

Gliederung Der Begriff der Stichprobe, Stichprobenfehler

Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.

Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.

Vorlesung Informatik 2 Algorithmen und Datenstrukturen Halbzeit: Was haben wir bisher gelernt? Prof. Th. Ottmann.

Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.

Mehrfachregressionen

Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.

Konfidenzintervalle Intervallschätzung

Die Student- oder t-Verteilung

Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.

Median Merkmal Geordneter Datensatz

Streuungsparameter Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.

Die Vorlesung Mathematik I (Prof. Kugelmann) findet heute um 14:30 Uhr im Hörsaal Loefflerstraße 70 statt.

Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)

Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.

Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.

Datentabelle für 2 Merkmale

Streuungsparameter Median Mittlere Abweichung vom Median

Univariate Statistik M. Kresken.

Diagnostische Statistik

(Gini-Koeffizient, Lorenz-Kurve)

Wiederholung und Beispiele

Eigenschaften der OLS-Schätzer

Multikollinearität Wann spricht man von Multikollinearität?

Wiederholung: Einfache Regressionsgleichung

Ausgleichungsrechnung I

Ausgleichungsrechnung II

Überblick Statistik Deskriptive Statistik=beschreibende Statistik

§3 Allgemeine lineare Gleichungssysteme

Mittelwert und Standardabweichung

Die Gaußverteilung.

Versuch zur Messung der Geschwindigkeit

STATISIK LV Nr.: 1375 SS März 2005.

STATISIK LV Nr.: 0028 SS Mai 2005.

Kapitel 10 Multikollinearität

Kapitel 19 Kointegration

Referat über das Thema STOCHASTIK.

1 Stichprobenverfahren zur Qualitätssicherung Hilfestellung der Statistik in der Wirtschaftsprüfung.

Data Mining Georg Pölzlbauer.

Der Zentralwert.

Forschungsmethodik II, SS 2010 Vesna Pavlovski & Julia Pichlhöfer

Veranstaltung 4.

Messergebnis Das Messergebnis ist der Näherungswert für den wahren Wert der Messgröße, der durch Auswertung der mit einer Messeinrichtung gewonnenen Messwerte.

Einführung zur Fehlerrechnung

Mathematik für BiologInnen WS 05

setzt Linearität des Zusammenhangs voraus

K. Desch - Statistik und Datenanalyse SS05

Verteilungen, Varianz Tamara Katschnig.

Geostatistik Kriging Sarah Böckmann.

Auswertung analytischer Daten - Auswertungsziele

Die Gaussverteilung.

Statistik II Statistik II Maße der zentralen Tendenz (Mittelwerte)

Statistik III Statistik III 2. Streuungsmaße (Dispersionsmaße)

PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.

 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.

Ausgleich nach der Methode der kleinsten Quadrate

Univariate Statistik M. Kresken.

Präsentation transkript:

Statistik – Regression - Korrelation

Vorgehensweise in der Analytik Auswahl der Methode Erstellen einer repräsentativen Probe  Probennahme Herstellen einer Laborprobe Wiederholungsprobe Lösen der Probe Eliminieren von Interferenzen Messung von Analyt-Eigenschaften und Analytmengen Berechnung der Resultate Bewertung der Verlässlichkeit der Resultate Jede Messung ist mit Fehlern behaftet. Suche nach dem „wahren Wert“, allerdings ist dieser immer unbekannt, aber mit Hilfe statistischer Kenngrößen kann mit einer gewissen Wahrscheinlichkeit auf den „wahren Wert“ geschlossen werden.

Fehlerarten Vermeidbare Fehler (auch: systematische Fehler) Unidirektional, gerichtet z.B.: verschmutzte Analysenwaage, falsche Eichung systematische Fehler sind reproduzierbar, aber trotzdem nicht richtig  Einfluss auf die „Richtigkeit“ (engl. accuracy) Zufällige Fehler Bei zufälligen Fehlern handelt es sich um nicht beeinflussbare Größen, z.B. elektrisches „Rauschen“. Fluktuationen (Rauschen) beeinflussen die „Präzision“ (engl. precision, Reproduzierbarkeit) um einen zentralen Wert ( ungerichtet)

Richtigkeit und Präzision Low accuracy Low precision High accuracy High precision

Definition der Präzision und Streuung – zufällige Fehler Aliquote Aliquote sind homogene Anteile einer Probe, mit denen gleiche (replikate) Messungen durchgeführt werden. Bedingungen werden nicht verändert. Für einfache Analysen sind 2-5 replikate Messungen ausreichend. Cross-errors Darunter versteht man „grobe Fehler“, die zu „statistischen Ausreißern“ führen. Kommen selten vor, z.B. Abschreibfehler. Lösung bzw. Überprüfungsmöglichkeit: Duplikat der fraglichen Messung machen! Einzelmessung

Arithmetisches Mittel(engl. mean/average)

Präzision Die Präzision wird durch die Standardabweichung beschrieben. Die Standardabweichung ist ein so genanntes Streuungsmaß. Für kleine Probenzahlen gilt: s besitzt die Einheit des Messwerts

Varianz Die Varianz entspricht dem Quadrat der Standardabweichung (s2). Sie stellt ein besseres Maß als die Standardabweichung dar, ist aber schlechter vorstellbar, da die Dimension der Einheit dem Quadrat der Einheit des Messwerts entspricht. RSD% (relative standard deviation) Auch Variationskoeffizient (CV, engl. coefficent of variance) genannt.

Median Entspricht der Mitte. Es befinden sich gleich viele Elemente oberhalb und unterhalb des Medians. Werte werden geordnet; bei gerader Anzahl der Elemente wird der Median aus dem Mittelwert der zwei mittleren Elemente gebildet. 1 2 3 4 5  Median = 3 1 2 3 4 5 6  Median = = 3,5

Beziehung zwischen zwei Datenreihen Gibt es eine Relation zwischen Messgröße und interessanter Größe? Wenn ja, wie groß/stark ist die Beziehung und welcher Art ist sie?

Kein wie, nur ob eine Verknüpfung vorhanden ist Beziehung Stärke. Kein wie, nur ob eine Verknüpfung vorhanden ist Art Korrelation Regression

Regression Allgemeine Geraden-Gleichung: b entspricht der Steigung der Geraden: Beispiel: Ist die am besten angepasste Kurve für die untenstehenden Messwerte? Lösung: Berechnung der Residuen (Reste). Residuen stellen den Abstand des Messwerts zur Geraden dar:

Regression Erstellung einer Kalibrationskurve möglich. Die Steigung b der Kalibrationskurve entspricht der Empfindlichkeit der Methode. Je steiler die Kurve, desto empfindlicher die Methode. Im linearen Bereich ist b konstant, außerhalb ist b eine Funktion der Konzentration (dynamischer Bereich). Im dynamischen Bereich sind quantitative Messungen möglich.

Regression

Korrelation Beispiel anhand zweier Datenmengen x und y, wobei x = Konzentration und y = Messsignal sind (typisch für eine photometrische Messung mit Standards x und einem Signal y).

Korrelation

Korrelation Der lineare Korrelationskoeffizient ist eine dimensionslose Zahl, die eine Aussage über einen (vorhandenen) linearen Zusammenhang liefert. Werte können zwischen ±1 korrelieren, liegen alle Werte ideal linear auf einer Geraden so ist der Korrelationskoeffizient k=1. Das Vorzeichen des Korrelationskoeffizienten gibt die Steigung an.

Korrelation Dabei gilt: treten kleine x mit kleinen y und große x mit großen y gemeinsam auf, so ist das Vorzeichen positiv (+) treten kleine x mit großen y und große x mit kleinen y gemeinsam auf, so ist das Vorzeichen negativ (-) Ist k=0 existiert kein linearer Zusammenhang