Beschreibende Statistik

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Quanti Tutorium
Anzahl der ausgefüllten und eingesandten Fragebögen: 211
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
LS 2 / Informatik Datenstrukturen, Algorithmen und Programmierung 2 (DAP2)
Streuung Bezeichnung Streuung=Dispersion=Variabilität Fragestellung:
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Telefonnummer.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
1 JIM-Studie 2010 Jugend, Information, (Multi-)Media Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Statistiken und Tabellen
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.
Internet facts 2008-II Graphiken zu dem Berichtsband AGOF e.V. September 2008.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Differentielles Paar UIN rds gm UIN
Prof. Dr. Bernhard Wasmayr
Studienverlauf im Ausländerstudium
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Statistische Methoden I WS 2004/2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße.
Median Merkmal Geordneter Datensatz
Die Vorlesung Mathematik I (Prof. Kugelmann) findet heute um 14:30 Uhr im Hörsaal Loefflerstraße 70 statt.
Rechenregeln für Mittelwert, Varianz und Streuung.
Datenmatrix.
Häufigkeiten Gegeben ist eine Datenliste (Urliste) (hier z. B. die Klausur-Noten von 50 Studenten)
Streuungsparameter für Median Mittlere Abweichung vom Median Die Ungleichung gilt für jede Konstante c.
Univariate Statistik M. Kresken.
Prof. Dr. Bernhard Wasmayr VWL 2. Semester
AWA 2007 Natur und Umwelt Natürlich Leben
(Gini-Koeffizient, Lorenz-Kurve)
Rechneraufbau & Rechnerstrukturen, Folie 12.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 12.
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Prof. Dr. Günter Gerhardinger Soziale Arbeit mit Einzelnen und Familien Übersicht über die Lehrveranstaltung Grundlegende Bestimmungsfaktoren der Praxis.
Daten auswerten Boxplots
20:00.
Zusatzfolien zu B-Bäumen
WIRTSCHAFTSLAGE NOCH SCHWIERIG
Eine Einführung in die CD-ROM
Dokumentation der Umfrage
Where Europe does business Lück, JDZB | Seite © GfW NRW 252 a.
Wir üben die Malsätzchen
Aufgabenzettel V Statistik I
STATISIK LV Nr.: 1375 SS März 2005.
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Syntaxanalyse Bottom-Up und LR(0)
Kennwerte und Boxplots
STATISIK LV Nr.: 0028 SS Mai 2005.
STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005.
Der Ablauf eines Clear Rex Klärzyklus
Referat über das Thema STOCHASTIK.
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
Geometrische Aufgaben
Zahlentheorie und Zahlenspiele Hartmut Menzer, Ingo Althöfer ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List.
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Der Zentralwert.
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Unternehmensbewertung Thomas Hering ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List of Figures Tabellenübersicht.
Forschungsprojekt Statistik 2013 „Jugend zählt“ – Folie 1 Statistik 2013 „Jugend zählt“: Daten zur Arbeit mit Kindern und Jugendlichen.
Folie Einzelauswertung der Gemeindedaten
Statistik – Regression - Korrelation
Datum:17. Dezember 2014 Thema:IFRS Update zum Jahresende – die Neuerungen im Überblick Referent:Eberhard Grötzner, EMA ® Anlass:12. Arbeitskreis Internationale.
Erheben, berechnen und darstellen von Daten
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Mathematik für BiologInnen WS 05
setzt Linearität des Zusammenhangs voraus
Weitere Informationen zur Vorlesung 1)In den Übungen werden die Aufgaben besprochen, die Sie im Internet auf der Seite meines Lehrstuhls finden. 2) Die.
 Präsentation transkript:

Beschreibende Statistik Betriebswirt VWA

Wesen der Statistik Wesen der Statistik Statistik ist das methodische Vorgehen bei der Beschaffung von Informationen, die man braucht, um vernünftige Entscheidungen treffen zu können. Beschreibende Statistik (Deskriptive Statistik) Methoden zur Erfassung, Aufbereitung, Darstellung und Analyse fest umrissener und konkret vorliegender Daten. Schließende Statistik (Induktive Statistik) Methoden, deren Anwendung Schlüsse von Stichproben auf übergeordnete Gesamtheiten erlauben.

Statistische Daten verbale oder qualitative Informationen - nicht sehr präzise - wenig objektiv - Zusammenfassung schwierig quantitative, zahlenmäßige Informationen - zahlenmäßige Aussage - objektiv - einfach zusammenzufassen und zu verarbeiten Daten, die sich für eine Zusammenfassung eignen, werden als Statistische Daten bezeichnet.

Statistische Modell Ein Modell ist ein vereinfachtes Bild der Wirklichkeit und entsteht durch Beschränkung auf das Wesentliche. Modelle in der Statistik entstehen in der Regel durch Vereinfachung in dreifacher Weise: sachlich örtlich zeitlich Problem: Es gibt keine eindeutigen, allgemein anerkannte Grundsätze zur Bildung Statistischer Modelle.

Anwendungsgebiete Statistische Methoden können überall dort eingesetzt werden, wo größere Informationsmengen zu verarbeiten sind. Politik Verkehr Sozialwissenschaften Biologische Wissenschaften Naturwissenschaft und Technik Betriebstatistik Medizin

Statistisches Material Untersuchungszweck: Festlegung, wozu man Informationen benötigt Grundgesamtheit: Menge von Elementen über die sich die Entscheidung, die man statistisch untermauern will, erstreckt und über die man Informationen benötigt. Die Grundgesamtheit setzt sich aus den statistischen Einheiten zusammen. Abgrenzung der Gesamtheit: sachlich örtlich zeitlich

Bestands- und Bewegungsmassen Bestandsmassen: Erfassung zu einem bestimmten Zeitpunkt. Bewegungsmassen: Erfassung während eines Zeitraumes. Fortschreibung: Bestandsmassen werden durch Bewegungsmassen fortgeschrieben (Zugangsmassen und Abgangs- massen).

Bestands- und Bewegungsmassen Beispiele für Bestandsmassen: Einwohner von Mannheim Studenten einer Hochschule Kraftfahrzeuge in München Unternehmen in NRW Beispiele für Bewegungsmassen: Geburten in Bayern im September 1988 Verbrauch an Bier in Hessen im Jahre 1987 Regenfälle in einem bestimmten Gebiet Umsätze von Unternehmen

Vollerhebung oder Totalerhebung Erfassung aller statistischer Einheiten Vorteil: Vollständige Information Nachteil: große Gesamtheiten nicht exakt abgrenzbar Bei komplizierten Sachverhalten können Ergeb-nisse fehlerhafter werden, je mehr Einheiten berücksichtigt werden große Kosten Zeitdauer zu lang

Teilerhebung / Stichprobe Beschränkt man sich nur auf einen Teil der statis- tischen Masse, so spricht man von einer Teiler- hebung. Der ausgewählte Teil heißt Stichprobe. Vorteil: Kostengünstig, da geringer Aufwand Vollerhebung eventuell unsinnig Ergebnisse liegen schneller vor Genauigkeit Nachteil: Stichprobenfehler

Herkunft der Daten primärstatistische Erhebung: Daten werden eigens für die Untersuchung erhoben aus Kostengründen kaum durchführbar sekundärstatistische Erfassung: Rückgriff auf bereits vorhandene Daten Kostengünstig, da geringerer Aufwand

Erhebungsmethoden bei Primärstatistik Mündliche Befragung Interview sehr Zeitaufwendig Schriftliche Befragung geringer Aufwand, Güte kann leiden Beobachtung Daten in der Regel unverfälscht Experiment Produkttest Automatische Erfassung Anwendung im tech. Bereich (z.B. Stromverbrauch)

Träger der amtlichen Statistik staatliche Institutionen oder vom Staat abhängige Stellen. Sie sind staatlich finanziert. Beispiele: Statistisches Bundesamt Statistische Landesämter Statistische Ämter der Städte Ministerien des Bundes und der Länder Bundesargentur für Arbeit Veröffentlichung der amtlichen Statistik: Staatistische Jahrbuch Zeitschrift „Wirtschaft und Statistik Der Statistische Wochendienst

Träger der nichtamtlichen Statistik Wirtschaftsverbände Markt- und Meinungsforschungsinstitute wissenschaftliche Institute Unternehmen Arbeitgeber- und Arbeitnehmerorganisationen Erhebungen können schneller an aktuelle Bedürfnisse angepasst werden. Ergebnisse sind weniger objektiv. Ergebnisse sind oft Mittel der Selbstdarstellung.

Statistische Merkmale Eigenschaften einer statistischen Einheit, für die man sich bei einer statistischen Untersuchung interessiert. Sie sind Gegenstand der Untersuchung. Merkmalsträger: Träger der Merkmale sind die statistische Einheiten, die gezählt oder gemessen werden. Merkmalsausprägungen: Es sind die verschiedenen Ergebnisse, die bei der Beobachtung oder Messung auftreten können.

Beispiele für Merkmalsausprägungen Nr Merkmalsträger Merkmal Merkmalsausprägung 1 best. Person Waschmaschi-nenbesitzer Besitzer, Nichtbesitzer 2 Anhänger einer Partei Anhänger, kein Anhänger 3 Familienstand ledig, geschieden, verheiratet, verwitwet 4 Fernsehzuschauer Meinung zur Sendung sehr gut, gut, durchsch., schlecht, sehr schlecht 5 Betriebsangehörige Alter in Jahren 16 – 65 Jahre 6 Urlaubstage 18, 19, 20, ... 28 Tage

Beispiele für Merkmalsausprägungen Es handelt sich um Eigenschaften. Jede Reihen- und Rangfolge ist willkürlich und zufällig. Merkmal 4: Es handelt sich um eine Bewertung. Es liegt eine eindeutige Rangfolge vor. Merkmal 5-6: Es handelt sich um Zahlen. Eine Rangfolge ist vorge-geben. Abstände zwischen Ausprägungen sind gleich lang. Festlegung der Maßeinteilung nennt man Skalierung

Arten von Skalierungen Nominale Skalierung: (Unterscheidungsmerkmale) Die Merkmalsausprägungen drücken lediglich die Verschiedenartigkeit aus. Ordinale Skalierung: (Rangmerkmale) Die Merkmalsausprägungen bringen neben der Verschiedenartigkeit eine natürliche Rangfolge zum Ausdruck. Metrische Skalierung: (Abstandsmerkmale) Merkmalsausprägungen grundsätzlich Zahlen. Neben der Rangordnung werden auch die Abstände zwischen den Merkmalsausprägungen verglichen.

Gruppen von Skalierungen Quantitative Ausprägungen: metrisch skalierte Merkmale Ausprägungen unterscheiden sich in ihrer Größe Qualitative Ausprägungen: ordinal und nominal skalierte Merkmale Ausprägungen unterscheiden sich in ihrer Art

Qualitative Daten nominal: Merkmalsausprägungen können nicht durch Auszählen oder Messen ermittelt werden Haben keine natürliche Reihenfolge Liefern keine Abstände oder Verhältnisse ordinal: Merkmalsausprägungen können in eine natürliche Reihenfolge gebracht werden Sind keine absoluten, sondern relative Werte Liefern keine Abstände oder Verhältnisse

Quantitative Daten metrisch: Merkmalsausprägungen Sind messbar oder abzählbar (reelle Zahlen) Sind somit absolute Werte Liefern Abstände oder Verhältnisse

Diskrete und stetige Merkmale Diskrete Merkmale: (Beispiel Nr. 6) Merkmal kann nur endlich viele Ausprägungen annehmen Ausprägungen sind exakt bestimmbar Abgrenzungsschwierigkeiten treten nicht auf Stetige Merkmale: (Beispiel Nr. 5) Können jeden beliebigen reellen Wert in einem bestimmten Intervall annehmen Ausprägungen sind nicht abzählbar, sie werden durch messen bestimmt Sie sind genaugenommen nur Näherungswerte

Beispiele für Merkmalsausprägungen Nr Merkmalsträger Merkmal Merkmalsausprägung 1 best. Person Waschmaschi-nenbesitzer Besitzer, Nichtbesitzer 2 Anhänger einer Partei Anhänger, kein Anhänger 3 Familienstand ledig, geschieden, verheiratet, verwitwet 4 Fernsehzuschauer Meinung zur Sendung sehr gut, gut, durchsch., schlecht, sehr schlecht 5 Betriebsangehörige Alter in Jahren 16 – 65 Jahre 6 Urlaubstage 18, 19, 20, ... 28 Tage

Übersicht

Rechnen mit Summenzeichen i: Index 1: Untere Summationsgrenze n: Obere Summationsgrenze ai: beliebige Werte, hier z.B. Merkmalsaus- prägungen

Rechenbeispiele

Rechenregeln mit Summen

Rechenregeln mit Summen

Gesamtsumme

Häufigkeitsverteilung Urliste Ungeordnete Niederschrift der Zahlenwerte in der Reihenfolge ihres Auftretens. Häufigkeitszahl Gleiche Messwerte werden mit der Zahl ihres Auftretens versehen. Absolute Häufigkeit Anzahl der statt. Einheiten mit einer bestimmten Merkmalsausprägung. Relative Häufigkeit Absolute Häufigkeit dividiert durch Anzahl der stat. Einheiten

Klassenbildung Anzahl der Klassen festlegen opt. Anzahl erfolgt nicht nach festen Regeln Problemstellung ist maßgebend Zu viele Klassen -> unübersichtlich Zu wenige Klassen -> Informationsverlust In der Regel 5-20 Klassen Klassengrenzen festlegen Es soll eine obere und untere Grenze festge-legt werden In der Regel gleichbreite Klassen Ungleiche Klassen nur, wenn viele Beobach-tungen in einem kleinen Bereich und geringer Rest in weitem Bereich

Aufgabe Häufigkeitsverteilung Die nachfolgende Tabelle enthält die Gewichte von 40 männlichen Studenten auf das nächste volle Pfund gerundet. Erstellen Sie eine Häufigkeitsverteilung.

Lösung Strichliste

Stamm-Blatt Darstellung

Lösung Häufigkeitsdiagramm

Stabdiagramm

Rechteckdiagramm

Kreisdiagramm

Mittelwerte oder Lagerparameter Das arithmetische Mittel Einfaches arithmetische Mittel Gewogenes arithmetisches Mittel Arithmetisches Mittel für klassierte Daten Modalwert oder häufigster Wert Zentralwert oder Meridian Quantile Das geometrische Mittel

Einfaches arithmetische Mittel Arithmetische Mittel bei Einzelwerten Eigenschaften:

Das gewogene arithmetische Mittel Arithmetische Mittel bei einer Häufigkeitsverteilung Anstatt gleiche Merkmalsausprägungen mehrfach zu addieren, gewichtet man sich unterscheidende Merkmalsausprägungen xi (i=1,2,...,n) mit der Häufigkeit des Auftretens hi.

Arithmetisches Mittel für klassierte Daten Ist von einer Stichprobe weder die Urliste noch eine Häufigkeitsverteilung bekannt, so lässt sich der Mittelwert nicht exakt berechen. In einem solchen Fall ermittelt man einen Näher-ungswert, indem man von jeder Klasse die Klassen-mitte verwendet.

Modalwert Die am häufigsten vorkommende Merkmalsaus-prägung. Der Modalwert ist um so aussagekräftiger, je stärker die entsprechende Merkmalsausprägung dominiert. Für nominal skalierte Merkmale ist der Modalwert der einzige sinnvolle Lageparameter.

Zentralwert oder Median Der Zentralwert ist diejenige Merkmalsausprägung, die in der Mitte der in eine Rangfolge gebrachten Einzelausprägungen steht. D.h. die Merkmale müssen mindestens Ordinalskala besitzen. Anzahl gerade: Zentralwert an der Stelle (n+1)/2 Anzahl ungerade: Mittel der Werte an der Stelle n/2 und n/2 +1

Quantile Das p% Quantil ist der Wert Lp für den p % der Beobachtungen kleiner und (100-p)% größer als Lp sind. Für p = 25%, 50%, 75% nennt man die Quantile Quartile (unteres, Median, oberes); Bezeichnung ist Q1,Q2,Q3. Den Wert Q3 - Q1 nennt man Interquantilsabstand.

Das geometrische Mittel Bei der Bestimmung von durchschnittlichen Wachs- tumsraten ist das arithmetische Mittel nicht brauchbar. Hier muss man auf das geometrische Mittel zurück-greifen.

Negatives Wachstum

Streuungsmaße Zur Beschreibung einer Stichprobe reicht der Mittel-wert oft nicht aus, da er keine Aussage darüber er-laubt, wie weit die einzelnen Merkmalswerte vom Mittelwert abweichen. Aus diesem Grund wird der Mittelwert oft durch einen Streuungsparameter ergänzt. Spannweite oder Variationsbreite Quartilsabstand und Boxplot Mittlere lineare Abweichung Varianz und Standardabweichung Varianzkoeffizient

Spannweite oder Variationsbreite Spannweite = Differenz zwischen dem größten (xmax) und dem kleinsten (xmin) Wert Vorteil: leicht zu berechnen schneller Vergleich der Streuung zweier Merkmals-reihen rascher Überblick über die Breite der Skala Nachteil: Extremwerte verzerren die Aussagekraft Keine Aussage über Streuung zw. Extremwerten Bei großen Untersuchungen treten öfter Werte auf, die die Spannweite erhöhen

Quartilsabstand und Boxplot Der Quartilsabstand ist die Differenz zwischen dem ersten und dem dritten Quartil. Er umfasst den Be-reich mit den mittleren 50% der Werte. Das Box- oder Whiskerdiagramm stellt die Häufig-keitsverteilung schematisch dar: Zwischen dem 1. und dem 3. Quartil wird ein Kasten aufgebaut. In diesen Bereich fallen 50% der Beobachtungen. Die seitlich angesetzten „Schnurrhaare“ vermitteln einen Eindruck, wie weit die restlichen 50% streuen

Box- und Whiskersdiagramm Aufenthaltsdauer von Patientinnen nach Schnittentbindung (Seite 65)

Mittlere lineare Abweichung Durchschnittliche lineare Abweichung der Merkmals-werte vom Mittelwert. Arithmetisches Mittel der absoluten Abweichungen der Merkmalswerte von einem Mittelwert (arith. Mittel oder Median)

Varianz und Standardabweichung Varianz s2: Standardabweichung s = positve Wurzel der Varianz s2

Beispiel Standardabweichung

Variationskoeffizient Der Variationskoeffizient ist ein relativer Streuungs-parameter. Variationskoeffizient v = Quotient aus Stabdardabw. und arithmetischem Mittel Der Variationskoeffizient gibt an, wie viel Prozent vom arithmetischen Mittel die Standardabweichung beträgt.

Regression und Korrelation Beschreibung eines (tendenziellen) Zusammenhangs zwischen zwei Merkmalsausprägungen. Korrelationsanalyse: Bestimmung einer Maßzahl, die die Stärke des Zusammenhangs beschreibt. (Korrelations- bzw. Kontingenzkoeffizient) Regressionsanalyse: Bestimmung von Funktionen zur Beschreibung der Form des Zusammenhangs zwischen zwei Merk- malen. (Regressionsgerade)

Die drei Fragenstellungen Besteht zwischen den Merkmalen ein Zusammenhang oder nicht? Kontingenz Korrelation Wie ausgeprägt ist ein Zusammenhang? Kontingenz-Koeffizient Korrelations-Koeffizient Durch welche Funktion kann die Tendenz eines Zusammenhangs beschrieben werden? Regressionsrechnung

Beispiel Kontingenztabellen

Beispiel Kontingenztabellen

Zusammenhang zwischen Körpergröße und Körpergewicht

Zusammenhang zwischen Körpergröße und Körpergewicht

Zusammenhang zwischen Körpergröße und Körpergewicht

Regressionsanalyse Die Regressionsanalyse verfolgt das Ziel, die Ten-denz des Zusammenhangs durch eine mathema-tische Funktion zu beschreiben. Mögliche Funktionen: Gerade: y = ax + b Parabel: y = ax2 + bx + c Potenzfunktion: y = bx2 Exponentialfunktion: y = bax

Kriterium der kleinsten Quadrate Zur Ermittlung der Regressionsfunktion hat sich das Kriterium der kleinsten Quadrate bewährt. In einem Koordinatensystem werden die Beobach-tungspunkte eingezeichnet. Der Abstand zwischen den Punkten und der Funktion soll möglichst klein werden. Von allen möglichen Funktionen wird nun die ausge-wählt, für die die Quadrate der Abstände minimal sind

Kriterium der kleinsten Quadrate y P1 y2 P2 y = ax + b y1 d2 d1 y2* P2* y1* P1* x1 x2 x

Lineare Regressionsfunktion Forderung für Regressionsgerade y = ax + b: Für Minimum muss 1. Ableitung nach a und b ver-schwinden:

Lineare Regressionsfunktion Durch Null-Setzen der 1. Ableitungen folgt: Auflösen nach a und b ergibt:

Lineare Regressionsfunktion Andere Rechenmöglichkeit:

Einkommen - Miete

Einkommen - Miete

Lineare Regressionsfunktion Bisher haben wir die die Abhängigkeit des Merkmals Y vom Merkmal X beschrieben. (Regression von y auf x). Wollen wir die Abhängigkeit des Merkmals X vom Merkmal Y beschreiben (Regression von x auf y), so ergeben sich folgende Formeln:

Miete - Einkommen

Miete - Einkommen

Werbungskosten - Umsatz

Werbungskosten - Umsatz

Alter - Wartungskosten

Alter - Wartungskosten

Korrelationsanalyse In der Korrelationsanalyse versucht man, die Stärke des Zusammenhangs zwischen zwei Merkmalen durch eine Maßzahl auszudrücken. Wir unterscheiden folgende Maßzahlen: Korrelationskoeffizient von Pearson (metrisch skalierte Merkmale) Rangkorrelationskoeffizient von Spearman (ordinalskalierte Merkmale) Kontingenzkoeffizienten (nominalskalierte Merkmale)

Korrelationskoeffizient von Pearson

Korrelationskoeffizient von Pearson Der Korrelationskoeffizient r ist eine Zahl zwischen +1 und -1 r = 1: Alle Beobachtungswerte liegen auf einer steigenden Geraden. r = –1: Alle Beobachtungswerte liegen auf einer fallenden Geraden. r > 0: Merkmale positiv korreliert, d.h. die Regressionsgerade ist steigend. r < 0: Merkmale negativ korreliert, d.h. die Regressionsgerade ist fallend. r = 0: Die Merkmale sind unkorreliert, d.h. es besteht kein linearer Zusammenhang.

Korrelationskoeffizient von Pearson Zur Berechnung des Korrelationskoeffizienten von Pearson ist die folgende Formel besser geeignet:

Beispiel Korrelationskoeffizient

Rangkorrelationskoeffizient von Spearman Zwei Merkmale besitzen mindestens eine Ordinalskala. Merkmalswerte aufsteigend geordnet und jedem Platz eine Rangzahl zugeordnet. Für Berechnung werden nur Rangzahlen benötigt. Stimmen mehrere Merkmaleswerte überein, wird das arith. Mittel der Rangzahlen gebildet.

Beispiel 1

Beispiel 1

Beispiel 2

Beispiel 2

Beispiel Kontingenztabellen

Mittlere quadratische Kontingenz

Mittlere quadratische Kontingenz

Vierfelderkorrelation

Korrigierter Vierfelderkoeffizient