Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

SAS Willkommen zur Veranstaltung des Hochschulrechenzentrums der Universität Essen Diese Seiten stellen die Inhalte der Einführung zum selbständigen Nachschlagen.

Ähnliche Präsentationen


Präsentation zum Thema: "SAS Willkommen zur Veranstaltung des Hochschulrechenzentrums der Universität Essen Diese Seiten stellen die Inhalte der Einführung zum selbständigen Nachschlagen."—  Präsentation transkript:

1

2 SAS Willkommen zur Veranstaltung des Hochschulrechenzentrums der Universität Essen Diese Seiten stellen die Inhalte der Einführung zum selbständigen Nachschlagen zur Verfügung. Copyright © 1997 Hochschulrechenzentrum Universität GH Essen Alle Rechte vorbehalten HRZ

3 2 SAS - Ein Überblick (1) n Statistical Analysis System n Statistische Datenanalyse in der EDV n Integriertes System von Computerpro- grammen auf unterschiedlichen Betriebs- systemen n Setzt !keine Programmierkenntnisse voraus n Anwendung in allen wissenschaftlichen Bereichen HRZ Statistikkenntnisse sind erwünscht!

4 3 SAS - Ein Überblick (2) HRZ

5 4 SAS - Daten Meßniveau – Nominalskalen Zahlen, denen Eigenschaften zugeordnet werden z.B. Geschlecht, Farbe – Ordinal- oder Rangskalen w.o., bilden aber eine geordnete Reihe z.B. Größe:klein/mittel/groß – Intervallskalen w.o., erlauben auch Aussagen über Abstände von Skalenwerten z.B. Temperatur HRZ

6 5 SAS - Analyseverfahren (1) Die Analyseverfahren unterscheiden sich dann in Abhängigkeit des Meßniveuaus: n Nominalskalen - univariate Verfahren – Modifikation und Prüfung der Daten – z.B. Frequencies – Assignanweisung – Datenselektion – Aggregierung von Daten HRZ

7 6 SAS - Analyseverfahren (2) Ordinal- o. Rangskalen - bivariate Verfahren n Zweidimensionale Häufigkeiten: – z.B. Frequencies, Tables, Scattergram n Mittelwertvergleich: – z.B. TTEST n Varianzanalyse: – z.B. ANOVA HRZ

8 7 SAS - Analyseverfahren (3) Intervallskalen - multivariate Verfahren Beziehungen zwischen abhängigen und un- abhängigen Größen – z.B. Regressionsanalyse, – Faktorenanalyse, – Clusteranalyse HRZ

9 8 SAS - Systemdatei SAS - Systemdatei ist ein von SAS erstellter Katalog (Library) mit Einträgen (Member) unterschiedlichen Typs: DATA, GRAPH, Profile, etc. Typ Data: – Header – Variablenbeschreibung – mit oder ohne Daten HRZ

10 9 SAS - Typen von SAS-Systemfiles Der Typ von SAS-Systemfiles hat die Erweiterung.SC2 SAS-Dateien, die z.B. unter Windows / Unix erstellt wurden Es gibt zwei Arten von Systemfiles bei SAS: Temporär Einfacher SAS-Name Permanent Doppelname, getrennt durch einen Punkt (.) Verknüpfung zu den Systemdateien über die SAS-Anweisung: LIBNAME Pfadangabe ; HRZ

11 10 SAS - Arbeitsweise Es gibt zwei Modi mit SAS zu arbeiten: Batch DOS/UNIX: Auf Kommandoebene wird eine Datei mit SAS-Anweisungen ausgeführt WIN: Aus dem Programmfenster werden die SAS-Anweisungen ausgeführt !Interaktiv Über Tastatur und per Mausklick werden die einzelnen Aktionen ausgeführt Sequentielle Verarbeitung Datensätze werden hintereinander verarbeitet Datenmatrix ist rechteckig HRZ

12 11 SAS - Batch HRZ

13 12 SAS - Operationsarten HRZ SAS unterscheidet 4 Arten von Operationen: 1. Überprüfung der SAS-Anweisungen auf Syntaxfehler 2. Syntaxprüfung und Ausführung der SAS-Anweisungen 3. Erstellung eines Protokolls 4. Erstellung eines Listings

14 13 Durch Anweisungen in diesem Pro- grammteil sind die Ablaufvoraus- setzungen für die SAS-Ausführung festgelegt. Dieser Programmteil beschreibt die Files und die dazugehörigen Daten, die das Programm verwenden soll, evtl. mit einer Transformation (z.B. einer math. Funktion). Hier werden die zuvor definierten Files verarbeitet, z.B. durch Prozeduren. Definition der Systemumgebung (optional) Definition der Files & Daten (Data-Set) Definition der Verarbeitung (Proc-Step) SAS - Struktur der SAS-Anweisungen HRZ Die Anweisungen, die in SAS übergeben werden, teilen sich in drei Bereiche:

15 14 Systemumgebung OPTIONS..., bzw. GOPTIONS... ; Files & Daten DATA...; Verarbeitung PROC Prozedurname ; Die Reihenfolge der Bereiche kann beliebig festgelegt werden. Der logische Ablauf muß hierbei stimmen. SAS - Struktur der SAS-Anweisungen HRZ Definition übertragen auf SAS-Anweisungen:

16 15 DATA PERSONAL; /* Files & Daten */ INFILE PERSONAL; INPUT REGION 1 FILIALE 2-3 VERSNR 4-12 PERSNR LOHNGRP 20 NAME $ STRASSE $ ORT $ LAND $ PLZ NETTOLHN BRUTTLHN ABTLG GEBDATUM TELEFON GESCHL 121 FAMSTAND $ 122 ; IF ABTLG = 914; TITLE 'Mitarbeiter der Abteilung 914'; RUN; PROC PRINT; /* Verarbeitung */ VAR ABTLG PERSNR NAME NETTOLHN; RUN; SAS - Beispiel für SAS-Strukturen HRZ OPTIONS LINESIZE = 72;/* Systemumgebung */

17 16 HRZ SAS - Ausgabe SAS erzeugt zwei Ausgabelisten: Protokoll des SAS-Programmes in der Ausgabe SASLOG SAS erstellt eine Liste in der Form eines Protokolles. Es beinhaltet eine Beschreibung des SAS-Programmes oder einer Terminalsitzung und druckt die verbrauchten Ressourcen aus. Arbeitsergebnis des SAS-Programmes in der Ausgabe LISTING Die Ausgabe LISTING beinhaltet die Ergebnisse der statistischen Aus- wertungen und/oder den mit dem SAS-Programm erzeugten Bericht.

18 17 HRZ SAS - Protokoll SAS(R) LOG CMS SAS 5.16 VM/CMS CMS USER userid Header NOTE: COPYRIGHT (C) 1984 SAS INSTITUTE INC., CARY, N.C U.S.A. NOTE: CMS SAS RELEASE 5.16 AT setinit name NOTE: CPUID VERSION = FF SERIAL = MODEL = NOTE: SAS OPTIONS SPECIFIED ARE: 1 OPTIONS LINESIZE=72; SAS-Anweisungen DATA PERSONAL; 5 INFILE PERSONAL; 6 INPUT REGION 1 FILIALE VERSNR 4-12 PERSNR LOHNGRP 20 NAME $ STRASSE $ ORT $ LAND $ PLZ NETTOLHN BRUTTLHN ABTLG GEBDATUM TELEFON GESCHL FAMSTAND $ 122; IF ABTLG = 914; 17 TITLE 'MITARBEITER DER ABTEILUNG 914'; NOTE: 48 LINES WERE READ FROM INFILE INPUT. Resourcen NOTE: DATA SET WORK.PERSONAL HAS 48 OBSERVATIONS AND 17 VARIABLES. NOTE: THE DATA STATEMENT USED 0.26 SECONDS AND 220K.

19 18 HRZ SAS - Protokoll (2) 19 PROC PRINT; 20 VAR ABTLG PERSNR NAME NETTOLHN; NOTE: THE PROCEDURE PRINT USED 0.59 SECONDS AND 476K AND PRINTED PAGE 4. NOTE: SAS USED 476K MEMORY. NOTE: SAS INSTITUTE INC. SAS CIRCLE PO BOX 8000 CARY, N.C

20 19 HRZ SAS - Listing MITARBEITER DER ABTEILUNG MONDAY,. – – OBS ABTLG PERSNR NAME NETTOLHN – – MANHART VIRGINA – VETTER DENISE – GRECO LESLIE – CROCI JUDY – RYAN PAMELA Der Bericht wird durch SAS von der optischen Gestaltung wie folgt automatisch aufgelistet : - Anordnung des Berichtes zur Mitte des Blattes hin, - Anordnung der Überschrift zur Mitte des Berichtes hin, - Variablenüberschrift in der Mitte über den Daten, angeordnet mit einer Leerzeile zwischen der Kolonnenüberschrift und dem ersten Datensatz, - Uhrzeit, Wochentag, Datum und Seitenzahl im rechten Teil der ersten Überschriftszeile.

21 20 HRZ SAS - Syntaxregeln Befehlsbereich Alle Anweisungen können im freien Format im Programm-Editor eingetragen werden. Die Zeilen haben eine feste Länge von 80 Spalten. Der Befehlsbereich innerhalb dieser 80 Spalten umfaßt die Positionen SAS Statement Ein SAS Statement ist eine Zeichenkette von SAS-Keywords, SAS- Namen, und speziellen Zeichen und Operatoren, die mit dem Semikolon (;) enden. DATA ONE; FORMAT VALUE ABCD.; PROC MEANS DATA=STORE.SUPPLY MAXDEC=3; INFILE RAWDATA; %HEADING DO OVER EACHITEM; KEY1: TOTAL + 1;

22 21 HRZ SAS - Syntaxregeln (2) SAS-Name SAS-Namen im SAS-Statement können Namen von Variablen, Data Sets, Formate, Prozeduren, Optionen, DDnamen, Felder, Labels und Macros sein. DATA ONE; FORMAT VALUE ABCD.; PROC MEANS DATA=STORE.SUPPLY; INFILE RAWDATA; %HEADING DO OVER EACHITEM; KEY1: TOTAL + 1; Die Namen können bis zu maximal 8 Zeichen lang sein und müssen mit einem Buchstaben oder mit dem Unterstrich (_) beginnen. Nachfolgende Zeichen können auch Ziffern sein. Spezielle Zeichen wie Blank, Dollarzeichen ($), Pointer Nummern-zeichen (#), Prozentzeichen (%) und Ampersand (&) sind im SAS-Namen nicht erlaubt.

23 22 HRZ SAS - Syntaxregeln (3) Zeichen und Operatoren Jedes Statement endet mit dem Semikolon. Andere spezielle Zeichen wie der Punkt (.), Doppelpunkt (:), Dollarzeichen ($) und Prozentzeichen (%) geben dem SAS-Namen noch eine weitere Bedeutung: $15. := Formatname ABCD. := Formatname KEY1: := Labelname %HEADING := Macroaufruf Operatoren bei SAS sind das Pluszeichen (+), Minuszeichen (-), Multiplikationszeichen (*) und das Divisionszeichen (/).

24 23 HRZ SAS - Syntaxregeln (3) Kommentar SAS bietet zwei Formate von Kommentaren an: - Zeilenkommentar und - Blockkommentar Der Zeilenkommentar beginnt mit dem Stern (*) und endet mit dem Semikolon (;). Der Blockkommentar beginnt mit der Zeichenfolge /* und endet mit der Zeichenfolge */. /* Beispielprogramm */ * VAR ABTLG PERSNR NAME NETTO ;

25 24 HRZ SAS - Beispiel Daten einlesen innerhalb eines SAS-Jobs: DATA BEISP1; INPUT FAMSTD 1 SEX 2 ALTER 3 EINKOM 4-7 STATUS 8 VORSORG 9 KONSERV 10 SCHULB 11-12; LABEL FAMSTD ='FAMILIENSTAND SEX ='GESCHLECHT EINKOM ='EINKOMMEN VORSORG ='VORSORGEBEREITSCHAFT KONSERV ='KONSERVATIVISMUS SCHULB ='SCHUL/UNIBESUCH IN JAHREN'; CARDS; : beliebige Datenzeilen ; RUN ; PROC FREQ; TABLES SEX ALTER EINKOM STATUS ; RUN ;

26 25 HRZ SAS - Beispiel (2) SAS-Job mit einer anderen Reihenfolge der Bereiche: PROC FORMAT ;/* Verarbeitung */ VALUE SEXFMT 1=WEIBL 2=MÄNNL ; RUN; DATA BEISP2;/* Files & Daten */ FILENAME DATEN d:\saswork\DATEN.DAT' ; INFILE DATEN ; INPUT FAMSTD 1 SEX 2 ALTER 3 EINKOM 4-7 STATUS 8 VORSORG 9 KONSERV 10 SCHULB 11-12; LABEL FAMSTD ='FAMILIENSTAND SEX ='GESCHLECHT EINKOM ='EINKOMMEN VORSORG ='VORSORGEBEREITSCHAFT KONSERV ='KONSERVATIVISMUS SCHULB ='SCHUL/UNIBESUCH IN JAHREN ; FORMAT SEX SEXFMT. ; RUN; PROC FREQ ; /* Verarbeitung */ TABLES ALTER * SEX ; RUN;

27 26 HRZ SAS - Beispiel (3) SAS-Job mit mehreren unterschiedlichen Bereichen: DATA TEIL1; /* Files & Daten */ FILENAME DATEN d:\saswork\DATEN.DAT'; INFILE DATEN ; INPUT FAMSTD 1 SEX 2 ALTER 3 EINKOM 4-7 STATUS 8 VORSORG 9 KONSERV 10 SCHULB ; RUN; PROC FREQ; /* Verarbeitung */ TABLES SEX ALTER EINKOM STATUS ; RUN; DATA TEIL2 ; /* Files & Daten */ SET TEIL1 ; IF EINKOM <= 2500 ; RUN; PROC FREQ;/* Verarbeitung */ TABLES SEX ALTER EINKOM STATUS ; RUN;

28 27 HRZ SAS - Beispiel (4) SAS-Job mit der Erstellung einer permanenten SAS-Datei: LIBNAME FIRMA 'C:\HRZ050\SASWORK' ; FILENAME INPUT 'C:\HRZ050\SASWORK\PERSONAL.DAT'; DATA FIRMA.PERSONAL; INFILE INPUT; INPUT REGION 1 FILIALE 2-3 VERSNR 4-12 PERSNR LOHNGRP 20 NAME $ STRASSE $ ORT $ LAND $ PLZ NETTOLHN BRUTTLHN ABTLG GEBDATUM TELEFON GESCHL $ 121 FAMSTAND $ 122 ; RUN; Permanente SAS-Dateien haben die Erweiterung.SC2. Diese Datei ist ein SAS-Katalog (Library) mit Einträgen (Member) unterschiedlichen Typs. Typen können sein DATA, GRAPH, Profile, etc.

29 28 HRZ SAS - Steueranweisungen n Erzeugung und Abspeicherung von SAS-Dateien – DATA Beginn des Data-Teils – INPUT Anordnung der einzelnen Variablen – CARDS Einlesen von Rohdaten – INFILE Einlesen der Rohdaten von einer Datei – SET Einfügen eines DATA-Teiles – MERGE Beobachtungswerte aus mehreren Dateien zu einer zusammenfassen – UPDATE Fortschreibung einer Stammdatei um Beobachtungen aus einer Bewegungsdatei n Vorbereitung von Eingabedaten zur Weiterverarbeitung – LABEL Kennzeichnung von Variablen – RENAME Umbenennen von Variablen – IF Datenselektion – ZuweisungZuordnung der entsprechenden Variablen – DELETE Ausschluss einiger Beobachtungen – OUTPUT Aufnahme einiger Beobachtungen – DROP Spezifikation der nicht eingehenden Variablen – KEEP Spezifikation der eingehenden Variablen – STOP Abbruch eines Datenaufbaus – RETAIN Verfügen der Variablenwerte bei einer weiteren Ausnutzung

30 29 HRZ SAS - Steueranweisungen (2) n Steuermöglichkeiten im Programmablauf – IF THEN..ELSE.. Verzweigungen im DATA-Teil – GOTO / LINK Sprungbefehl – RETURN Rücksprung – DO/END Ausführen der eingeschlossenen Anweisungen n Steuerung Datenausgabe – FILE Definition der Ausgabedatei – PUT Ausgabezeile schreiben – PROC FORMAT Gestalten von Formaten – PROC PRINT Ausdruck von Werten und Variablen – PROC PLOT Graph. Darstellung von Beziehungen zwischen Variablen – PROC CHART Erzeugung von Histogrammen n Dateimanagementprozeduren – PROC DATASETS Anlisten, Löschen und Umbenennen von SAS-Dateien – PROC DELETELöschen von SAS-Dateien – PROC COPY Kopieren von SAS-Dateien – PROC SORT Sortieren von SAS-Dateien – PROC SOURCE Beschreiben des Inhalts von Quelldateien – PROC TAPECOPY Kopieren von Magnetbändern – PROC RELEASE Optimieren des Speicherbereichs

31 30 HRZ SAS - Prozeduren n Statistikprozeduren – PROC UNIVARIATE Bestimmung univariater statistischer Kennwerte – PROC SUMMARY Aggregierung für Untergruppen – PROC RANK Bestimmung von Rangwerten und Quantilmaßen – PROC MEANS Mittelwertbestimmung für Gesamt- und Untergruppen – PROC FREQ Berechnung univariater Statistiken, Darstellung und Auswertung von Kontingenztafeln – PROC CORR Berechnung von Korrelationsmaße – PROC TTEST Vergleich der Mittelwerte zweier unabhängiger Stichproben – PROC ANOVA Parametrische Analyse ein- und mehrfaktorieller Versuchspläne – PROC PLAN Spezifizieren von Versuchsplänen – PROC NESTED Auswertung hierarchisch-geschachtelter Versuchspläne – PROC DUNCAN A-posteriori-Vergleiche von Mittelwerten – PROC NPAR1WAY Überprüfung von Unterschiedshypothesen für Ordinaldaten n Regressionsanalyse: – PROC NLIN liefert Schätzer für Parameter nichtlinearer Modelle nach der Methode der kleinsten Quadrate ( auch gewichtet ) – PROC REG Schätzer für lineare Modelle – PROC RSQUARE Regression einer oder mehrerer abhängiger Variablen – PROC RSREG bestimmt die Parameter der quadratischen Oberfläche und den kritischen Wert – PROC STEPWISE beinhaltet fünf Methoden der stufenweisen Regression

32 31 HRZ SAS - Prozeduren (2) n Kategorial analytische Verfahren: – PROC FUNCAT überführt kategoriale Funktionen in lineare Modelle – PROC PROBIT berechnet Maximum-Likelihood-Schätzer n Multivariate Analyse: – PROC CANCORR erzeugt kanonische Korrelation, partielle kanonische Korrelation – PROC FACTOR bestimmt gemeinsamen Faktor, Komponentenanalysen – PROC PRINCOMP überprüft Beziehungen einiger quantitativer Variablen n Diskriminanzanalyse: – PROC CANDISC kanonische Diskriminanzanalyse – PROC DISCRIM berechnet lineare und quadratische Diskriminanzfunktionen für klassifizierende Beobachtungen – PROC NEIGHBOR Klassifizierung der Diskriminanzanalyse – PROC STEPDISC stufenweise Diskriminanzanalyse n Clusteranalyse: – PROC CLUSTER hierarchische Clusteranalyse – PROC FASTCLUS disjunkte Clusteranalyse großer Datenmengen – PROC TREE zeichnet Dendogramme oder Phänogramme

33 32 HRZ SAS - Prozeduren (3) n Supplemental Library – ALSCAL multidimensionale Skalierung – COXREGR Cox's life table Regressionsmodell – DATACHK Check für Input Data – DUNCAN Duncan's multipler Rang Test – EXPLODE druckt übergroßen Text – FMTLIB zeigt Inhalt von FORMAT-Libraries – FORMS druckt nach einer bestimmten Vorgabe – HARVEY kleinste Quadrate und grösste Wahrscheinlichkeitsanalyse für Genetiker – IPFPHC Clusteranalyse bei der Durchführung von flow tables – KSLTEST Normalitätstest – LAV Benutzung linearer Modelle nach Kriterien von kleinsten absoluten Inhalten – LOGIST logistische multiple Regression – NPAR1WAY One-way Varianzanalyse – OPSCAN Analyse des Outputs – PCTL berechnet Percentiles – PHGLM Cox's life table Regressionsmodell – PREDICT logistisches multiple Regressionsmodell – RSP Contour PLots (Druckerplot) – SEQCENS nonparametrische Regression von überprüften Daten – SPLOT schematische PLots (Drucker PLots) – SURVTEST Differenzentest zwischen Überlebenskurven – TSCSREG Zeitreihen-Querschnitt-Regression

34 33 HRZ SAS - Prozeduren (4) n Graphische Prozeduren: – GANNO plottet durch ANNOTATE definierte data-sets – GCHART vertikale und horizontale Barcharts, Kreis-, Stern- und Blockdiagramme – GCONTOUR Contour Plot – GMAP Landkarten – GOPTIONS listet Optionen für SAS/GRAPH auf – GPLOT zweidimensionaler Plot – GPRINT Häufigkeiten graphisch dargestellt – GPROJECT Landkarten dargestellt nach Breiten- und Längengraden – GREDUCE erlaubt Teile von Landkarten zu zeichnen – GREPLAY reproduziert abgespeicherte Graphiken – GSETUP Prozedur für den TEK4027 – GSLIDE zeichnet Textzeilen – G3D Dreidimensionale Plots

35 34 HRZ SAS - Prozeduren (5) n Ökonometrie und Zeitreihenanalyse: – TIMEPLOT Druckerplot über mehrere Zeitintervale – CITIBASE kopiert Daten vom CITIBASE-File in ein Data Set – FORECAST bereitet univariate Daten für eine Schätzung vor – STATESPACE Analyse und Schätzung multivariater Daten darstellen bestimmter Zeiträume von Zeitreihen – SPECTRA bewertet multivariate Zeitreihen nach der Dichte – AUTOREG bewertet Parameter in einem Regressionsmodell – MATRIX statistische Kalkulation von Zeitreihen – SYSREG bewertet Köffizienten im zusammenhängenden System von linearen Gleichungen – SIMLIN liest Köffizienten erzeugt von der Prozedur SYSREG – MODEL spezifiziert Programmstatements zu einem Modell – SYSNLIN bewertet Parameter eines simultanen Systems von nichtlinearen Gleichungen – SIMNLIN liest simultane Systeme von nichtlinearen Gleichungen – COMPUTAB erstellt Reports nach Zeilen oder Spalten ausgerichtet – MORTGAGE erstellt Finanztabellen

36 35 SAS - Aufruf HRZ

37 36 SAS - Literatur HRZ Originalliteratur ist bei der Firma zu bestellen: SAS User's Guide Basics Version 6 Edition SAS User's Guide Statistics Version 6 Edition SAS User's Guide ETS Version 6 Edition SAS User's Guide GRAPH Version 6 Edition SAS User's Guide FSP Version 6 Edition SAS User's Guide IML Version 6 Edition etc... Sekundärliteratur für SAS: – F. FAULBAUM u.a.: Statistik Analyse System, Band 1 – Gustav Fischer verlag, Stuttgart, New York, 1983 – H.M. ÜHLINGER Datenverarbeitung und Datenanalyse mit SAS. – Eine Problemorientierte Einführung – Gustav Fischer Verlag, Stuttgart, New York – W.-M. KÄHLER SAS für Anfänger – Vieweg Verlag Braunschweig/Wiesbaden Schriftenreihe der Uni Hannover erhältlich im Benutzerbüro

38 37 SAS - Beratung HRZ Beratung der stud. Hilfskräfte Mo - Fr, 15: :00 Uhr im Raum SH 205, Tel.: 2933 Ansprechpartner für Statistik: Dennis Jankowski Di und Fr Beratung der Mitarbeiter möglichst nach Vereinbarung N. Terzenbach, SH 216, Tel.: Folien unter: Allgemeine Informationen unter:


Herunterladen ppt "SAS Willkommen zur Veranstaltung des Hochschulrechenzentrums der Universität Essen Diese Seiten stellen die Inhalte der Einführung zum selbständigen Nachschlagen."

Ähnliche Präsentationen


Google-Anzeigen