Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Hochschulrechenzentrum Universität GH Essen

Ähnliche Präsentationen


Präsentation zum Thema: "Hochschulrechenzentrum Universität GH Essen"—  Präsentation transkript:

1 Hochschulrechenzentrum Universität GH Essen
HRZ SAS Willkommen zur Veranstaltung des Hochschulrechenzentrums der Universität Essen Diese Seiten stellen die Inhalte der Einführung zum selbständigen Nachschlagen zur Verfügung. Copyright © 1997 Hochschulrechenzentrum Universität GH Essen Alle Rechte vorbehalten

2 SAS - Ein Überblick (1) Statistical Analysis System
HRZ Statistical Analysis System Statistische Datenanalyse in der EDV Integriertes System von Computerpro- grammen auf unterschiedlichen Betriebs- systemen Setzt !keine Programmierkenntnisse voraus Anwendung in allen wissenschaftlichen Bereichen Statistikkenntnisse sind erwünscht!

3 SAS - Ein Überblick (2) HRZ

4 SAS - Daten Meßniveau Intervallskalen
HRZ Nominalskalen Zahlen, denen Eigenschaften zugeordnet werden z.B. Geschlecht, Farbe Ordinal- oder Rangskalen w.o., bilden aber eine geordnete Reihe z.B. Größe: klein/mittel/groß Intervallskalen w.o., erlauben auch Aussagen über Abstände von Skalenwerten z.B. Temperatur

5 SAS - Analyseverfahren (1)
HRZ Die Analyseverfahren unterscheiden sich dann in Abhängigkeit des Meßniveuaus: Nominalskalen - univariate Verfahren Modifikation und Prüfung der Daten z.B. Frequencies Assignanweisung Datenselektion Aggregierung von Daten

6 SAS - Analyseverfahren (2)
HRZ Ordinal- o. Rangskalen - bivariate Verfahren Zweidimensionale Häufigkeiten: z.B. Frequencies, Tables, Scattergram Mittelwertvergleich: z.B. TTEST Varianzanalyse: z.B. ANOVA

7 SAS - Analyseverfahren (3)
HRZ Intervallskalen - multivariate Verfahren Beziehungen zwischen abhängigen und un- abhängigen Größen z.B. Regressionsanalyse, Faktorenanalyse, Clusteranalyse

8 SAS - Systemdatei HRZ SAS - Systemdatei ist ein von SAS erstellter Katalog (Library) mit Einträgen (Member) unterschiedlichen Typs: DATA, GRAPH, Profile, etc. Typ Data: Header Variablenbeschreibung mit oder ohne Daten

9 SAS - Typen von SAS-Systemfiles
HRZ Der Typ von SAS-Systemfiles hat die Erweiterung .SC2 SAS-Dateien, die z.B. unter Windows / Unix erstellt wurden Es gibt zwei Arten von Systemfiles bei SAS: Temporär Einfacher SAS-Name Permanent Doppelname, getrennt durch einen Punkt (.) Verknüpfung zu den Systemdateien über die SAS-Anweisung: LIBNAME Pfadangabe ;

10 SAS - Arbeitsweise Es gibt zwei Modi mit SAS zu arbeiten: Batch
HRZ Es gibt zwei Modi mit SAS zu arbeiten: Batch DOS/UNIX: Auf Kommandoebene wird eine Datei mit SAS-Anweisungen ausgeführt WIN: Aus dem Programmfenster werden die SAS-Anweisungen ausgeführt !Interaktiv Über Tastatur und per Mausklick werden die einzelnen Aktionen ausgeführt Sequentielle Verarbeitung Datensätze werden hintereinander verarbeitet Datenmatrix ist rechteckig

11 SAS - Batch HRZ

12 SAS - Operationsarten SAS unterscheidet 4 Arten von Operationen:
HRZ SAS unterscheidet 4 Arten von Operationen: 1. Überprüfung der SAS-Anweisungen auf Syntaxfehler 2. Syntaxprüfung und Ausführung der SAS-Anweisungen 3. Erstellung eines Protokolls 4. Erstellung eines Listings

13 SAS - Struktur der SAS-Anweisungen
HRZ Die Anweisungen, die in SAS übergeben werden, teilen sich in drei Bereiche: Durch Anweisungen in diesem Pro-grammteil sind die Ablaufvoraus-setzungen für die SAS-Ausführung festgelegt. Dieser Programmteil beschreibt die Files und die dazugehörigen Daten, die das Programm verwenden soll, evtl. mit einer Transformation (z.B. einer math. Funktion). Hier werden die zuvor definierten Files verarbeitet, z.B. durch Prozeduren. Definition der Systemumgebung (optional) Definition der Files & Daten (Data-Set) Definition der Verarbeitung (Proc-Step)

14 SAS - Struktur der SAS-Anweisungen
HRZ Definition übertragen auf SAS-Anweisungen: Systemumgebung OPTIONS..., bzw. GOPTIONS... ; Files & Daten DATA...; Verarbeitung PROC Prozedurname ; Die Reihenfolge der Bereiche kann beliebig festgelegt werden. Der logische Ablauf muß hierbei stimmen.

15 SAS - Beispiel für SAS-Strukturen
HRZ OPTIONS LINESIZE = 72; /* Systemumgebung */ DATA PERSONAL; /* Files & Daten */ INFILE PERSONAL; INPUT REGION FILIALE VERSNR PERSNR LOHNGRP NAME $ STRASSE $ ORT $ 61-72 LAND $ PLZ NETTOLHN BRUTTLHN ABTLG GEBDATUM TELEFON GESCHL FAMSTAND $ 122 ; IF ABTLG = 914; TITLE 'Mitarbeiter der Abteilung 914'; RUN; PROC PRINT; /* Verarbeitung */ VAR ABTLG PERSNR NAME NETTOLHN; RUN;

16 SAS - Ausgabe SAS erzeugt zwei Ausgabelisten:
HRZ SAS erzeugt zwei Ausgabelisten: Protokoll des SAS-Programmes in der Ausgabe SASLOG SAS erstellt eine Liste in der Form eines Protokolles. Es beinhaltet eine Beschreibung des SAS-Programmes oder einer Terminalsitzung und druckt die verbrauchten Ressourcen aus. Arbeitsergebnis des SAS-Programmes in der Ausgabe LISTING Die Ausgabe LISTING beinhaltet die Ergebnisse der statistischen Aus- wertungen und/oder den mit dem SAS-Programm erzeugten Bericht.

17 SAS - Protokoll SAS(R) LOG CMS SAS 5.16 VM/CMS CMS USER userid Header
HRZ SAS(R) LOG CMS SAS VM/CMS CMS USER userid Header NOTE: COPYRIGHT (C) 1984 SAS INSTITUTE INC., CARY, N.C U.S.A. NOTE: CMS SAS RELEASE 5.16 AT setinit name NOTE: CPUID VERSION = FF SERIAL = MODEL = NOTE: SAS OPTIONS SPECIFIED ARE: 1 OPTIONS LINESIZE=72; SAS-Anweisungen 2 3 4 DATA PERSONAL; 5 INFILE PERSONAL; 6 INPUT REGION FILIALE VERSNR PERSNR LOHNGRP NAME $ 21-40 STRASSE $ ORT $ 61-72 LAND $ PLZ NETTOLHN BRUTTLHN ABTLG GEBDATUM TELEFON GESCHL FAMSTAND $ 122; 15 16 IF ABTLG = 914; 17 TITLE 'MITARBEITER DER ABTEILUNG 914'; NOTE: 48 LINES WERE READ FROM INFILE INPUT. Resourcen NOTE: DATA SET WORK.PERSONAL HAS 48 OBSERVATIONS AND 17 VARIABLES. NOTE: THE DATA STATEMENT USED 0.26 SECONDS AND 220K.

18 SAS - Protokoll (2) HRZ 19 PROC PRINT;
VAR ABTLG PERSNR NAME NETTOLHN; NOTE: THE PROCEDURE PRINT USED 0.59 SECONDS AND 476K AND PRINTED PAGE 4. NOTE: SAS USED 476K MEMORY. NOTE: SAS INSTITUTE INC. SAS CIRCLE PO BOX 8000 CARY, N.C

19 SAS - Listing HRZ MITARBEITER DER ABTEILUNG MONDAY,. OBS ABTLG PERSNR NAME NETTOLHN MANHART VIRGINA VETTER DENISE GRECO LESLIE CROCI JUDY RYAN PAMELA Der Bericht wird durch SAS von der optischen Gestaltung wie folgt automatisch aufgelistet: - Anordnung des Berichtes zur Mitte des Blattes hin, - Anordnung der Überschrift zur Mitte des Berichtes hin, - Variablenüberschrift in der Mitte über den Daten, angeordnet mit einer Leerzeile zwischen der Kolonnenüberschrift und dem ersten Datensatz, - Uhrzeit, Wochentag, Datum und Seitenzahl im rechten Teil der ersten Überschriftszeile.

20 SAS - Syntaxregeln SAS Statement
HRZ Befehlsbereich Alle Anweisungen können im freien Format im Programm-Editor eingetragen werden. Die Zeilen haben eine feste Länge von 80 Spalten. Der Befehlsbereich innerhalb dieser 80 Spalten umfaßt die Positionen 1-72. SAS Statement Ein SAS Statement ist eine Zeichenkette von SAS-Keywords, SAS-Namen, und speziellen Zeichen und Operatoren, die mit dem Semikolon (;) enden. DATA ONE; FORMAT VALUE ABCD.; PROC MEANS DATA=STORE.SUPPLY MAXDEC=3; INFILE RAWDATA; %HEADING DO OVER EACHITEM; KEY1: TOTAL + 1;

21 SAS - Syntaxregeln (2) HRZ SAS-Name SAS-Namen im SAS-Statement können Namen von Variablen, Data Sets, Formate, Prozeduren, Optionen, DDnamen, Felder, Labels und Macros sein. DATA ONE; FORMAT VALUE ABCD.; PROC MEANS DATA=STORE.SUPPLY; INFILE RAWDATA; %HEADING DO OVER EACHITEM; KEY1: TOTAL + 1; Die Namen können bis zu maximal 8 Zeichen lang sein und müssen mit einem Buchstaben oder mit dem Unterstrich (_) beginnen. Nachfolgende Zeichen können auch Ziffern sein. Spezielle Zeichen wie Blank, Dollarzeichen ($), Pointer Nummern-zeichen (#), Prozentzeichen (%) und Ampersand (&) sind im SAS-Namen nicht erlaubt.

22 SAS - Syntaxregeln (3) HRZ Zeichen und Operatoren Jedes Statement endet mit dem Semikolon. Andere spezielle Zeichen wie der Punkt (.), Doppelpunkt (:), Dollarzeichen ($) und Prozentzeichen (%) geben dem SAS-Namen noch eine weitere Bedeutung: $ := Formatname ABCD. := Formatname KEY1: := Labelname %HEADING := Macroaufruf Operatoren bei SAS sind das Pluszeichen (+), Minuszeichen (-), Multiplikationszeichen (*) und das Divisionszeichen (/).

23 SAS - Syntaxregeln (3) SAS bietet zwei Formate von Kommentaren an:
HRZ Kommentar SAS bietet zwei Formate von Kommentaren an: - Zeilenkommentar und - Blockkommentar Der Zeilenkommentar beginnt mit dem Stern (*) und endet mit dem Semikolon (;). Der Blockkommentar beginnt mit der Zeichenfolge /* und endet mit der Zeichenfolge */. /* Beispielprogramm */ * VAR ABTLG PERSNR NAME NETTO ;

24 SAS - Beispiel Daten einlesen innerhalb eines SAS-Jobs: HRZ
DATA BEISP1; INPUT FAMSTD 1 SEX 2 ALTER 3 EINKOM 4-7 STATUS 8 VORSORG 9 KONSERV 10 SCHULB 11-12; LABEL FAMSTD ='FAMILIENSTAND‘ SEX ='GESCHLECHT‘ EINKOM ='EINKOMMEN‘ VORSORG ='VORSORGEBEREITSCHAFT‘ KONSERV ='KONSERVATIVISMUS‘ SCHULB ='SCHUL/UNIBESUCH IN JAHREN'; CARDS; : beliebige Datenzeilen ; RUN ; PROC FREQ; TABLES SEX ALTER EINKOM STATUS ;

25 SAS - Beispiel (2) SAS-Job mit einer anderen Reihenfolge der Bereiche:
HRZ SAS-Job mit einer anderen Reihenfolge der Bereiche: PROC FORMAT ; /* Verarbeitung */ VALUE SEXFMT 1=WEIBL 2=MÄNNL ; RUN; DATA BEISP2; /* Files & Daten */ FILENAME DATEN ‘d:\saswork\DATEN.DAT' ; INFILE DATEN ; INPUT FAMSTD 1 SEX 2 ALTER 3 EINKOM 4-7 STATUS 8 VORSORG 9 KONSERV 10 SCHULB 11-12; LABEL FAMSTD ='FAMILIENSTAND‘ SEX ='GESCHLECHT‘ EINKOM ='EINKOMMEN‘ VORSORG ='VORSORGEBEREITSCHAFT‘ KONSERV ='KONSERVATIVISMUS‘ SCHULB ='SCHUL/UNIBESUCH IN JAHREN‘ ; FORMAT SEX SEXFMT. ; PROC FREQ ; /* Verarbeitung */ TABLES ALTER * SEX ;

26 SAS - Beispiel (3) SAS-Job mit mehreren unterschiedlichen Bereichen:
HRZ SAS-Job mit mehreren unterschiedlichen Bereichen: DATA TEIL1; /* Files & Daten */ FILENAME DATEN ‘d:\saswork\DATEN.DAT'; INFILE DATEN ; INPUT FAMSTD 1 SEX 2 ALTER 3 EINKOM 4-7 STATUS 8 VORSORG 9 KONSERV 10 SCHULB ; RUN; PROC FREQ; /* Verarbeitung */ TABLES SEX ALTER EINKOM STATUS ; DATA TEIL2 ; /* Files & Daten */ SET TEIL1 ; IF EINKOM <= 2500 ; PROC FREQ; /* Verarbeitung */

27 SAS - Beispiel (4) HRZ SAS-Job mit der Erstellung einer permanenten SAS-Datei: LIBNAME FIRMA 'C:\HRZ050\SASWORK' ; FILENAME INPUT 'C:\HRZ050\SASWORK\PERSONAL.DAT'; DATA FIRMA.PERSONAL; INFILE INPUT; INPUT REGION FILIALE VERSNR PERSNR 13-17 LOHNGRP NAME $ STRASSE $ ORT $ 61-72 LAND $ PLZ NETTOLHN BRUTTLHN ABTLG GEBDATUM TELEFON GESCHL $ FAMSTAND $ 122 ; RUN; Permanente SAS-Dateien haben die Erweiterung .SC2 . Diese Datei ist ein SAS-Katalog (Library) mit Einträgen (Member) unterschiedlichen Typs. Typen können sein DATA, GRAPH, Profile, etc.

28 SAS - Steueranweisungen
HRZ Erzeugung und Abspeicherung von SAS-Dateien DATA Beginn des Data-Teils INPUT Anordnung der einzelnen Variablen CARDS Einlesen von Rohdaten INFILE Einlesen der Rohdaten von einer Datei SET Einfügen eines DATA-Teiles MERGE Beobachtungswerte aus mehreren Dateien zu einer zusammenfassen UPDATE Fortschreibung einer Stammdatei um Beobachtungen aus einer Bewegungsdatei Vorbereitung von Eingabedaten zur Weiterverarbeitung LABEL Kennzeichnung von Variablen RENAME Umbenennen von Variablen IF Datenselektion Zuweisung Zuordnung der entsprechenden Variablen DELETE Ausschluss einiger Beobachtungen OUTPUT Aufnahme einiger Beobachtungen DROP Spezifikation der nicht eingehenden Variablen KEEP Spezifikation der eingehenden Variablen STOP Abbruch eines Datenaufbaus RETAIN Verfügen der Variablenwerte bei einer weiteren Ausnutzung

29 SAS - Steueranweisungen (2)
HRZ Steuermöglichkeiten im Programmablauf IF THEN..ELSE.. Verzweigungen im DATA-Teil GOTO / LINK Sprungbefehl RETURN Rücksprung DO/END Ausführen der eingeschlossenen Anweisungen Steuerung Datenausgabe FILE Definition der Ausgabedatei PUT Ausgabezeile schreiben PROC FORMAT Gestalten von Formaten PROC PRINT Ausdruck von Werten und Variablen PROC PLOT Graph. Darstellung von Beziehungen zwischen Variablen PROC CHART Erzeugung von Histogrammen Dateimanagementprozeduren PROC DATASETS Anlisten, Löschen und Umbenennen von SAS-Dateien PROC DELETE Löschen von SAS-Dateien PROC COPY Kopieren von SAS-Dateien PROC SORT Sortieren von SAS-Dateien PROC SOURCE Beschreiben des Inhalts von Quelldateien PROC TAPECOPY Kopieren von Magnetbändern PROC RELEASE Optimieren des Speicherbereichs

30 SAS - Prozeduren Statistikprozeduren Regressionsanalyse: HRZ
PROC UNIVARIATE Bestimmung univariater statistischer Kennwerte PROC SUMMARY Aggregierung für Untergruppen PROC RANK Bestimmung von Rangwerten und Quantilmaßen PROC MEANS Mittelwertbestimmung für Gesamt- und Untergruppen PROC FREQ Berechnung univariater Statistiken, Darstellung und Auswertung von Kontingenztafeln PROC CORR Berechnung von Korrelationsmaße PROC TTEST Vergleich der Mittelwerte zweier unabhängiger Stichproben PROC ANOVA Parametrische Analyse ein- und mehrfaktorieller Versuchspläne PROC PLAN Spezifizieren von Versuchsplänen PROC NESTED Auswertung hierarchisch-geschachtelter Versuchspläne PROC DUNCAN A-posteriori-Vergleiche von Mittelwerten PROC NPAR1WAY Überprüfung von Unterschiedshypothesen für Ordinaldaten Regressionsanalyse: PROC NLIN liefert Schätzer für Parameter nichtlinearer Modelle nach der Methode der kleinsten Quadrate ( auch gewichtet ) PROC REG Schätzer für lineare Modelle PROC RSQUARE Regression einer oder mehrerer abhängiger Variablen PROC RSREG bestimmt die Parameter der quadratischen Oberfläche und den kritischen Wert PROC STEPWISE beinhaltet fünf Methoden der stufenweisen Regression

31 SAS - Prozeduren (2) Kategorial analytische Verfahren:
HRZ Kategorial analytische Verfahren: PROC FUNCAT überführt kategoriale Funktionen in lineare Modelle PROC PROBIT berechnet Maximum-Likelihood-Schätzer Multivariate Analyse: PROC CANCORR erzeugt kanonische Korrelation, partielle kanonische Korrelation PROC FACTOR bestimmt gemeinsamen Faktor, Komponentenanalysen PROC PRINCOMP überprüft Beziehungen einiger quantitativer Variablen Diskriminanzanalyse: PROC CANDISC kanonische Diskriminanzanalyse PROC DISCRIM berechnet lineare und quadratische Diskriminanzfunktionen für klassifizierende Beobachtungen PROC NEIGHBOR Klassifizierung der Diskriminanzanalyse PROC STEPDISC stufenweise Diskriminanzanalyse Clusteranalyse: PROC CLUSTER hierarchische Clusteranalyse PROC FASTCLUS disjunkte Clusteranalyse großer Datenmengen PROC TREE zeichnet Dendogramme oder Phänogramme

32 SAS - Prozeduren (3) Supplemental Library HRZ
ALSCAL multidimensionale Skalierung COXREGR Cox's life table Regressionsmodell DATACHK Check für Input Data DUNCAN Duncan's multipler Rang Test EXPLODE druckt übergroßen Text FMTLIB zeigt Inhalt von FORMAT-Libraries FORMS druckt nach einer bestimmten Vorgabe HARVEY kleinste Quadrate und grösste Wahrscheinlichkeitsanalyse für Genetiker IPFPHC Clusteranalyse bei der Durchführung von flow tables KSLTEST Normalitätstest LAV Benutzung linearer Modelle nach Kriterien von kleinsten absoluten Inhalten LOGIST logistische multiple Regression NPAR1WAY One-way Varianzanalyse OPSCAN Analyse des Outputs PCTL berechnet Percentiles PHGLM Cox's life table Regressionsmodell PREDICT logistisches multiple Regressionsmodell RSP Contour PLots (Druckerplot) SEQCENS nonparametrische Regression von überprüften Daten SPLOT schematische PLots (Drucker PLots) SURVTEST Differenzentest zwischen Überlebenskurven TSCSREG Zeitreihen-Querschnitt-Regression

33 SAS - Prozeduren (4) Graphische Prozeduren: HRZ
GANNO plottet durch ANNOTATE definierte data-sets GCHART vertikale und horizontale Barcharts, Kreis-, Stern- und Blockdiagramme GCONTOUR Contour Plot GMAP Landkarten GOPTIONS listet Optionen für SAS/GRAPH auf GPLOT zweidimensionaler Plot GPRINT Häufigkeiten graphisch dargestellt GPROJECT Landkarten dargestellt nach Breiten- und Längengraden GREDUCE erlaubt Teile von Landkarten zu zeichnen GREPLAY reproduziert abgespeicherte Graphiken GSETUP Prozedur für den TEK4027 GSLIDE zeichnet Textzeilen G3D Dreidimensionale Plots

34 SAS - Prozeduren (5) Ökonometrie und Zeitreihenanalyse: HRZ
TIMEPLOT Druckerplot über mehrere Zeitintervale CITIBASE kopiert Daten vom CITIBASE-File in ein Data Set FORECAST bereitet univariate Daten für eine Schätzung vor STATESPACE Analyse und Schätzung multivariater Daten darstellen bestimmter Zeiträume von Zeitreihen SPECTRA bewertet multivariate Zeitreihen nach der Dichte AUTOREG bewertet Parameter in einem Regressionsmodell MATRIX statistische Kalkulation von Zeitreihen SYSREG bewertet Köffizienten im zusammenhängenden System von linearen Gleichungen SIMLIN liest Köffizienten erzeugt von der Prozedur SYSREG MODEL spezifiziert Programmstatements zu einem Modell SYSNLIN bewertet Parameter eines simultanen Systems von nichtlinearen Gleichungen SIMNLIN liest simultane Systeme von nichtlinearen Gleichungen COMPUTAB erstellt Reports nach Zeilen oder Spalten ausgerichtet MORTGAGE erstellt Finanztabellen

35 SAS - Aufruf HRZ

36 SAS - Literatur Originalliteratur ist bei der Firma zu bestellen:
HRZ Originalliteratur ist bei der Firma zu bestellen: SAS User's Guide Basics Version 6 Edition SAS User's Guide Statistics Version 6 Edition SAS User's Guide ETS Version 6 Edition SAS User's Guide GRAPH Version 6 Edition SAS User's Guide FSP Version 6 Edition SAS User's Guide IML Version 6 Edition etc... Sekundärliteratur für SAS: F. FAULBAUM u.a.: Statistik Analyse System , Band 1 Gustav Fischer verlag, Stuttgart, New York, 1983 H.M. ÜHLINGER Datenverarbeitung und Datenanalyse mit SAS. Eine Problemorientierte Einführung Gustav Fischer Verlag, Stuttgart, New York W.-M. KÄHLER SAS für Anfänger Vieweg Verlag Braunschweig/Wiesbaden Schriftenreihe der Uni Hannover erhältlich im Benutzerbüro

37 SAS - Beratung Beratung der stud. Hilfskräfte
HRZ Beratung der stud. Hilfskräfte Mo - Fr, 15: :00 Uhr im Raum SH 205, Tel.: 2933 Ansprechpartner für Statistik: Dennis Jankowski Di und Fr Beratung der Mitarbeiter möglichst nach Vereinbarung N. Terzenbach, SH 216, Tel.: Folien unter: Allgemeine Informationen unter:


Herunterladen ppt "Hochschulrechenzentrum Universität GH Essen"

Ähnliche Präsentationen


Google-Anzeigen