Die Bourne-Shell (cygwin), UNIX- Tools und treetagger Seminar: Strukturierung und Analyse linguistischer Korpusdaten Leiter: Leiter: Dr. Christian Riepl.

Slides:



Advertisements
Ähnliche Präsentationen
Be.as WEB Technologie
Advertisements

PC-Senioren Ludwigsburg
Ausführen.
Wiederholung Betriebssystem bietet eine Abstraktion der Hardware an:
DVG Dateien Dateien. DVG Dateien 2 Die Klasse File Die Klasse File stellt die Verbindung zwischen dem Filesystem des Rechners und dem.
Sortieren I - Bubblesort -
Teil II : Benutzerebene eines Rechners
C.M. Presents D.A.R. und Ein Bisschen dies und das!
PowerPoint-Makros für DScript
Unix-Shells Shell: Unix-Shell-Varianten:
Dateihandles Um in Perl eine bestimmte Datei zum Lesen, Schreiben oder Anhängen zu öffnen, benötigt man so genannte Dateihandles. Ein Dateihandle ist der.
ARRAY oder FELD oder VEKTOR
Der Präprozessor. Bevor der Compiler das Programm in Maschinencode übersetzt (nur dieser kann von der CPU, dem Herz des Computers, bearbeitet werden)
Grundlagen im Bereich der Tabellenkalkulation
1A: POSIX POSIX (Portable Operating System) ist ein Standard für UNIX-Systeme. Er dient dazu, Programme portabel unter UNIX und Derivaten zu tauschen und.
Eingabeaufforderung (EA) Windows I Nützliche Kommandos (Kommando und /? liefert meist eine Liste von Optionen): cd bzw. chdir: change directory, wechselt.
Zusammenfassung Vorwoche
UNIX SHELL Christian Benz SS #!/bin/bash.
Programmierung 1 - Repetitorium
und Grepmechanismus unter UNIX
UNIX und C Einleitung EDV1 - 01Einführung.
UNIX-Dateisystem Vortrag: Ronny Kuhnert am
EDV1 - 02ManualPages Das UNIX-Hilfesystem. EDV1 - 02ManualPages 2 UNIX - Hilfesystem Die Manualpages sind in Sektionen unterteilt: 1.User Commands – alle.
UNIX und C Einleitung.
EDV1 - 02ManualPages 1 Das UNIX- Hilfesystem. 2EDV1 - 02ManualPages UNIX - Hilfesystem Die Manualpages sind in Sektionen unterteilt: Die Manualpages sind.
Datenströme DVG Datenströme.
Universität Osnabrück Mobile Computing Seminar SS 2003 SMS-gestützte Datenbankanbindung Patrick Fox
© 2005 Pohlig - Taulien Datenströme GK Informatik 1 Datenströme.
Der VFP Debugger - Coverage und Profiling. © 1999 TMN-Systemberatung GmbH Der VFP Debugger n Neues Aussehen, eigene Task n Erweiterte Möglichkeiten n.
Kakuro Regeln und Strategien
Einleitung Suse Linux (System- und Software-Entwicklung) Allgemein:
Eine Bewerbung schreiben
Programmieren mit MS Small Basic
Einführung in die Programmiersprache C 1
SOFTWARE.
Linux GOIT – Der Kurs. Linux GOIT – Der Kurs Geschichte Mainframes (IBM System/360) Workstation Personal Computer Stapelverarbeitung Workstation Mehrbenutzersystem.
DOS GOIT Der Kurs. Versionen 1.0 (1981 – Erster IBM-PC) 2.0 (1983 – Unterverzeichnisse) 3.0 (1984 – Festplatten) 4.0 (1988 – DOS Shell) 5.0 (1991 – Task.
© 2000,2001,2002 Rader Udo, bestsolution.at GmbH released under the GNU Free Documentation License, Version 1.1 graphische Oberfläche.
Gliederung Was ist Linux? Desktop Environment Die Shell Tux His
Seminar Internet Technologien
Betriebssysteme: Unix
Einführung in 2 Betriebssysteme
Datei -> Optionen -> …
Informatik II Grundlagen der Programmierung Programmieren in C Benutzerinteraktion / Ein- und Ausgabe Hochschule Fulda – FB ET Sommersemester
DATEISPEICHER in der S P S
1 Tagesüberblick 2 Lösung Hausaufgabe/Fragen Datei- ein- und ausgabe Schleifen Vergleiche Wahrheit.
Kommandozeile und Batch-Dateien Molekulare Phylogenetik – Praktikum
Programmieren in C Dateien
Einführungstutorial: Linux Konsole
Von Eduard Dörr, Alina Wolf, Xenia Tschetschjotkin
Excel Grundlagen.
1 Tagesüberblick 4 Lösung Hausaufgabe/Fragen Mustervergleiche.
Alois Schütte Advanced System Programming 2 Interprozeßkommunikation  2.1 JVM Ablaufumgebung  2.2 Java Native Interface (JNI)  Verwendung von.
1 Tagesüberblick 5 Lösung Hausaufgabe/Fragen Assoziative Felder Funktionen zu Variablenbehandlung.
Universität zu Köln WS 2012/13 Seminar: IT-Zertifikat der Phil.-Fak.: Allgemeine Informationstechnologien I Dozentin: Susanne Kurz M.A. Referenten: Irina.
Übung Betriebssystem, Uni Innsbruck 1 Projekt1: Prozesse unter Unix Teil I Grundlagen von Unix.
Ein- und Ausgabe in Java Packet: java.io
Pool Informatik, Sj 11/12 GZG FN W.Seyboldt 1 Pool Informatik 5 GZG FN Sj. 11/12 Kopieren, Daten, Programme.
Funktionen. Aufgabe : Eingabe zweier Zahlen ---> Minimum bestimmen Dann nochmals Eingabe zweier Zahlen ---> Minimum bestimmen.
 Am Ende der letzten Stunde hatten wir über die Grenzen unserer Automaten-Modell gesprochen. Dr. Lars Ettelt2  Tipp: Parkhaus.  Einfahrt erst wenn.
Arbeiten mit WordSmith 4. Inhalt 1. Arbeiten mit der Funktion Wortliste (im getaggten Korpus) 1. Arbeiten mit der Funktion Wortliste (im getaggten Korpus)
1 Suchprofile erstellen und verwalten. 2 Suchprofile bei Registrierung Hier können Sie bis zu drei Suchprofile einrichten. Diese finden Sie später unter.
Regular Expressions HBU-LINUX-2003 Adduser.sh? My_user_Verw.sh? AufgUser.sh? Wo ist das Script ??????? /home/donald ? /home ? /tmp ?
Besitzrechte. Datei- und Verzeichnis-Besitzer Dateien und Verzeichnisse gehören einem Benutzer und einer Gruppe Besitzer wird bei ls -l in der dritten.
Ein-/ Ausgabe in Java ein Überblick. © eigentlich ganz einfach ? Ein-/Ausgabe durch package java.io Ausgabe (auf Konsole) mit System.out.println()
1 Shell Manuel Blechschmidt & Volker Grabsch CdE Sommerakademie 2006 Kirchheim.
Programmieren in C Dateien
Betriebssysteme LB BB SS2017
 Präsentation transkript:

Die Bourne-Shell (cygwin), UNIX- Tools und treetagger Seminar: Strukturierung und Analyse linguistischer Korpusdaten Leiter: Leiter: Dr. Christian Riepl und Dr. Stephan Lücke Referentin: Olga Zabolotskykh Datum:

Was ist Shell? Weil die direkte Kommunikation mit dem Betriebssystem-Kern (UNIX) für einen Benutzer viel zu komplex wäre, ist eine vereinfachte Benutzer-Schnittstelle erforderlich. Die Rolle dieser Schnittstelle spielt Shell. Der englische Ausdruck Shell, zu Deutsch etwa Schale, drückt diesen Sachverhalt bereits aus. Jedenfalls lässt sich eine Shell als eine Schicht zwischen Betriebssystem und Benutzer verstehen.

Diese Schicht kann folgenderweise veranschaulicht werden

Die wichtigsten Vertreter sh:Bourne ShellDie Mutter aller Shells csh:C-Shell Shell mit C-aehnlicher Syntax ksh:Korn Shell Maechtige, C-orientierte Shell (Solaris) zsh:Z-Shell Erweiterte, komfortableShell, Bash kompatibel bash:Bourne Again SH Erweiterte, komfortable Bourne Shell

Cygwin-Shell Drei Kanäle für den Datenfluss: Den Standardeingabe- (stdin) Standardausgabe- (stdout) und Standardfehlerkanal (stderr)- Normalerweise erfolgt die Eingabe von Befehlen und/oder Text über die Tastatur (Standardeingabe). Alles, was Cygwin produziert, wird auf dem Standardausgabekanal, dem Bildschirm (im Cygwin-Fenster) ausgegeben und ist unter Umständen schon dann „verloren“, wenn der Text durch die Ein-/Ausgabe weiterer Befehle/Ergebnisse am oberen Rand des Cygwin-Fensters verschwunden ist. Der Standardfehlerkanal ist nur im Rahmen der Shell-Programmierung wichtig; auf ihn soll hier nicht näher eingegangen werden.

Die Standardeingabe, die Standardausgabe und die Standardfehlerausgabe kann man umlenken, d.h. man kann z.B. aus einer Datei statt von der Tastatur lesen oder in eine Datei statt auf das Terminal schreiben. Für die Eingabeumlenkung gibt es das "<"-Zeichen (Kleinerzeichen): wc -l < test.txt liest aus der Datei test.dat und schreibt das Ergebnis auf den Bildschirm. (Anmerkung: das Kommando wc gibt die Anzahl der Zeichen, Wörter und Zeilen der Datei test.txt zurück) Obiges Kommando hätte man allerdings auch folgenderweise aufrufen können: wc -l test.txt

Für die Ausgabeumlenkung benutzt man das Größerzeichen, also ">": ls > dir.txt ls liefert den Inhalt des aktuellen Verzeichnisses, also die Namen der Dateien und der Unterverzeichnisse. Die Umlenkung bewirk, dass das Ergebnis in dir.txt gespeichert wird. Falls die Datei vor dem Aufruf bereits existierte, wird sie mit dem neuen Inhalt überschrieben In vielen Fällen möchte man jedoch die Ausgaben eines Kommandos an eine bestehende Datei hinten anhängen. Dies ist bei Logdateien im Prinzip der Normalfall. Dies lässt sich ganz einfach bewerkstelligen, statt eines Größerzeichens benutzt man zwei Größerzeichen ">>“: ls >> dir.txt

PIPES Eine der großen Stärken von Linux (Unix) liegt in der Möglichkeit, Kommandos beliebig zu neuen Komandos zu kombinieren. Die Hintereinanderausführung von Kommandos nennt man Pipe (englisch: Röhre). Unter Hintereinanderausführung versteht man, dass die Ausgaben des ersten (zeitlich) Programmes als Eingaben für das nächste Programm verwendet werden. Der senkrechte Balken (|) verbindet die Kommandos zu einer Pipe. kommando1 | kommando2 | kommando 3 Zum Beispiel: ls | less

Häufig verwendete Befehle BefehlBeispielBeschreibung wgetwget auf Festplatte kopieren catcat datei1.txt datei2.txtden Inhalt der beiden Dateien wird unmittelbar hintereinander geschrieben und auf dem Bildschirm ausgegeben pastepaste datei1.txt datei2.txtZusammenfügung von zwei oder mehr Dateien in der Weise, dass die korrespondierenden Zeilen jeder Datei zu jeweils einer Zeile zusammengefügt werden, wobei zwischen den Ausgangszeilen jeweils ein Tabulator gesetzt wird. cdcd /tmpWechselt in das genannte Verzeichnis (change directory) cmpcmp [OPTION]... FILE1 FILE2Vergleicht zwei Dateien auf Übereinstimmung (compare two files byte by byte)

BefehlBeispielBeschreibung cutcut -c 4-10 text.txtschneidet von jeder Zeile eine zu definierende Anzahl von Buchstaben/Zeichen oder Spalten aus. filefile datei.txtliefert Informationen zur Art einer Datei und, im Fall, dass es sich um eine Textdatei handelt, zur darin verwendeten Zeichen- und Zeilenende-Kodierung. grepgrep –i regexp datei.txt„global/regular expression/print”. Durchsucht Datei nach einem regulären Ausdruck und gibt passende Zeilen aus. i – Groß/Kleinschreibung ingnorieren. lessless datei.txteine bestimmte Anzahl Zeilen einer Datei anzeigen odod datei.txtgibt den Inhalt der Datei in Zahlengestalt aus, wobei in der Standardeinstellung für die Darstellung der Zahlen das oktale Zahlensystem verwendet wird

BefehlBeispielBeschreibung pwd gibt das aktuelle Verzeichnis aus (print working directory) lsls –l /verzeichnis ls – a /verzeichnis Gibt den Inhalt eines Verzeichnisses aus (list); -l - langes Format -a – auch versteckte Dateien rmrm datei.txtlöscht Datei (remove) rmdirrmdir verzeichnis rmdir –p verzeichnis Verzeichnis löschen (remove directory); -p (parents) – Verzeichnisbaum löschen, wenn es leer sedsed regexp/replaceNicht-interaktiver Editor, verändert die Originaldatei nicht! Es schreibt lediglich das Ergebnis der Befehlsausführung auf die Standardausgabe sortsort datei.txt sort – r datei.txt sort – n datei.txt sortiert Datei, -r – rückwärts sortieren -n – numerisch sortieren

BefehlBeispielBeschreibung tailtail datei.txtGibt die letzten Zeilen einer Datei aus headhead datei.txtGibt die ersten Zeilen einer Datei aus wcwc –c datei.txt wc –m datei.txt wc –l datei.txt wc –w datei.txt Gibt die Anzahl der Bytes aus Gibt die Anzahl der Zeichens aus Gibt die Anzahl der Zeilen aus Gibt die Anzahl des Wörteraus

Treetagger Die TreeTagger ist ein Tool für automatische Lemmatisierung und Part-of-speech-Tagging Entwickler – Helmut Schmid, Institut für Computerlinguistik an der Universität Stuttgart Sprachen, mit denen TreeTagger „arbeitet“: Deutsch, Englisch, Französisch, Italienisch, Niederländisch, Spanisch, Bulgarisch, Russisch, Portugiesisch, Galizisch, Chinesisch, Swahili, Slowakisch, Slowenisch, Latein, Estnisch, Polnisch und Altfranzösisch. muenchen.de/~schmid/tools/TreeTagger/ muenchen.de/~schmid/tools/TreeTagger/

Danke für die Aufmerksamkeit!