ADAT©2004 Dipl. - Ing. Walter SabinSeite: 1 Version 1.0a Einführung in Reguläre Ausdrücke.

Slides:



Advertisements
Ähnliche Präsentationen
8. Termin Teil B: Wiederholung Begriffe Baum
Advertisements

Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta.
Vorlesung Programmieren II
Zusammenfassung der Vorwoche
Bonn-to-code.net Keine Angst vor Regulären Ausdrücken Martin Winkler
Software-Ergonomie ... und der Mensch ist zufrieden WA
10. Grundlagen imperativer Programmiersprachen
Ich habe nie gelernt, Aufgaben zu lösen
Art der Arbeit (Projekt-/Studien-/Diplomarbeit/
Write two sentences about each person based on the information given.
Java: Grundlagen der Sprache
Dateihandles Um in Perl eine bestimmte Datei zum Lesen, Schreiben oder Anhängen zu öffnen, benötigt man so genannte Dateihandles. Ein Dateihandle ist der.
Alternativen und Muster. Alternativen Gegeben ist eine Tabelle in der ein Attribut der Tabelle Buecher Gruppe genannt wurde. So gibt es unter anderem.
Abfragen aus einer Sprachdatenbank Jonathan Harrington.
Prinzipien des Algorithmenentwurfs Backtracking Prof. Dr. Th. Ottmann
Reguläre Sprachen Karin Haenelt.
Reguläre Ausdrücke Karin Haenelt
© Karin Haenelt 2006, Äquivalenzen Reg.Ausdrücke, Reg.Sprachen, EA ( ) 1 Reguläre Sprachen Karin Haenelt.
EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido
Praxis-Repetitorium JAVA zusätzliche, ergänzende Lehrveranstaltung
Programmierkurs JAVA zusätzliche, ergänzende Lehrveranstaltung
Die Skriptsprache Perl (3) Wolfgang Friebel DESY Zeuthen.
DVG Kommentare1 Kommentare. DVG Kommentare 2 Kommentare Es gibt zwei Arten von Kommentaren: einzeilige Kommentare // der Kommentar geht.
DVG Kommentare 1 Kommentare. 2 Kommentare Es gibt zwei Arten von Kommentaren: einzeilige Kommentare // der Kommentar geht bis zum Ende der Zeile.
Einführung MySQL mit PHP
FH-Hof HTML - Einführung Richard Göbel. FH-Hof Komponenten des World Wide Webs WWW Browser HyperText Transfer Protocol (HTTP) via Internet WWW Server.
Welche Funktion hat die php.ini? -Beinhaltet wichtige Einstellungen für PHP. Genannt seien hier u.a. der Speicherort von Cookies, Parameter der Kompilierung,
09-Dateien und Ordner suchen1 Den Such-Assistenten starten l - SUCHEN oder l Symbol im Ordnerfenster oder Windows-Explorer oder (F) Startfenster des Such-
Was ist ein Betriebssystem?
Die Frage des Tages All make-up work due by If you need to make up a quiz. You may do so before school Thursday, or Friday, or after.
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 37 Version 1.0a Datenmodellierung Modell –Abbild eines Wirklichkeitsausschnittes –Abstraktion – Reduktion auf.
9. Nützliche Techniken 9.1 Textelemente suchen
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
DATIV Ich schreibe meinem Bruder einen Brief.
Programmierung 1. Einführung Seite 1
In German, certain adjectives are often used with certain prepositions. In such cases, dative prepositions will take dative objects, accusative prepositions.
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 1 Version 1.0a XML EXTENSIBLE MARKUP LANGUAGE.
Das Perfekt Present Perfect Tense. By Sarah & Rose.
ADAT©2004,2006 Dipl. - Ing. Walter SabinSeite: 48 Version 1.0a Recovery Wiederherstellung eines konsistenten Datenbankzustandes nach Fehlersituationen.
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 19 Version 1.0a Programme - Zusatzsoftware Oracle: –Forms –Reports –Designer –Jdeveloper –APEX (Application Express)
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 28 Version 1.0a Elementare Datenstrukturen –Tables Ansammlung von rows Jede row enthält eine oder mehrere column(s)
1 Tagesüberblick 2 Lösung Hausaufgabe/Fragen Datei- ein- und ausgabe Schleifen Vergleiche Wahrheit.
SEPARABLE VERBS. Separable verbs have prefixes on them. These prefixes are adverbs and prepositions that are detached from the verb when it is conjugated.
se_10_regulaere_ausdruecke.ppt1 Softwareengineering Reguläre Ausdrücke (regular expressions) Prof. Dr.-Ing. Axel Benz, Berlin School of Economics.
Die Ganze Welt im Computer? Informationsbeschaffung im Internet
NEXT “TENSE” Tiere Verben Geschichten Fragen Team One Team Two Team Three Team Four Team Five Team Six.
1 Tagesüberblick 4 Lösung Hausaufgabe/Fragen Mustervergleiche.
Der formelle Imperativ – the Imperative
Relativpronomen Der Mann ist mein Onkel. --Wir haben den Mann im Theater gesehen. You can express related ideas in separate sentences, or you can.
Java Syntaxdiagramme Buchstabe A B Z a z ... Ziffer
Einfaches Erstellen von Präsentationen aus Einzelfolien heraus.
Deutsch Eins
Die Fragen Wörter Wer? Was? Wann?.
Programmierungssprache PERL
Reguläre Ausdrücke / regular expression. P. Brezany2 =~
Reguläre Ausdrücke / regular expression. P. Brezany2 =~
Reguläre Ausdrücke Stephan Baldes
Modulzuordnung Verknüpfung von Lehrveranstaltungen und Prüfungsordnungen.
“W” Wörter Welche Was für Was Wann Woher Warum Wo Womit Wohin Worüber
Position Sven Koerber-Abe, 2015 ▪ ▪. in Der PC ist in ___ Box.
05-Betriebssysteme1 Was ist ein Betriebssystem? l Programm, das die Verbindung zwischen dem Benutzer, der Software und der Hardware herstellt l Die Installation.
Arbeiten mit WordSmith 4. Inhalt 1. Arbeiten mit der Funktion Wortliste (im getaggten Korpus) 1. Arbeiten mit der Funktion Wortliste (im getaggten Korpus)
Da- und Wo- Verbindungen Mit denen kann man viel anfangen!
Regular Expressions HBU-LINUX-2003 Adduser.sh? My_user_Verw.sh? AufgUser.sh? Wo ist das Script ??????? /home/donald ? /home ? /tmp ?
Interrogatives and Verbs
Left Join, Right Join, Outer Join
DATIV Ich schreibe meinem Bruder einen Brief.
Grammatik Kapitel 6-Stufe 2
Helping Verbs Deutsch I Kapitel 3-1.
 Präsentation transkript:

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 1 Version 1.0a Einführung in Reguläre Ausdrücke

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 2 Version 1.0a Was ist das Problem? Beispiel: –Überprüfen von HTML Dateien auf verdoppelte Worte (z.B. das das) –Auch über Zeilenenden hinweg –ohne Berücksichtigung von "White Space" –ohne Berücksichtigung von HTML Tags (z.B. sehr sehr....)

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 3 Version 1.0a Dateinamen "Wildcards" oder "Dateiglobs" –Beispiel (MS DOS): dir 10?s*.bat –Welche Dateien werden damit gefunden? Begrenzte Ausdrucksfähigkeit Limitierter Problemumfang nicht möglich: –Suche von Dateinamen beginnend mit ab gefolgt von 1 bis 4 beliebigen Zeichen und endend auf hx.txt

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 4 Version 1.0a Reguläre Ausdrücke Elemente Aufgebaut aus 2 Typen von Zeichen: –Metazeichen - Sonderzeichen wie z.B. "*" bei Dateinamen –Literale - alle anderen Zeichen Muster sollen durch Metazeichen erkannt werden. Ähnlich einer Programmiersprache –z.B. ^(From|Subject): –findet Zeilen, die mit From oder Subject beginnen und danacheinen : haben

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 5 Version 1.0a Reguläre Ausdrücke - Beispiel –s! ([0-9]+(\.[0-9]+){3}) ! $1 ! Sucht IP Adressen, die von den Tags und und –Allgemeines Problem: Ersetze Dies durch das –Ausdrücke werden aus Bausteinen aufgebaut

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 6 Version 1.0a Verwendung von Regulären Ausdrücken Textstücke in Dateien suchen Texteditoren (z.B.: UltraEdit) Unix Programm egrep –egrep optionen 'Muster' – egrep -ni '^to' x.txt y.txt Sucht in den Dateien x.txt, y.txt nach dem Muster 'to' am Anfang jeder Zeile ohne Berücksichtigung von Groß und Kleinschreibung und mit Ausgabe von Zeilennummern

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 7 Version 1.0a Verwendung von Regulären Ausdrücken (Fs.) Ergebnis: –x.txt:11:to test or verify the security of this system. During monitoring, information x.txt:17:to monitoring of this system. Unauthorized use may subject you to criminal x.txt:22:To be or not to be is the question y.txt:11:to test or verify the security of this system. During monitoring, information y.txt:17:to monitoring of this system. Unauthorized use may subject you to criminal y.txt:22:To be or not to be is the question

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 8 Version 1.0a Verwendung von Regulären Ausdrücken (Fs.) Metazeichen (speziell - Position): –^.. Zeilenanfang –$.. Zeilenende Literale: to Optionen: –i.. Case insensitiv –n.. Nummerierung der Zeilen Dateinamen x.txt y.txt

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 9 Version 1.0a Zeichenklassen [....] Suche nach Listen von Zeichen –oder Verknüpfung aller dieser Zeichen –beliebig viele zeichen Beispiel: 'B[iu]rma' –passt auf Birma und Burma Beispiel: '[rR]ot' –passt auf Rotwein, rot, Protest –aber nicht auf rRot

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 10 Version 1.0a Zeichenklassen (Fs.) Metazeichen in Liste: –'-' von bis Beispiel: ' ' erkennt die Header in HTML ' ' äquivalent zu vorigem Beispiel [a-z].. erkennt alle Kleinbuchstaben [a-z0-9A-Z].. mehrere Bereiche sind zulässig –Worauf passt '^ding$' oder '^$' oder '^' ? –'-' ist außerhalb der Zeichenklasse kein Metazeichen!

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 11 Version 1.0a Zeichenklassen (Fs.) Negierte Zeichenklassen –'[^...] –'[^1-6] erkennt alle Zeichen außer 1,2,3,4,5 oder 6 –'q[^u]'.. sucht ein 'q' das nicht von einem 'u' gefolgt ist wie z.B. Iraqi. –Warum wird Qantas oder eine Zeile mit Iraq nicht gefunden? '^' hat je nach Zusammenhang unterschiedliche Bedeutungen. (wie z.B. das Wort Hahn)

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 12 Version 1.0a Beliebiges Zeichen / Alternation Das Metazeichen '.' prüft auf ein beliebiges Zeichen Beispiel '03[-./]11[-./]2005' findet beliebige Schreibweisen ' ' findet auch ' ' –Was ist der Unterschied? Alternation - Metazeichen '|' Begrenzung der Reichweite mit ( ) –Beispiel: 'Jeffrey|Jeffery' oder 'Jeff(rey|ery)' oder 'Jeff(re|er)y' –'^From|Subject|Date:' oder '^(From|Subject|Date):' - Unterschied?

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 13 Version 1.0a Wortgrenzen / Optionale Elemente rot kommt auch in Protest vor Metassequenzen –'\<' Wortanfang (Anfang einer alphanumerischen Zeichenfolge) –'\>' Wortende (Ende einer alphanumerischen Zeichenfolge) Metazeichen '?' bedeutet optional –Position hinter dem gesuchten Zeichen –Was findet 'July? (fourth|4(th)?)

ADAT©2004 Dipl. - Ing. Walter SabinSeite: 14 Version 1.0a Wiederholungen '+' ein oder mehr des vorausgehenden (1.. n) '*' beliebig viel des vorausgehenden (0.. n) +,*,?.. Quantifier Beispiel: – {n,m} Explizites Minimum und Maximum –Beispiel: [a-zA-Z]{1,5} - Zeichenfolge aus 1 bis 5 Alphazeichen