Sächsisches Bildungsinstitut, F+T-Zentrum Meißen SBI00643 Fachbezogene Fortbildung für Fachberater im Fach Informatik an Gymnasien „Theoretische Informatik (TI) – Theoretische Grundlagen von Programmiersprachen“ mit der Lernumgebung AtoCC Christian Wagenknecht, Michael Hielscher Meißen, 09.04.-11.04.08
Das Wichtigste zuerst! Vielen Dank an Herrn Wolfgang Rafelt Erster Kontakt: 25.05.07
Zeitplan und Ziele Mittwoch, 09.04.08, 15:00-17:30: Einführung, Installation, ZR-Compiler (TDiag) Donnerstag, 10.04.08, 09:00-10:30: Formale Grammatik für ZR inkl. Grundbegriffe (kfGEdit) 11:00-12:30: DEA für Zahl und Farbwert (AutoEdit), reguläre Ausdrücke 13:30-15:00: DKA für kfS (AutoEdit), Beispiel: WH n [...] 15:15-17:30: Compiler = Analyse + Synthese (VCC) Analyse: Scanner, Parser; Zielsprache: PS; TDiagramm Freitag, 11.04.08, 09:00-10:30: Projekt "Notensprache" – Quellsprache, Zielsprache, Werkzeuge; Übersetzungsmodell, Grammatiken, reduzierte Gramm. 11:00-12:30: DEA, reguläre Ausdrücke, Compiler, TDiag (Projektende) 13:30-14:00: Turingmaschinen, Hinweis auf Automaten mit Ausgabe (Mealy-, Moore-Automaten, nicht LP-Gegenstand) Ende des Kurses
Lehrplan Ziele und Inhalte In den meisten Bundesländern sind ausgewählte Inhalte der TI Lehrplaninhalt der Sek. II: Nr. Bundesland Lehrplaninhalt (Lernbereich) Pflichtbestandteil 1 Baden-Württemberg Bereich der theoretischen Informatik (Automaten, Berechenbarkeit) nein 2 Bayern 3. Formale Sprachen (noch Entwurf) 3 Berlin 4.4 Sprachen und Automaten ja (auch GK) 4 Brandenburg Ja (auch GK) 5 Bremen Grundlagen der Theoretischen Informatik (Automaten, formale Sprachen) 6 Hamburg Formale Sprachen, endliche Automaten, Kellerautomaten, Scanner, Parser, Ableitungsbaum nein 7 Hessen Formale Sprachen und Grammatiken Automaten, Fakultativ: Übersetzerbau 8 Mecklenburg-Vorpommern ja (auch GK) 9 Niedersachsen Eigenschaften endlicher Automaten Aspekte formaler Sprachen 10 Nordrhein-Westfalen Endliche Automaten und formale Sprachen 11 Rheinland-Pfalz Formale Sprachen und Automaten zur Sprachbeschreibung und Spracherkennung ja (nur LK) 12 Saarland Automaten und formale Sprachen Fakultativ: Übersetzerbau 13 Sachsen 8 A: Formale Sprachen, Kellerautomat, Akzeptor 14 Sachsen-Anhalt 15 Schleswig-Holstein Automaten als mögliches Themengebiet 16 Thüringen Themenbereich 7.3: Einblick in formale Sprachen
Lehrplanauszug Hessen Verbindliche Unterrichtsinhalte/Aufgaben: Formale Sprachen und Grammatiken reguläre und kontextfreie Grammatiken und Sprachen Anwendung mit Syntaxdiagrammen Chomsky-Hierarchie (LK) kontextsensitive Sprachen (LK) Endliche Automaten Zustand, Zustandsübergang, Zustandsdiagramm Zeichen, Akzeptor Simulation realer Automaten (z. B. Getränkeautomat) Anwendung endlicher Automaten (z. B. Scanner) deterministische und nicht-deterministische Automaten (LK) reguläre Ausdrücke (LK) Mensch-Maschine-Kommunikation (LK) Kellerautomaten (LK, GK fakultativ) Automat mit Kellerspeicher kontextfreie Grammatiken Klammerausdrücke, Rekursion Turing- oder Registermaschine Turing- oder registerberechenbar Churchsche These Computer als universelle symbolverarbeitende Maschine Verhältnis Mensch-Maschine Fakultative Unterrichtsinhalte/Aufgaben: Übersetzerbau Scanner, Parser, Interpreter und Compiler z. B. Steuersprache für Roboter, LOGO, Plotter oder miniPASCAL
Lernbereich 8 A (Sächs. Lehrplan) endlicher Automat GK Informatik f. Jahrgangsstufen 11 und 12, wird ab Schuljahr 2008/09 wirksam
TI-Inhalte in der Schulinformatik: Probleme und Chancen Blick in die Lehrpläne verschiedener Bundesländer totale Überfrachtung mit Fachinhalten Formulierung von Wunschvorstellungen (z.B. TI + Compiler) (geringe didaktische Erfahrung) Besondere Spezifik der TI (mathematische Denktechniken vs. ingenieurwissenschaftlicher Arbeitskontext der SE) wird nicht ausreichend berücksichtigt Inhalts/Zeit-Relation Verinnerlichung von Inhalten Kompetenz und Motivation des Lehrpersonals
Gefühlssituation der Lehrenden "TI wollte ich nie machen." "TI hat mich nie richtig interessiert." "TI war mir immer zu theoretisch und abstrakt." "Die TI-Dozenten waren suspekt – TI im postgradualen Studium erinnere ich mit Grausen." "Die TI-Inhalten helfen mir nicht, wenn das Schulnetzwerk mal wieder zusammenbricht." ...
TI-Inhalte in der Schulinformatik: Probleme und Chancen Zeit-Problem, Inhalte-Problem (Zusammenfassung von oben) Manche Lehrende mögen es nicht. – Motivationsproblem Manche Lehrende können es nicht richtig. - Qualifikationsproblem SchülerInnen/Studierende fragen gelegentlich: "Wann geht es denn nun endlich richtig los mit der Informatik? Ach so, das ist es schon." - Vermittlungsproblem "Ergebnis": Wenn möglich, TI weglassen. FALSCH!!! Chance: Informatik als Wissenschaft repräsentieren! (wie Mathematik und Naturwissenschaften) Sonst: Studienabbrecher als konkrete Folge!!!
Didaktische Software für TI in Schulen: diverse Simulationstools oder Lernumgebungen, wie Kara; meist von enthusiastischen LehrerInnen entwickelt in Hochschulen: Systeme für die Lehre, wie JFLAP LEX und YACC für die Hand des Ingenieurs Simulationstool – Bildungsserver Hessen
Unsere Ziele – nicht ohne AtoCC!!! Belastbare Motivation für TI-Inhalte durch herausfordernde Start-Fragestellung mit Praxisrelevanz und Modellierung eines Zielsystems (Sprachübersetzer) am Anfang Vermittlungs-/Anwendungszyklen für TI-Wissen mit Projekt- bezug (Praxis nicht als "Anhängsel" zur Theorie) Komplexe Anwendung von TI-Inhalten auf sehr hohem Abstraktionsniveau (automatisierte Compiler-Generierung), Rückkehr zur und Konkretisierung der Modellierungsebene Behauptung: Dabei ist AtoCC ein unverzichtbares Hilfsmittel.
Beispiel: ZR – eine Sprache für einen Zeichenroboter 12 Praxisnahe (echte!) Aufgabe mit grafischer (akustischer) Ausgabe: Entwickeln Sie einen Compiler, der die Sprache ZR (ZeichenRoboter) in PDF übersetzt. (Schülergerecht formulieren!) Eingabewort (in ZR): WH 36 [WH 4 [VW 100 RE 90] RE 10] Sprachelemente: VW n VorWärts n Schritte RE n Rechts um n Grad WH n [ ... ] WiehderHole n-mal [...] FARBE f StiftFARRBE f STIFT n Strichstärke n Aufgabe: Verwenden Sie den fertigen Compiler zr2pdf blume.zr (konsole.bat aufrufen, blume.zr ansehen) 12
Beispiel: ZR – eine Sprache für einen Zeichenroboter 13 Der Zeichenroboter kann auch mehr: BunteBlume.zr 13
Beispiel: ZR – eine Sprache für einen Zeichenroboter 14 Weiterer Ablauf: Modellierung der Problemlösung mit TDiag Syntax-Definition von ZR: formale Grammatik, Ableitungsbaum mit kfGEdit Parser Akzeptoren Automatenmodelle (EA, KA) mit AutoEdit Arbeitsteilung: Scanner, Parser Zielsprachenbezug automatisierte Compiler-Entwicklung mit VCC Teilsysteme werden in Modellierung eingebracht (TDiag) Ergebnis: lauffähiger (nichttrivialer) Übersetzer, den man benutzen kann! TDiag, kfGEdit, AutoEdit, und VCC sind Bestandteile von AtoCC. 14
Beispiel: ZR – eine Sprache für einen Zeichenroboter Wir wollen zunächst den Übersetzungsprozess entwerfen modellieren Verwendung von T-Diagrammen: T-Diagramme bestehen aus 4 Bausteintypen. Compilerbaustein, Programmbaustein, Interpreterbaustein und Ein/Ausgabe-Baustein Ein/Ausgabe an Programmbaustein Compiler Programm Interpreter
Beispiel: ZR – eine Sprache für einen Zeichenroboter T-Diagramm: 1. Entwurf ZR2PDF möchte niemand schreiben!!!
Beispiel: ZR – eine Sprache für einen Zeichenroboter T-Diagramm: 2. Entwurf ZR2PS werden wir entwickeln, PS2PDF und Acrobat Reader wird vom System bereitgestellt.
Beispiel: ZR – eine Sprache für einen Zeichenroboter Nachdem wir nun wissen, wie unser Compiler später zur Übersetzung eingesetzt werden soll, wenden wir uns der Entwicklung des Compilers zu. Sprache näher betrachten Terminale und Nichtterminale festlegen formale Grammatik definieren Ableitungsbäume erzeugen
Beispiel: ZR – eine Sprache für einen Zeichenroboter Betrachten wir die Sprache ZR und versuchen wir ihren Aufbau zu beschreiben: VW 50 RE 270 RE 45 WH 2 [VW 100] WH 4 [VW 100 RE 100] WH 36 [WH 4 [VW 100 RE 90] RE 10] Magnetkarten an der Tafel
Beispiel: ZR – eine Sprache für einen Zeichenroboter Beschreiben wir den Baustein Zahl genauer: 0 soll in ZR keine Zahl sein, da VW 0 oder RE 0 keine Veränderung herbeiführen. Vorangestellte Nullen, wie bei 0815, wollen wir auch nicht erlauben. Ergänzen wir unsere Grammatik um: Zahl ErsteZiffer Ziffern Ziffern Ziffer Ziffern | Ziffer 0 | 1 | ... | 9 ErsteZiffer 1 | 2 | ... | 9
Beispiel: ZR – eine Sprache für einen Zeichenroboter
Beispiel: ZR – eine Sprache für einen Zeichenroboter
Beispiel: ZR – eine Sprache für einen Zeichenroboter
Beispiel: ZR – eine Sprache für einen Zeichenroboter Programm Anweisungen Anweisungen Anweisung Anweisungen | EPSILON Anweisung VW Zahl | RE Zahl | WH Zahl [ Anweisungen ] | FARBE Farbwert | STIFT Zahl Farbwert rot | blau | gruen | gelb | schwarz Zahl ErsteZiffer Ziffern Ziffern Ziffer Ziffern | EPSILON Ziffer 0 | 1 | ... | 9 ErsteZiffer 1 | 2 | ... | 9
Kontextfreie Grammatik Grammatikdefinitionen immer vollständig angeben! G=(N,T,P,s) kfG, d.h. Regeln haben die Gestalt X b, mit |x| |b| Hinweis auf Chomsky-Hierarchie (s. TI-Vorlesungen); Grammatik-Transformationen in Betracht ziehen Hervorzuhebendes Problem bei kfG: Mehrdeutigkeit; Eingabewort: if a1 then if a2 then s1 else s2 S -> if E then S | if E then S else S | s1 | s2 E -> a1 | a2 Dangling else Lösung: S -> S1 | S2 S1 -> if E then S1 else S1 | s1 | s2 S2 -> if E then S | if E then S1 else S2 E -> a1 | a2
Beispiel: ZR – eine Sprache für einen Zeichenroboter Automaten als Akzeptoren für Sprachen Akzeptor prüft, ob ein Wort zur Sprache gehört oder nicht. (Keine Ausgabe Wort akzeptiert) (Thema: Programmiersprachen und Syntaxfehler) Wir nehmen zwei Ausschnitte aus den Produktionen: Zahl ErsteZiffer Ziffern Ziffern Ziffer Ziffern | EPSILON Ziffer 0 | 1 | ... | 9 ErsteZiffer 1 | 2 | ... | 9 Anweisungen Anweisung Anweisungen | EPSILON Anweisung VW Zahl | WH Zahl [ Anweisungen ]
Beispiel: ZR – eine Sprache für einen Zeichenroboter Kleiner Sprachausschnitt: Zahl ErsteZiffer Ziffern Ziffern Ziffer Ziffern | EPSILON Ziffer 0 | 1 | ... | 9 ErsteZiffer 1 | 2 | ... | 9
Beispiel: ZR – eine Sprache für einen Zeichenroboter
Übungsaufgabe Geben Sie eine (reguläre) Grammatik für die Sprache der Uhrzeiten an. Entwerfen/Erzeugen Sie einen Automaten. Vorgehen (allgemein): Beispielwörter, Beispiel-Nichtwörter, Muster, Muster spezifizieren, Grammatik entwerfen, Beispielwörter testen, Grammatik "justieren" bzw. transformieren bzw. nach alternativer Idee neu entwerfen, Automat generieren (hier: regGr NEA DEA)
Lösung der Übungsaufgabe Muster: ab : cd, a=0,1,2; b=0,1,2,3,4,5,6,7,8,9, wenn a=0,1 b=0,1,2,3, wenn a=2 c=0,1,2,3,4,5; d=0,1,2,3,4,5,6,7,8,9 U -> A : C A -> 0 B | 1 B | 2 Q B -> 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 Q -> 0 | 1 | 2 | 3 C -> 0 B | 1 B | 2 B | 3 B | 4 B | 5 B ... ist nicht regulär (Prüfknopf in kfGEdit) – erste Regel! (aber eine schöne kfG)
Lösung der Übungsaufgabe Regelbildung – rechte Seiten: Erstes Zeichen (Terminal) und Rest (Nichtterminal) U -> 0 H | 1 H | 2 K H -> 0 B | 1 B | 2 B | 3 B | 4 B | 5 B | 6 B | 7 B | 8 B | 9 B B -> : C C -> 0 Z | 1 Z | 2 Z | 3 Z | 4 Z | 5 Z Z -> 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 K -> 0 R | 1 R | 2 R | 3 R R -> : C Vollständige Definition angeben! s. kfGEdit
Lösung der Übungsaufgabe DEA für die Sprache der Uhrzeiten: regGr NEA DEA
Lösung der Übungsaufgabe Ein zugehöriger NEA ist konzeptionelle wesentlich übersichtlicher, erfordert aber eine grundlegende Behandlung des Nichtdeterminismus.
Beispiel: ZR – eine Sprache für einen Zeichenroboter Anweisungen Anweisung Anweisungen | EPSILON Anweisung VW n | WH n [ Anweisungen ] DKA für obigen Grammatik-Ausschnitt
Beispiel: ZR – eine Sprache für einen Zeichenroboter
Beispiele für DKA und NKA Musterbeispiele: Sprache der Palindrome über {0,1} Sprache der Palindrome über {0,1} mit (durch !) markierter Wortmitte Für 1 gibt es keinen DKA, für 2 NKA und DKA. Studienaufgabe: DKA für (n>0).
Beispiele für DKA und NKA Lösung: Sprache der Palindrome über {0,1} mit (durch !) markierter Wortmitte
Beispiel: ZR – eine Sprache für einen Zeichenroboter Aus der Kombination von kleinen endlichen Automaten und einem Kellerautomaten wird später unser Compiler bestehen. Für EA-Sprachen können auch reguläre Ausdrücke verwendet werden: Beispiel Zahl (nicht 0, ohne Vornullen): [1-9][0-9]*
Reguläre Ausdrücke für reguläre Sprachen
Reguläre Ausdrücke für reguläre Sprachen
Reguläre Ausdrücke für reguläre Sprachen Reguläre Ausdrücke zur Definition regulärer Sprachen Zahlen in ZR: [1-9][0-9]* Aktuelle Syntax von RegExp ist dem Gebrauch als Filter in vielen PS angepasst. Z.B. [...] Zeichenauswahl – genau ein Zeichen aus ... s. Arbeitsblatt: Reguläre Ausdrücke in Programmiersprachen.pdf Achtung: Rückwärtsreferenzen führen aus der Klasse der regulären Sprachen heraus.
Arbeitsweise des Compilers Quelltext in ZR Scanner Tokenliste Parser Ausgabe in Ziel-sprache
Arbeitsweise eines Scanners Quelltext in ZR Scanner Tokenliste Ein- und Ausgabe des Scanners: Quelltext besteht aus Zeichen und der Rechner weiß noch nicht wie diese zusammengehören. Viele kleine endliche Automaten entscheiden welche Schlüsselworte im Quelltext stehen. Token als Paare [Tokenname, Lexem] z.B.: [Wiederhole, "WH"] [Zahl, "12"] [KlammerAuf, "["]
Beispiel: ZR – eine Sprache für einen Zeichenroboter Programm Anweisungen Anweisungen Anweisung Anweisungen | EPSILON Anweisung VW Zahl | RE Zahl | WH Zahl [ Anweisungen ] | FARBE Farbwert | STIFT Zahl Farbwert : rot|blau|gruen|gelb|schwarz Zahl : [1-9][0-9]*
Reguläre Grammatik NEA DEA farbwert.txt
Beispiel: ZR – eine Sprache für einen Zeichenroboter Endliche Automaten (RegExp) für alle unsere Terminale: KlammerAuf : \[ KlammerZu : \] Wiederhole : WH Rechts : RE Vor : VW Stift : STIFT Farbe : FARBE Farbwert : rot|blau|gruen|gelb|schwarz Zahl : [1-9][0-9]* S, T, I, F, T
Beispiel: ZR – eine Sprache für einen Zeichenroboter
Beispiel: ZR – eine Sprache für einen Zeichenroboter Demo: zr-verkuerzt.exe –t zr-input.txt ggf. auch einen Syntaxfehler (in zr-input.txt) zeigen per Hand ergänzen
Arbeitsweise des Parsers Tokenliste Parser #true oder (#false) Ein- und Ausgabe des Parsers: Beinhaltet die aufgetretenen Terminale der Grammatik des Parsers Grammatik von ZR in Form eines Kellerautomaten Prüft ob Wort zur Sprache gehört #false erfolgt meinst durch Ausgabe von „Syntax Error“
Beispiel: ZR – eine Sprache für einen Zeichenroboter Entwicklung des ZR2PS Compilers in VCC Übertragen der EA in die Scannerdefinition Übertragen der vereinfachten Grammatik in die Parserdefinition Entwickeln so genannter S-Attribute für die Zielcodegenerierung
Beispiel: Postscript als Zielsprache des ZR-Compilers 51 ZR PS PDF Eingabewort (in ZR): WH 36 [WH 4 [VW 100 RE 90] RE 10] Ausgabewort (in PS): %!PS-Adobe-2.0 /orient 0 def /xpos 0 def /ypos 0 def 0 0 0 setrgbcolor /goto { /ypos exch def /xpos exch def xpos ypos moveto} def /turn { /orient exch orient add def} def /draw { /len exch def newpath xpos ypos moveto /xpos xpos orient sin len mul add def /ypos ypos orient cos len mul add def xpos ypos lineto stroke } def 300 400 goto 100 draw 90 turn 100 … turn 10 turn 51
Beispiel: Zielcodegenerierung für ZR Der Compiler soll PostScript erstellen nicht nur #true und #false ausgeben. Entwicklung von S-Attributen S-Attribute sind kleine Quelltextfragmente die für jede rechte Regelseite definiert werden können. Wird eine Regel angewendet wird auch das entsprechende Quellcodefragment ausgeführt.
Beispiel: ZR – eine Sprache für einen Zeichenroboter Die Platzhalter $1 bis $n: In S-Attributen verwenden wir Platzhalter für die Ergebnisse der einzelnen Regelbausteine. Eingabewort sei: VW 20 RE 10 Eingabewort sei: VW 20 RE 10 $1 $2 Von einem Token ist $n immer des Lexem des Tokens ! Von einem Nichtterminal ist $n immer das Ergebnis $$ des Nichtterminals ! VW 20 $$ = "20 draw "
Beispiel: ZR – eine Sprache für einen Zeichenroboter Die Platzhalter $1 bis $n: In S-Attributen verwenden wir Platzhalter für die Ergebnisse der einzelnen Regelbausteine. Eingabewort sei: WH 4 [ VW 20 ] $1 $2 $3 $4 $5 WH 4 [ 20 draw ] Von einem Token ist $n immer des Lexem des Tokens ! Von einem Nichtterminal ist $n immer das Ergebnis $$ des Nichtterminals ! $$ = "20 draw 20 draw 20 draw 20 draw " Alle $n und $$ sind vom Datentyp String !!!
Arbeitsweise des Compilers Quelltext in ZR Scanner Tokenliste Parser Ausgabe in Ziel-sprache %!PS-Adobe-2.0 /orient 0 def /xpos 0 def /ypos 0 def 0 0 0 setrgbcolor /goto { /ypos exch def /xpos exch def xpos ypos moveto} def … [Wiederhole, "WH"] [Zahl, "12"] [KlammerAuf" "["] … WH 36 [WH 4 [VW 100 RE 90] RE 10] Programm Anweisungen Anweisungen Anweisung Anweisungen | Anweisung VW Zahl | RE Zahl | WH Zahl [ Anweisungen ] | FARBE Farbwert | STIFT Zahl
Beispiel: ZR – eine Sprache für einen Zeichenroboter Anwenden des Compilers auf der Modellierungsebene der T-Diagramme in TDiag.
Beispiel: Musiksprache Das Beispiel soll Ihnen die Möglichkeit geben, die gezeigten Inhalte noch einmal selbst anzuwenden. Ein Beispiel für sehr einfache Musiksprachen sind ältere Handyklingeltöne.
Beispiel für Musiksprachen http://www.audio-ware.com/midi/coding- workshop-ringtone-converter.htm
Die Musiksprache ML Wir wollen unsere eigene Notensprache entwickeln für monophone Lieder (nur eine Stimme) Programmbeispiel: C1-2 G1-8 A0-4 A0-8 G0-4 G0-8 C0-8 P-2
Die Musiksprache ML Die Sprache ist so einfach, dass sie sogar regulär ist. Eine etwas komplexere Sprache könnte etwa Wiederholungen enthalten: [C1-2 G1-8 [A0-4 A0-8]] P-2 (typisches Klammerbeispiel für Kellerautomaten)
Die Musiksprache ML Erforschen Sie ML: Öffnen Sie den Ordner„Songs“ und starten Sie Console.bat Aufgabe: Ändern Sie den Inhalt einer ML Datei um sich besser mit ML vertraut zu machen.
Vorgehensmodell Software entwickeln Software nutzen Implementierungs- ebene Modellebene Problemebene
Entwicklung eines ML Interpreters Lösungsschritte: Ein T-Diagramm erstellen Eine formale Grammatik für ML erstellen Eine Scanner- und Parserdefinition entwickeln S-Attribute für die Regeln im Parser aufstellen Den ML Interpreter generieren lassen Den Interpreter mit Hilfe des T-Diagramms testen Arbeitsblatt 1
Ein T-Diagramm für den ML Interpreter Verfassen Sie ein T-Diagramm für den ML Interpreter (geschrieben in Java Bytecode) welcher auf ein ML Programm angewendet wird.
Ein T-Diagramm für den ML Interpreter
Eine Grammatik für ML erstellen Den mittleren Teil des Diagramms (den ML Interpreter) wollen wir herstellen. Dafür müssen wir den Aufbau (Syntax) von ML beschreiben. Wir verwenden eine kontextfreie Grammatik GML (in BNF). Betrachten wir einfache Beispiele der Sprache und leiten eine Grammatik ab: G0-4 G1-2 A0-1 D1-32 P-16 A-8 P-2 C0-16 C1-8 F0-1 H1-2 P-1 Beginnen Sie mit: Song Notes Notes ?
Eine Grammatik für ML erstellen
Eine Grammatik für ML erstellen
Eine Grammatik für ML erstellen
Einen Interpreter für ML entwickeln Prinzipell können wir sagen, dass ein Interpreter sehr ähnlich wie ein Compiler arbeitet. Er erstellt nur keinen Zielcode. Wir werden deshalb im Folgenden einen Compiler herstellen, denn wir als Interpreter verwenden wollen.
Wie funktioniert ein Interpreter ? Quelltext in ZR Scanner Tokenliste Parser Ausgabe in Zielsprache Für einen Interpreter wollen wir keine Ausgabe wir wollen direkt Befehle ausführen.
Einen Interpreter für ML entwickeln Wir müssen den Scanner und Parser beschreiben wie diese arbeiten sollen. Wir beginnen mit der Scannerdefinition. Wir definieren Tokenklassen mit Expressions (Pattern – RegExp.) Einfachste Lösung: Für jedes Terminal in GML verwenden wir genau eine Tokenklasse. Komplexe Pattern erleichtern aber die Arbeit des Parsers später erheblich. wir versuchen dem Scanner auch Arbeit zu geben
Einen Interpreter für ML entwickeln KeyName C|D|E|F|G|A|H Octave 0|1 Duration 1|2|4|8|16|32 all keynames Token-klassen Liste allowed octaves 1 duration values (full, half, ¼, …)
Einen Interpreter für ML entwickeln Wir müssen dafür sorgen, dass sich Tokenklassen nicht überlappen. In echten Programmier- sprachen ist das aber häufig der Fall: Keyword: begin Identifier: [a-z]+ Um dieses Problem zu lösen ist die Reihenfolge der Tokenklassen wichtig! KeyName C|D|E|F|G|A|H Token0 Token1 1 2|4|8|16|32 Token2_32 \- Minus P Pause
Einen Interpreter für ML entwickeln Wir können eine vereinfachte Grammatik G’ML unter Verwendung der Token erstellen: Wir haben 6 Tokenklassen: KeyName, Token0, Token1, Token2_32, P und -
Einen Interpreter für ML entwickeln Wir können die RegExp. der Tokenklassen auch wieder durch endliche Automaten darstellen: Token2_32 2|4|8|16|32 KeyName C|D|E|F|G|A|H
Einen Interpreter für ML entwickeln
Einen Interpreter für ML entwickeln Wir bennen die Tokenklassen sinnvoll um.
Einen Interpreter für ML entwickeln Die regulären Ausdrücke müssen eingetragen werden.
Einen Interpreter für ML entwickeln
Einen Interpreter für ML entwickeln Wir können jetzt einen Compiler erstellen lassen (Scanner + Parser) und auf ein Programm in ML anwenden: Wir wollen aber Töne abspielen es fehlt also noch etwas
Einen Interpreter für ML entwickeln Für jede Regel müssen wir ein S-Attribut erstellen. Erinnerung: S-Attribute sind kleine Quelltextfragmente die bei der Anwendung einer Regel ausgeführt werden. Jede Regel liefert ihr Ergebnis in $$ zurück indem das Quelltextfragment abgearbeitet wird (wir müssen $$ bei Bedarf einen Wert zuweisen).
Einen Interpreter für ML entwickeln Wiederholung Platzhalter $1 bis $n: In S-Attributen können wir Platzhalter verwenden, die jeweils für das Ergebnis eines Elements auf der rechten Regelseite stehen. Input word: C1-8 D1-4 Input word: C1-8 C1-4 Von einem Token $n ist dies immer das Lexem! Von einem Nichtterminal ist $n immer dessen Ergebnis $$! $1 $2 $2 C1 - 8 $$ = "C1-8"
Einen Interpreter für ML entwickeln Wiederholung Platzhalter $1 bis $n: In S-Attributen können wir Platzhalter verwenden, die jeweils für das Ergebnis eines Elements auf der rechten Regelseite stehen. Input word: C1-8 D1-4 Input word: C1-8 C1-4 Von einem Token $n ist dies immer das Lexem! Von einem Nichtterminal ist $n immer dessen Ergebnis $$! $1 C1 $1 $2 C 1 Alle $n und $$ haben den Datentyp String !!! $$ = "C1"
Einen Interpreter für ML entwickeln Nun können wir uns den S-Attributen zuwenden für: Was passiert wenn die Regel Note… auftritt? Auf finden wir 3 Hilfsfunktionen um MIDI Noten in Java abzuspielen. Wir müssen den Notennamen wie C0 in die entsprechende MIDI Taste übersetzen und playNote aufrufen. Arbeitsblatt 1
Einen Interpreter für ML entwickeln
Einen Interpreter für ML entwickeln Wir erstellen erneut den Interpreter
Das T-Diagramm ausführen
Einen MLSVG Compiler entwickeln Lösungsschritte: Ein T-Diagramm erstellen Eine Scanner- und Parserdefinition erstellen S-Attribute für die Regeln im Parser aufstellen Den MLSVG Compiler generieren lassen Den Compiler mit Hilfe des T-Diagramms testen Arbeitsblatt 2
Ein T-Diagramm für den MLSVG Compiler erstellen
Einen MLSVG Compiler entwickeln
Das T-Diagramm ausführen Wir können unseren Compiler dem T- Diagramm zuweisen und dieses ausführen:
Zusammenfassung <?xml version="1.0" ?> Quelltext in ML Scanner Tokenlists Parser Zielsprache SVG <?xml version="1.0" ?> <!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 20010904//EN" "http://www.w3.org/TR/2001/REC-SVG-... [KeyName, "C"] [Token1, "1"] [Minus, "-"] … C1-8 E1-4 D0-2 …
Turing-Maschine (EINE Definition)
Turing-Maschine TM als Akzeptor: Aufbau und Arbeitsweise: TM-Modell TM als Akzeptor: Start: auf erstem Zeichen des Eingabewortes Stopp: per crash (falls die TM überhaupt anhält)
Turing-Maschine Beispiel: Didaktische Kommentierung: ECHTE Beispiele sind problematisch.
Turing-Maschine in der Berechenbarkeitstheorie Hinweis auf Busy Beaver
Hinweis auf das Buch Sprachen, Automaten und Compiler: Wagenknecht, Chr.; Hielscher, M.: Sprachen, Automaten und Compiler: Ein Arbeitsbuch zur theoretischen Informatik. Teubner, 2008