Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Grundlagen der Informatik Prof. Dr. Peter Kneisel.

Kopien: 4
Lösung 2.1Information 1.Wieviele Fragen benötigen Sie beim Zahlenraten a)7 b)nächste_ganze_Zahl_größer( ld n) 2.Eine Nachrichtenquelle sendet Zeichen aus.

Anhang F:Beispielklausur In diesem Kapitel wird ein Beispiel für eine Klausur vorgestellt. Dabei sind jeweils die Aufgaben und die Lösungen gegeben. Beachten.

Anhang D:Zusammenfassung Wie jede Wissenschaft befasst sich die Informatik mit ihren eigenen Objekten. Was diese Objekte sind und was man mit diesen Objekten.

Lösung 5.1Schleifen 1.while (x < 5)if (x < 5) thenwhile Bif B then { do {{do { x = x + 1; x = x + 1; A A }}}} while (x < 5) while B do {x = x + 1;do {A.

Ähnliche Präsentationen


Präsentation zum Thema: "Grundlagen der Informatik Prof. Dr. Peter Kneisel."—  Präsentation transkript:

1

2 Grundlagen der Informatik Prof. Dr. Peter Kneisel

3 Zum Kennenlernen Wie alt sind Sie ? Aus welchen (Bundes-)Ländern kommen Sie ? Wo wohnen Sie während des Studiums ? Welchen Bildungsweg sind Sie gegangen ? Wer hatte Informatik in der Schule ? Welches Fach studieren Sie ? Warum studieren Sie hier an der FH Gießen ? Wer besitzt einen Computer ? Wie lange sitzen Sie vor dem Computer ? Was machen Sie da ? Welche Programmiersprache können Sie ? Welche Betriebssysteme (OSe) kennen Sie ? Welche Anwendungen kennen Sie ? Was erwarten Sie (nicht) von dieser Vorlesung ? Was denken Sie, mit dieser Vorlesung anfangen zu können ?

4 Didaktik: Durchführung Diese Vorlesung ist formal 3-stündig mit einer Stunde Übungen Die Übungen werden in diesem Verhältnis, aber nur je nach Bedarf durchgeführt. Zur Vorbereitung werden Übungsblätter, je nach Vorlesungsverlauf zusammengestellt. Weitere Übungen sind im Foliensatz vorhanden und sollten selbständig und vollständig bearbeitet werden. Der Vorlesungsstoff ist an die Struktur und Inhalten der GDI-Vorlesung von Dr. Geisse angelehnt. Zur Vor- und Nachbereitung des Stoffes können Sie daher zusätzlich dessen Vorlesungsmitschrift (erhältlich in der Fachschaft) verwenden Da sich die Inhalte und insbesondere auch Schwerpunkte leicht verschieben ist dennoch ein Arbeiten mit meinem Foliensatz erforderlich Vorsicht ! Kommen Sie in alle Veranstaltungen - machen Sie die Übungen überschätzen Sie sich nicht - auch wenn Sie PC-Crack sind Schreiben Sie die Klausur nur, wenn Sie eine Chance haben ( Ich hasse es, Zeit mit dem Korrigieren hoffnungsloser Fälle zu vergeuden ;-)

5 Didaktik: Folien Der Vorlesungsstoff wird anhand von Folien dargelegt Die Folien bilden nur einen Rahmen für die Inhalte. Die Folien sollten daher mit Hilfe eigener Vorlesungsskizzen ergänzt werden - am besten in Form einer Vorlesungsnachbereitung max. 3 Tage nach der Vorlesung Zusätzlich zu den Folien werden Beispiele an der Tafel oder am Rechner gezeigt. Diese sollten Sie vollständig mitskizzieren. Zur vollständigen Nachbereitung, z.B. als Klausurvorbereitung, sind die Folien einheitlich strukturiert Es gibt genau drei Gliederungsebenen: Kapitel, Unterkapitel, Abschnitte Die Inhalte jedes Kapitels und jedes Unterkapitels werden jeweils motiviert und sind verbal beschrieben. Zusätzlich gibt es jeweils ein stichwortartiges Inhaltsverzeichnis der Unterkapitel, bzw. Abschnitte Die Vorlesung wird ständig überarbeitet, so dass sich die Foliensätze ändern können (und werden) Laden Sie sich zur endgültigen vollständigen Nachbereitung nochmals zusätzlich den kompletten Foliensatz herunter.

6 Literatur Diese Veranstaltung ist anhand (wirklich) vieler Bücher und einer Menge eigener Erfahrungen erstellt worden. Jedes Buch hat dabei Schwerpunkte in speziellen Bereichen und ist daher sinnvoll. Eine Auflistung aller dieser Bücher ist nicht sinnvoll. An dieser Stelle seien daher nur drei Bücher aufgeführt, die einen guten Einstieg in die Informatik darstellen. (Diese Liste ist identisch mit der von Dr.Geisse erstellten Liste) Ch. Horn, I.O. Kerner, P.Forlig Lehr- und Arbeitsbuch - Informatik, Band 1 Grundlagen und Überblick Fachbuchverlag Leibzig 2001 P. Reichenberg Was ist Informatik - Eine allgemeinverständliche Einführung Hanser Verlag München 1991 Fl. Bauer, G. Goos Informatik - eine einführende Übersicht Band 1+2 Springer Verlag Berlin 19991/92

7 Inhalt Wie jede Wissenschaft befasst sich die Informatik mit ihren eigenen Objekten. Was diese Objekte sind und was man mit diesen Objekten machen kann - und wie - wird in dieser Vorlesung auf eher abstraktem Niveau, aber immer mit Beispielen aus der Realität eines Informatikers (oder einer Informatikerin), erläutert. Diese Vorlesung konzentriert sich auf den Kern der Informatik. Vertieftere Einführungen in z.B die Bereiche der Programmierung, Rechnerarchitekturen, Betriebssysteme, etc. sollen daher bewusst den entsprechenden Veranstaltungen vorbehalten bleiben Inhalt 1.Informatik 2.Information und Codes 3.Zeichen und Zahlen 4.Datenstrukturen 5.Algorithmenentwurf 6.Algorithmentheorie 7.Sprachen

8 Überblick und Einordnung TechnischeTheoretischePraktische Informatik Dynamik (Algorithmik) Elemente Strukturierung Berechenbarkeit Korrektheit Komplexität Sprachen Syntax und Semantik Typ3-Sprachen Typ2-Sprachen Prg1 Prg2 RA1 RA2CB SWT1DSt Statik (Struktur) Information Codes Zahlen Zeichen Daten- strukturen 3 2 4

9 Kapitel 1Informatik 1962 wurde der Begriff Informatique(als Kombination der Begriffe Information und automatique) von Philippe Dreyfus, einem französischen Ingenieur eingeführt und als Informatik ins Deutsche übernommen. Als junge Wissenschaft ist die Informatik mittlerweile in viele Bereiche der älteren Wissenschaften eingezogen und hat viele eigene Bereiche neu erschlossen. Die Informatik ist damit mittlerweile wesentlich mehr, als der anglo-amerikanische Begriff Computer- Science vermuten lässt. Dieses Kapitel möchte einen (kurzen) Überblick über exemplarische Inhalte, Struktur und Geschichte der Informatik geben Inhalt 1.Motivation 2.Definition 3.Die Teilgebiete der Informatik 4.Die Geschichte der Informatik 5.Zusammenfassung des Kapitels

10 1.1Motivation Die Beherrschung eines Computers macht Spaß und gibt der informationssüchtigen Gesellschaft das Gefühl persönlicher Freiheit (so wie vor Jahren ein roter Sportwagen) Die Beherrschung gibt Macht. Für das Funktionieren einer demokratischen Gesellschaft ist es wichtig, daß viele Menschen Computer verstehen und beherrschen. Der Computer schafft und vernichtet Arbeitsplätze und ist eine Herausforderung für die Gesellschaft Das Verstehen der Gesetzmäßigkeiten bei der Entwicklung von Computerprogrammen ist eine intellektuelle Herausforderung Das Umsetzen dieses Verständnisses ist eine intellektuelle Genugtuung. Der Computer schafft neue Betätigungsfelder und Lebensinhalte Der professionelle Umgang mit Computer ist im Beruftsleben eine nackte Notwendigkeit !

11 1.2Was ist Informatik Jedes Lehrbuch der Informatik gibt seine Definition der Informatik. Auch der Duden beschreibt die Informatik als Wissenschaft von der systematischen Verarbeitung von Informationen, besonders der automatischen Verarbeitung mit Hilfe von Digitalrechnern. Durch die Beschränkung auf den Aspekt der Verarbeitung geht diese Definition meines Erachtens nicht weit genug. Ich werde daher in diesem Unterkapitel eine eigene Definition wagen. Die dabei verwendeten Aspekte werden exemplarisch verdeutlicht, wobei bewusst in Grenzbereiche der Informatik gegangen wird. Was die Informatik wirklich ist, kann kein Lehrbuch erfassen. Sie werden - hoffentlich - am Ende Ihres Studiums eine sehr weitreichende Idee davon haben. Inhalt 1.Definition 2.Beispiele

12 1.2.1Definition Informatik Die Wissenschaft, die sich mit dem (automatisierten) von Information befasst Erfassen Transportieren Speichern Verarbeiten Umsetzen

13 1.2.2Wissenschaft Informatik ist nicht die Wissenschaft vom Computer (sowenig, wie Astronomie die Wissenschaft vom Teleskop ist) Informatik ist eine Wissenschaft … und keine Bastelecke für Software-Spieler Aspekte der Informatik als reine Lehre (verwandt mit der Mathematik) Naturwissenschaft: entdecken und beschreiben von natürlichen Phänomenen Ingenieurwissenschaft - mit der typischen Vorgehensweise Problemstellung Analyse Teillösungen Synthese Lösung

14 1.2.3Information Information ist die Bedeutung, die durch eine Nachricht übermittelt wird (nachrichtentechnische Definition) Kapitel 2 Information ist eine elementare Kategorie Chemie: Stoffumwandlung Physik: Energieumwandlung Informatik: Informationsumwandlung

15 1.2.4Erfassen Sensorik Bildverarbeitung Datenmenge (Byte) (52,204,248)(33,75,125,190,251)

16 1.2.5Transportieren Telekommunikation Telephonie Hz ~ Hz

17 Abstrakte Datentypen (N. Wirth: Algorithmen und Datenstrukturen) 1.2.6Speichern Datenrepräsentation Einfache Typen Aufzählungstypen Integer Real Boolean Char... {rot, gelb, grün} [0,1,..,65535] [3,4e-038,..3,4e038] {TRUE, FALSE} {ASC(0),..,ASC(255)} Strukturierte Typen Array Record Varianten Record Menge... array [n..m] of Type record Type 1: element 1 Type n: element n end set of Type Abstrakte Typen Listen Binäre Bäume Vielweg Bäume Graphen...

18 1.2.6Speichern Datenrepräsentation Objektrepräsentation Assoziation Vererbung Aggregation Verwendung Instantiierung Klassenname Attribute Operationen Einschränkungen (G. Booch: Objektorientierte Analyse und Design) Teil projekt Projekt Projektleiter Mitarbeiter n Buchhaltung Controlling Personalwesen 1

19 Class Teilprojekt: public Projekt { Projektleiter projektleiter; Mitarbeiter mitarbeiter[MAX_MITARBEITER]; public: Teilprojekt (Projektleiter); ~Teilprojekt (); } Teilprojekt::Teilprojekt(Projektleiter pl) { // some method-calls of Buchhaltung, Controlling, Personalwesen } main { Teilprojekt1 = new Teilprojekt(Projektleiter1) // See Budget1 for buget details on Teilprojekt1 } 1.2.6Speichern Datenrepräsentation Objektrepräsentation (B.Stroustrup: The C++ Programming Language) Teilprojekt Projekt Projektleiter Mitarbeiter n Buchhaltung Controlling Personalwesen 1 Assoziation Vererbung Aggregation Verwendung Instantiierung n1

20 1.2.7Verarbeiten Prozessmodelle Petri-Netze (C.A.Petri: Kommunikation und Automaten))

21 1.2.7Verarbeiten Prozessmodelle Interaktionsdiagramme (G. Booch: Objektorientierte Analyse und Design) R1R2R3R4R5 N2 N1

22 Axon Dendrite Synapsen 1.2.7Verarbeiten KI-Ansätze Neuronale Netze a i =F ( W ij * O j, a i ) aAktivierungszustand WVerbindungsgewichtung OAusgangswert FAktivierungsfunktion fAusgabefunktion OjOj O i =f ( a i ) W ij

23 1.2.8Umsetzen Aktorik Manipulatoren Anzahl Freiheitsgrade 252 (1)9

24 1.2.9Zusammenfassung Reduktion von Redundanz Strukturierung von Information Abbildung realer Prozesse auf Rechnerprozesse Abbildung von Rechnerprozessen auf reale Prozesse Abbildung von Datenstrukturen auf reale Strukturen

25 1.3Die Teilgebiete der Informatik Wie viele Wissenschaften, ist die Informatik kein homogenes Gebilde, sondern lässt sich anhand unterschiedlicher Kriterien in Teilgebiete strukturieren. Dieses Kapitel beschreibt die wohl geläufigste Einteilung der Informatik in drei, bzw. vier Teilbereiche. Inhalte 1.Technische Informatk 2.Praktische Informatik 3.Theoretische Informatik 4.( Angewandte Informatik )

26 1.3.1Technische Informatik Konstruktion von Verarbeitungselementen Prozessoren,... Konstruktion von Speicherelementen Hauptspeicher,... Konstruktion von Kommunikationselementen Bussysteme Lokale Rechnernetze (LAN: Local Area Networks), Weitverkehrsnetze (WAN: Wide Area Networks),... Mobilfunknetze, Satellitenkommunikation,... Konstruktion von Peripherie Drucker, Scanner,.... Festplatten, Optische Platten, Diskettenlaufwerke,......

27 1.3.2Praktische Informatik Umgang mit Programmiersprachen Compilerbau... Entwicklung von Software Analysemethoden Designmethoden Realisieruingsmethoden Testverfahren... Unterstützung der Softwareentwicklung Projektmanagment von DV-Projekten Qualitätsmanagement in DV-Projekten...

28 1.3.3Theoretische Informatik Sprachen und Automaten Formale Sprachen Grammatiken Sprachdefinitionen Berechenbarkeitstheorie Komplexitätstheorie...

29 1.3.4Angewandte Informatik Anwendung in verwandten Wissenschaften Numerische oder stochastischer Verfahren in der Mathematik Simulationen in der Physik und der Chemie Bildverarbeitung in der Medizin Genanalyse in der Biologie Lehrprogramme für Natur-, Sozial- und Geisteswissenschaften... Anwendungen im täglichen Leben. Computerspiele, Multimediaanwendungen, Textverarbeitung, Tabellenkalkulation, Datenbanken,... Steuerung von technischen Prozessen Web-Anwendungen...

30 1.4Die Geschichte der Informatik Die Informatik ist eine junge Wissenschaft, hat aber, ähnlich wie andere Natur- und Ingenieurwissenschaften Wurzeln, die weit in die Menschheitsgeschichte hineinragen, Wie keine andere Wissenschaft wurde die Informatik jedoch von der Erfindung eines Gerätes, dem programmgesteuerten Rechner (später Computer) beeinflusst. Dieses Unterkapitel wird die Wurzel in der Menschheitsgeschichte und auch die Entwicklung des Rechners vorstellen. Inhalt 1.Information in der Geschichte 2.Automaten und Steuerungen 3.Erleichterung der Rechenarbeit 4.Pioniere der Informatik - Praktiker 5.Pioniere der Informatik - Theoretiker 6.Die Generationen

31 1.4.1Information in der Geschichte Erfassung durch Sinnesorgane Transport durch akustische, optische, chemische Signale Speicherung durch Gene oder neuronale Elemente Verarbeitung über neuronale Elemente Umsetzung direkt oder indirekt über Gliedmaße Entwicklung von Wort,- Silben- und Buchstaben-schriften

32 1.4.2Automaten und Steuerungen ca. 100 n. Chr. Automatische Tempeltore in Anhängigkeit von Opferfeuer (Heron von Alexandria) Mittelalter Mechanische Uhren mit Sonnen-, Mond- und Planetenbewegungen und Figurenumläufe an Kirchen und Rathäusern 17./18. Jhdt. Spieluhren, Schreib- und Schachspielautomaten 18./19. Jhdt. Fliehkraftregler für Dampfmaschinen, mechanischer Webstuhl mit Lochkartenbändert (Jacquart, 1805)

33 1.4.3Erleichterung der Rechenarbeit Rechenbretter Seit dem Altertum China, Japan, Rußland Addition/Subtraktion ähnlich schnell wie Taschenrechner Lehre der Grundrechenarten Durch Zahlensystem schematisierbar Lehre an mittelalterlichen Universitäten Durch Rechenbücher weitere Verbreitung des Wissens (z.B. Adam Riese ) Rückführung der Multiplikation/Division auf Addition/Subtraktion durch logarithmisches Rechnen mit Hilfe von Tabellen.

34 1.4.4Mechanische Rechenmaschinen Wilhelm Schickart ( ) Maschine für die Grundrechenarten (1623) Blaise Pascal ( ) Gottfried Wilhelm von Leibniz ( ) Arithmetik des Dualsystems Philipp Matthäus Hahn ( ) Feinmechanische Rechenmaschinen 19./20. Jhdt: Sprossenradmaschine Hermann Hollerith Lochkartenstanzer/ -sortierer/-tabellierer

35 1.4.5Pioniere der Informatik - Praktiker Charles Babbage ( ) Difference Engine (1812). Überprüfung von Logarithmentafeln. Alle Merkmale eines programmierbaren Computers. Entwurf einer Analytical Engine (1836). Wurde nie gebaut Konrad Zuse (geb. 1910) Z1: mechanischer Rechner Z2 / Z3: Elektromechanischer Relaisrechner im Dualsystem mit Lochkartensteuerung. Erster voll funktionstüchtiger Computer (1941) Grundlegende Arbeiten zur Programmierung und algorithmischer Sprachen Howard Eiken Mark I, II, III, IV (1944) Dezimalrechnender Relaisrechner

36 1.4.6Pioniere der Informatik - Theoretiker Kurt Gödel Theoretische Aussagen zum Algorithmenbegriff: Es gibt Aussagen die algorithmisch nicht entscheidbar sind (1931) Alan M. Turing ( ) Definition des Algorithmenbegriffes über eine hypothetische Maschine (Turing-Maschine) John von Neumann ( ) Grundlegende Arbeiten über Computerarchitektur: Speicherung der Daten und Programme auf dem gleichen Medium Definition von Registern insb. Indexregister

37 1.4.7Die Generationen GenerationBeispielTechnologieSpeich./Geschw.Software Vorgenerat.Z3Elektro-0,0002 MIPSVerdrahtet Mark1mechanik 1.GenerationENIAC, Z22Elektro-0,02 MIPSMaschinen UNIVAC, IBM650röhren1-2 Kbyte sprache SIEMENS GenerationIBM1400, AEG TRTransistoren0,1 MIPSAssembler CDC6600Kernspeicher32 KByteFORTRAN Siemens2002Stapelbetrieb 3. GenerationIBM370, PDP11ICs5 MIPSHochsprachen Siemens7000,Halbleiter-1-2 MbytesC, Pascal Cray 1speicher 4. GenerationPC, Gray XMPMikro-50 MIPSSprachen der Sperry1100, VAXprozessoren8-32 MByte4. Generation IBM309xOptische Sp.Parallelisierung GegenwartWorkstationsPentium,100 MIPSNetzsoftware Hochleistungs-Power PC1 GByteOO-SprachenPCs NetzeC++. JAVA 5. Generationsupraleitende1000 MIPS Keramikenviele GBytes

38 1.5Zusammenfassung des Kapitels Die Informatik befasst sich mit der (automatisierten) Erfassung, dem Transport, der Speicherung, Verarbeitung und dem Umsetzen von Information Die Informatik ist eine naturwissenschaftliche Ingenieurswissenschaft Die Informatik gliedert sich in Technische, Praktische, Theoretische und Angewandte Informatik Die Geschichte der Informatik beginnt im Altertum, besteht in Ihrer heutigen Form aber erst seit ca Zur Zeit befinden wir uns in der 4. Generation.

39 Kapitel 2Information und Codes Information ist der grundlegende Begriff in der Informatik - dieses Kapitel erläutert diesen Begriff: Zunächst wird Information in ihrer Repräsentation als Nachricht betrachtet und damit einige Maßzahlen definiert. Danach wird auf die Repräsentation von Information in der Informatik und deren Maßzahlen eingegangen. Schließlich wird auf die Möglichkeiten zur Umsetzung - Kodierung - von Information eingegangen Inhalt 1.Was ist Information 2.Definition nach Shannon 3.Definition in der Informatik 4.Codes

40 2.1Was ist Information Information ist eine elementare Kategorie wie z.B. Energie oder Stoff Qualitativ: Repräsentationsformen der Information DNS (Aminosäuren in einem Doppelhelix) Verschaltung von Neuronen und deren Empfindlichkeit physikalisches Objekt (Atome im Raum) Bild (Bildpunkte auf einer Ebene) Energieverteilung (Energie im Raum) Folge von Zeichen (Zeichen in einer Zeichenkette)..... Quantitativ: Maßzahlen für Information später in diesem Kapitel Nicht:Was ist Information ? sondern:Wie ist Information ?

41 2.2Definition nach Shannon Information hat vielfältige Repräsentationsformen. Noch vor Entstehen der Informatik als Wissenschaft hat Claude Elwood Shannon ( ) wichtige Maßzahlen zur Erfassung von Information definiert. Dabei geht er von der nachrichtentechnischen Repräsentation von Information, der Nachricht aus. Dieses Unterkapitel stellt diese Maßzahlen und deren Grundlagen dar. Inhalt: 1.Nachricht 2.Informationsgehalt einer Nachricht 3.Informationsgehalt eines Zeichens 4.Mittlerer Informationsgehalt

42 2.2.1 Definition: Nachricht sei Alphabet X: Menge von Symbolen/Zeichen X = {x 1, x 2,... x n } Eine Zeichenkette (ein Wort) der Länge n über X ist eine Folge von n Zeichen aus X (ein n-Tupel über X) Beispiel:X={a,b} Worte über X:{a,b,ab,ba,aba,abb,baa,bbb,...} Worte der Länge n mit n=3:{aba,abb,baa,bbb} Die Menge aller n-Tupel über X ist das n-fache Kreuzprodukt X X... X (n mal), bezeichnet als X n |X n | = | X X... X | = |X| * |X| *... * |X| = |X| n Die Anzahl der Elemente alle Worte mit der maximalen Länge n ist |X| n Wird eine Zeichenkette übermittelt, so spricht man von Nachricht N x

43 2.2.2 Definition: Informationsgehalt einer Nachricht Ein Maß für die Information (der Informationsgehalt) einer Nachricht N n,x der Länge n (über ein Alphabet X) ist die Länge der Beschreibung, die notwendig ist, um die Nachricht N n,x aus der Menge aller möglichen Nachrichten der Länge n zu ermitteln Beispiel: Information der Nachricht N 8,{0,1} : Suche in |{0,1}| 8 = 256 Wörtern Der Informationsgehalt einer aus mehreren (voneinander unabhängigen) Zeichen bestehenden Zeichenkette ist gleich der Summe der Informationen der einzelnen Zeichen: 1 * ld(|X|) + 1* ld(|X|) * ld(|X|) = n * ld(|X|) = ld(|X| n ) Optimal mit binärem Suchen Anzahl Fragen: ld(|X n |) = ld(|X| n ) = n ld(|X|) obere Hälfte ? janein obere Hälfte ? janein obere Hälfte ? janein...

44 2.2.3Definition: Informationsgehalt eines Zeichens Idee: Der Informationsgehalt eines Symbols x i hängt von der Wahrscheinlichkeit seines Auftretens ab: Je seltener ein Symbol auftritt, desto höher ist sein Informationsgehalt: h(x i ) = f(1/p(x i )) Definition nach Shannon (ca. 1950): Der Informationsgehalt h (Einheit bit) eines Symbols x i ist definiert als der Logarithmus dualis des Reziprokwertes der Wahrscheinlichkeit, mit der das Symbol auftritt: h(x i ) = ld(1/p(x i )) = -ld p(x i )

45 2.2.4Beispiel: Informationsgehalt Beispiel: Sei die Wahrscheinlichkeit von E = 0,5 und die von H = 0,25 Informationsgehalt des Zeichens E : h E = ld (1/0.5) = 1 Informationsgehalt des Zeichens H : h H = ld (1/0,25) = 2 Informationsgehalt der Zeichenkette EHE h EHE = ld(2) + ld(4) + ld(2) = ld(2 * 4 * 2) = 4 bit log a b = log c b log c a mit a = 2, c = 10 gilt: ld b = lg b lg 2 3,322 lg b Umrechnungsregel des ld in den 10er-Logarithmus (lg)

46 2.2.5Definition: Mittlerer Informationsgehalt Kennt man die Einzelwahrscheinlichkeiten aller möglichen Symbole einer Symbolsequenz, so ist der mittlere Informationsgehalt H s der Symbole s (Entropie der Quelle) definiert als: H s = p(x i ) * h(x i ) = p(x i ) * ld(1/p(x i )) = - p(x i ) * ld(p(x i )) Der mittlere Informationsgehalt H s,n einer Symbolkette der Länge n ist: H s,n = H s * n Beispiel H s = 0,5 * 1 + 0,25 * 2 + 0,25 * 2 = 1,5 bit d.h. die Symbole haben einen mittleren Informa- tionsgehalt von 1,5 bit.

47 2.2.6Informationsaufnahme des Menschen Beim Lesen erreicht der Mensch eine Geschwindigkeit von ca. 25 Zeichen/sec das entspricht 25 * 2 Bit (mittleren Informationsgehalt) = 50 Bit/sec dieser Wert ist unabhängig vom Alphabet - kann also auch z.B. im chinesischen erreicht werden. Nachrichten, die mit anderen Medien dargestellt werden, können ca. genauso schnell verarbeitet werden. Aufnahme des Menschen Bewusst aufgenommen werden ca. 50% von 50 Bit/sec also 25 bit/sec Bei einer Aufnahmedauer von ca. 16 Stunden am Tag ergibt sich eine Lebensinformationsmenge von ca. 3 * Bit die Speicherkapazität des Gehirns ist mit ca Bit auch in der Lage, diese Informationsmenge zu speichern (sogar 100 Mal) Die Lebensinformationsmenge findet auf einer CD-ROM Platz und ist über Glasfaserkabel in wenigen Sekunden zu übertragen.

48 2.3Definition in der Informatik Die Wurzeln der Informatik liegen weniger in der Nachrichtentechnik, als vielmehr in der Mathematik. Darum ist die Repräsemtation von Information als Nachricht weniger relevant als die Darstellung von Zahlen (in binärer Repräsentation) und algebraischen (boolschen) Objekten. In diesem Unterkapitel geht es um diese Repräsentationen. Inhalt 1.Das Bit in der Informatik 2.Die Darstellung des Bit 3.Beispiel 4.Das Byte und mehr

49 2.3.1Das Bit in der Informatik Definition aus der Informatik: Ein Bit ist die Informationsmenge in einer Antwort, auf eine Frage, die zwei Möglichkieten zuläßt: ja /nein wahr/falsch schwarz/weiß... Der Informationsgehalt eines Zeichens einer zweielementigen Alphabetes mit gleicher Auftretungswahrscheinlichkeit ist (nach Shannon) h = -ld p = -ld 0,5 = 1

50 2.3.2Die Darstellung des Bit Diese zwei Möglichkeiten werden meist mit 0 bzw. 1 codiert Die technische Darstellung erfolgt u.a. mit Hilfe von: Ladung 0 = ungeladen 1 = geladen Spannung 0 = 0 Volt 1 = 5 Volt Magnetisierung 0 = nicht magnetisiert 1 = magnetisiert Licht 0 = kein Licht 1 = Licht

51 2.3.3Beispiel: Bitfolge Aus welcher Himmelsrichtung weht der Wind (N, O, S, W) ? Bei anzunehmender Gleichverteilung der Antworten ist der mittlere Informationsgehalt H = p(x i ) * ld(1/p(x i )) = (0,25*2)*4 = 2 Die Frage läßt sich in zwei Fragen umsetzen Weht der Wind aus N oder O (ja/nein) ? Weht der Wind aus O oder W (ja/nein) ? Eine mögliche Antwort: 1 Frage=ja, 2 Frage=nein läßt sich durch die Bitfolge 10 darstellen und bezeichnet eindeutig Norden als die Windrichtung 10 = Norden 11 = Osten 01 = Westen 00 = Süden Nimmt man noch die Zwischenrichtungen NO, SO, SW und NW hinzu, so können die 8 Zustände mit 3 Bit codiert werden (wie?)

52 2.3.4Das Byte und mehr Aus bestimmten Gründen Geschwindigkeit von Lese- und Schreiboperationen Darstellungsmöglichkeit häufiger Zeichen (z.B. Alphabet) Darstellungsmöglichkeiten von Zahlen, etc. werden in der Informatik oft Vielfache von 8Bit-Gruppen verwendet (8Bit, 16Bit,...) Eine 8-Bitsequenz heißt ein Byte. Bestimmte 2er-Potenzen werden in der Informatik häufig als Maßzahlen (z.B. für Speichergrößen) verwendet: 1 kByte = 2 10 = 1024 Byte (1 Kilobyte) 1 Mbyte = 2 10 * 2 10 Byte (1 Megabyte) 1 Gbyte = 2 10 * 2 10 * 2 10 Byte (1 Gigabyte) 1 Tbyte = 2 10 * 2 10 * 2 10 * 2 10 Byte (1 Terabyte)

53 2.4Codes Damit Information in einem Rechner verarbeitet werden kann, muss sie in eine für den Rechner verarbeitbare Form transformiert werden. Dabei kann man sich beliebig ungeschickt anstellen. Dieses Unterkapitel beschreibt, wie eine solche Transformation funktionieren kann, welche Möglichkeiten man dabei hat und gibt ein Maß für die Qualität einer Transformation an. Inhalt 1.Was ist ein Code 2.Willkürliche Codes 3.Codes zur Optimierung der Codelänge 4.Codes zur Fehlererkennung und –korrektur 5.Redundanz

54 2.4.1Was ist ein Code Definition: Seien X,Y zwei Alphabete Eine Codierung ist eine Abbildung C:X n Y m aller n-Tupel aus X nach m- Tupel aus Y. oft ist n=1 oft ist Y = {0,1} Die Worte aus Y m werden Code genannt. Die Umkehrrelation C -1 bezeichnet man als Dekodierung Definition: Ein Code heißt vollständig, wenn alle Wörter aus X n mit Hilfe des Codes abgebildet werden können. Definirion: Ein Code heißt eindeutig, wenn der Code aller Wörter aus X n unterschiedlich ist, ansonsten heiß er mehrdeutig

55 2.4.2Willkürliche Codes Codes sollten so beschaffen sein, dass sie bei der Decodierung eindeutig sind. Beispiel: Problem Dekodierung: = (aui) (aoil) zphh * pcll * p A0,25,002, ,60 E0,33,331,740120,60 I0,25,002, ,60 O0,254,002,001120,50 U0,0520,004, ,25 R=L-H=0,38H = 2,17L = 2,55

56 2.4.2Willkürliche Codes: Fano-Bedingung Kein Codewort darf Anfang eines anderen Codewortes sein Beispiel: Die Fano-Bedingung ist hinreichend aber nicht notwendig Beispiel: a 1, b 10 zc A101 E01 I100 O11 U11100 zc A00 E10 I010 O11 U011

57 2.4.3Huffman-Codierung Oft ist es wichtig, einen Code möglichst kurz zu gestalten Idee Häufige Symbole – kurze Codes, Seltene Symbole – lange Codes Kodierung Die Häufigkeit des Auftretens der Bitmuster (Bytes) wird bestimmt Die am häufigsten auftretenden Bytes werden mit kurzen Bitfolgen (Huffmann-kode) kodiert Der Huffmann-code wird zur Kodierung der Bitfolge verwendet Dekodierung Dekodierer besitzt identischen Huffmann-kode (oder bekommt die Zuordnungstabelle explizit übertragen) Dekodierer setzt den Huffmann-code in Bytefolge um

58 2.4.3Huffman-Codierung: Vorgehen Der Baum wird von oben nach unten mit den zwei Buchstaben (oder Buchstabengruppen) mit den jeweils kleinsten Wahrscheinlichkeiten schrittweise aufgebaut sei P(A) = 0,16 P(B) = 0,51 P(C) = 0,09 P(D) = 0,13 P(E) = 0,11 P(B)=0,51 P(BCEAD)=1,0 10 P(CEAD)=0,49 10 P(D)=0,13P(A)=0,16 P(AD)=0,29 10 P(C)=0,09P(E)=0,11 P(CE)=0,2 10 Kodierung A = 000 B = 1 C = 011 D = 001 E = 010

59 2.4.3Huffman-Codierung: Verbesserung Codierung ist optimal, wenn sich die Wahrscheinlichkeiten der Zeichen geschickt ergeben geschickt sind Wahrscheinlichkeiten mit negativen 2er-Potenzen. Durch Betrachtung (und Codierung) von Zeichenpaaren, -drillingen,..., n-Tupeln können solche geschickten Wahrscheinlichkeiten gefunden werden Die Redundanzen lassen sich sogar beliebig verkleinern, weil die Einzelwahrscheinlichkeiten von n-Tupeln beliebig klein werden und dadurch immer geschickter kombiniert werden können Beispiel: zp A0,80 B0,20 zp AA0,64 AB0,16 BA0,16 BB0,04 Produkt der Einzelwahrscheinlichkeiten zp AAA0,512 AAB0,032 ABA0, BBB0,008...

60 2.4.3Huffman-Codierung: Beispiel Beispiel zphh * pcll * p A0,800,320,26010,80 B0,202,320,46110,20 R = 0,26H = 0,72L = 1,00 zphh * pcll * p AA0,641,560,41010,64 AB0,166,250,421020,32 BA0,166,250, ,48 BB0,0425,000, ,12 R = 0,12H = 1,44L = 1,56

61 2.4.4Hamming-Codierung Manchmal ist es wichtig, Fehler in einem Code zu erkennen und ggf. zu korrigieren. (z.B. bei der Übertragung) Idee Gezielter Einsatz von Redundanz Nicht alle möglichen Codeworte sind daher gültig Kodierung Dem Code werden zusätzliche Bits hinzugefügt. Die Werte der zusätzlichen Bits szehen in Bezug zu den ursprünglichen Bits Beispiel aus der natürlichen Sprache Ich studiere in Gießer – Fehler kann erkannt und behoben werden Ich liebe rich – Fehler kann erkannt, aber nicht behoben werden

62 2.4.4Hamming-Codierung: Beispiel ASCII Paritätsbit bei der 7-bit ASCII-Codierung wähle das 8te Bit so, dass immer eine gerade Anzahl von Bits gesetzt ist (gerade Anzahl = even parity, ungerade Anzahl = odd parity) erhält man eine Nachricht mit ungerader Anzahl, so weiß man, dass (mindestens) ein Bit verkehrt ist. man weiß allerdings nicht welches man weiß auch nicht, ob nicht mehr als ein Bit verkehrt ist man weiß bei richtigem parity-Bit auch nicht, ob nicht mehr als 1 Bit verkehrt ist Idee: den Abstand gültiger Worte so groß wie nötig wählen ZeichenBinärmit even A B C

63 2.4.4Hamming-Codierung: Hamming-Distanz Definition: Der Hamming-Abstand (die Hamming-Distanz D) zwischen zwei Wörtern ist die Anzahl der Stellen, an denen sich zwei Worte gleicher Länge unterscheiden. Beispiel: Hamming-Abstand von (A) und (B) = 2 Definition: Der Hamming-Abstand (die Hamming-Distanz D) eines Codes ist der minimale Hamming-Abstand zwischen zwei beliebigen Wörtern des Codes. Beispiel: Hamming-Abstand von ASCII (mit even parity) = 2 Einige Konzequenzen: Codes mit Hamming-Distanz = 0 sind nicht eindeutig Bei Codes mit Hamming-Distanz = 1 kann das Kippen eines Bits zu einem anderen gültigen Codewort führen (muss nicht) Bei Codes mit Hamming-Distanz = 2 kann ein Ein-Bit Fehler erkannt werden.

64 2.4.5Hamming-Codierung: Fehlererkennung Fehler, bei denen höchstens D-1 Bits gestört sind, können sicher erkannt werden einige andere Fehler können, müssen aber nicht erkannt werden (genau dann, wenn die Hamming-Distanz zwischen zwei Wörtern eines Codes größer als die Distanz des Codes ist) Fehler werden erkannt, wenn ein Codewort ungültig ist 1-Bit-Fehler 2-Bit-Fehler gültiges Codewort erkennbares Codewort korrigierbares Codewort A B

65 2.4.5Hamming-Codierung: Fehlerkorrektur Fehler, bei denen höchsten (D-1)/2 Bits gestört sind, können sicher korrigiert werden einige andere Fehler können, müssen aber nicht korrigiert werden können (genau dann, wenn die Hamming-Distanz zwischen zwei Wörtern eines Codes größer als die Distanz des Codes ist) Falsches Codewort wird em nächstmöglichen Codewort (d.h. dem mit der minimalen Distanz) zugeordnet. gültiges Codewort erkennbares Codewort 1-Bit-Fehler 2-Bit-Fehler korrigierbares Codewort A B

66 2.4.5Hamming-Codierung: Hamming Idee Jedes Prüfbit stellt die gerade Parität einer gewissen Menge von Bits (einschließlich sich selbst) sicher Jedes Datenbit kann in mehreren dieser Mengen einbezogen sein Die Hamming-Methode Es werden an der 1,2,4,8,... Stelle Prüfbits eingeführt Jedes Prüfbit hat damit in seiner dualen Stellennummer genau eine Stelle mit einer 1 (1,2,4,8,... = 1,10,100,1000,...) Alle Stellen im Wort, die an derselben Stelle eine 1 haben (und an den anderen 1 oder 0) werden aufsummiert 1 001,011,101,111,...also 1,3,5,7,... Stellen ,011,110,111,...also 2,3,6,7,... Stellen ,101,110,111,...also 4,5,6,7,... Stellen Das entsprechende Parity-Bit wird als even-parity Bit gesetzt PDDDPDPP... 18

67 2.4.5Hamming-Codierung: Beispiel Hamming zu kodieren: 1011 Prüfbit 1 (001) relevant 011,101,111 also Bit 3,5,7 Summe = 3 Bit setzen Prüfbit 2 (010) relevant 011,110,111 also Bit 3,6,7 Summe = 2 Bit löschen Prüfbit 4 (100) relevant 101,110,111 also Bit 5,6,7 Summe = 2 Bit löschen kodiert: P1P1 101P1PP P

68 2.4.5Hamming-Codierung: Beispiel Hamming Fehlerhafter Code: Verfahren prüfe alle Parity-Bits k = Summe der fehlerhaften Bitnummern k gibt die Nummer des gestörten Bits an (nur bei 1-Bit Fehler zuverlässig) Hier: Bit1 prüft 3,5,7: falsch Bit2 prüft 3,6,7: ok Bit4 prüft 5,6,7: falsch k = = 5 Bit5 muss getauscht werden

69 2.4.6Genetische Codierung Beim Menschen ist die Desoxyribonukleinsäure (DNS, engl. DNA) der Träger der genetischen Information und Hauptbestandteil der Chromosomen. Die DNS ist ein kettenförmiges Polymer aus Nukleotiden, die sich in ihren Stickstoffbasen unterscheiden (Thymin/Cytosin bzw. Adenin/Guanin,) das Alphabet des Codes ist also: {Thymin, Cytosin, Adenin, Guanin,} oder auch { T, C, A, G } Je drei aufeinanderfolgende Basen bilden ein Wort Es gibt also 4 3 = 64 Kombination die Wortlänge ist also ld(64) Bit = 8 Bit Ein Gen enthält etwa 200 Worte Ein Chromosom enthält ca bis 10 5 Gene Die Anzahl der Chromosomen pro Zellkern ist beim Menschen 46 Die pro Zellkern gespeicherten Daten haben damit ein Volumen von 8 Bit * 200 * 10 5 * 46 = Bit * MBit 1 GByte

70 2.4.6Definition: Mittlere Wortlänge Codiert man die Zeichen eines Alphabetes binär (also mit Sequenzen eines 2-Zeichen-Alphabetes, z.B. 0 und 1), so versteht man unter der mittleren Wortlänge L eines Codes die mit den Auftrittswahrscheinlichkeiten gewichtete Summe der Längen l(x i ) der den einzelnen Symbole entsprechenden Codewörtern L = p(x i ) * l(x i ) Beispiel yxxzyx H = 1,5 Bit L = 1,5 Bit

71 2.4.6Definition: Redundanz Die mittlere Wortlänge eines Binärcodes ist immer größer oder gleich dem mittleren Informationsgehalt. Die Differenz zwischen mittlerer Wortlänge und mittlerem Informationsgehalt wird als Redundanz R des Codes bezeichnet: R = L - H Die Redundanz bezogen auf die Wortlänge nennt man relative Redundanz r: r = R / L Redundanz ist also ein Maß für die Qualität einer Kodierung (insofern die Länge eines Codes als Qualität angesehen wird)

72 2.5.6Redundanz – Beispiel Beispiel yxxzyx H = 1,5 Bit L = 1,5 Bit H = 1,156 Bit L = 1,3 Bit H= p i * h i = - p i * ld(p i ) = 0,360+0,464+0,332 = 1,156 L= p i * l i = 0,7+0,4+0,2 = 1,3 R = L - H = 1,3 - 1,156 = 0,144 r = R / L = 0,144 / 1,3 = 0,111

73 2.5Zusammenfassung des Kapitels Was ist Information Definition nach Shannon Informationsgehalt eines Zeichens (x)h(x) = ld (1/p(x)) = - ld (p(x) einer Nachricht (n)h(n) = h(n 1 ) + h(n 2 ) + h(n 3 ) +... Mittlerer Informationsgehalt eines Zeichens (x)H(x) = p(x i ) * h(x i ) einer Nachricht (n)|n| * H(x) Definition in der Informatik Bits und Bytes Codes mittlere WortlängeL = p(x i ) * l(x i ) Huffman Hamming RedundanzR = L - H Achtung: Nicht verwechseln !

74 Kapitel 3Zeichen und Zahlen Auch wenn Objekte der realen Welt beliebig komplex in Zusammen- setzung uns Struktur sind, so werden sie in den meist auf zwei einfache Repräsentationen - als Abstraktion - abgebildet: Zeichen und Zahlen. Dieses Kapitel beschreibt, wie diese Objekte in eine für den Rechner verarbeitbare Form kodiert werden können. Inhalt 1.Kodierung von Zeichen 2.Darstellung von Zahlen

75 3.1Kodierung von Zeichen Die Wurzeln der Informatik liegen in der Mathematik. Die ersten Computer waren Rechner im wörtlichen Sinne, deren Aufgabe die Verarbeitung von Zahlen war. Mittlerweile hat sich der Aufgaben- schwerpunkt in Richtung Elektronischer Datenverarbeitung ver- schoben, wobei als Datum immer weniger Zahlen im Mittelpunkt stehen, als vielmehr Texte. Dieses Unterkapitel beschreibt verschiedene Möglichkeiten die Atome eines Textes, die Buchstaben, zu kodieren. Inhalt ASCII EBCDIC UNICODE

76 3.1.1ASCII -Tabelle (7Bit) American Standard Code for Information Interchange

77 3.1.1ASCII - Sonderzeichen Bedeutung der Sonderzeichen im ASCII-Code

78 3.1.2EBCDIC - Tabelle Extended Binary Coded Decimals Interchange Code

79 3.1.2EBCDIC - Sonderzeichen Die Bedeutung der Sonderzeichen

80 3.1.3Unicode Aktuelle Version (siehe auch Buchstaben und Symbole aus allen wichtigen geschriebenen Sprachen der Welt Amerika, Europa, Mittlerer Osten, Afrika, Indien, Asien, Pazifik Symbole Satzzeichen Sonderzeichen Wird genormt in ISO/IEC Kompatibilität mit ASCII F: identisch mit 7-bit ASCII 007F - 00FF: Latin-1 Supplement (nationale Sonderbuchstaben) FF: Blockgraphikzeichen (Box Drawing:...)

81 3.1.3Unicode: Beispiele 05F1 FA0E AC xxD0 - xxDF Rejected

82 3.2Darstellung von Zahlen Die Darstellung von Zahlen spielt in der Informatik nach wie vor eine wichtige Rolle. Dabei gibt es unterschiedliche Mengen von Zahlen und auch unterschiedliche Operationen auf Zahlen. Dieses Unterkapitel beschreibt die Grundlagen der Zahlenkodierung, gibt für alle Mengen von Zahlen eine konkrete Kodierung an und führt in die Computerarithmetik ein. Inhalt 1.Zahlensysteme 2.Konvertierung 3.Arithmetik 4.Ganze positive Zahlen 5.Ganze negative Zahlen 6.Gebrochene Zahlen 7.Gleitpunktzahlen 8.Standards

83 3.2.1Zahlensysteme Nicht systematische Zahlendarstellungen, z.B.: Strichliste: I, II, III, IIII, IIII, IIII I,... römische Zahlen:MIM, IX,.... Systematische Zahlendarstellungen in einem Stellenwertsystem Jede Zahl N läßt sich als Sequenz von Zeichen a i darstellen Die Anzahl der notwendigen unterscheidbaren Zeichen ist B a i * B i Im Dezimalsystem ist B = 10 und die unterscheidbaren Zeichen sind: 0,1,2,3,4,5,6,7,8,9 Im Binärsystem ist B = 2 und die unterscheidbaren Zeichen sind: 0,1

84 3.2.1Zahlensysteme - Beispiele Dezimalsystem: =1 * * * * 10 0 Binärsysten: =1 * * * * * * * * * Hexadezimalsystem (Sedezimalsystem) Zeichen: 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F =7 * * * 16 0 =7BF 16 = 0x07BF = H07BF 4 Zeichen einer Binärzahl lassen sich durch eine Hexadezimal-ziffer darstellen (4 Binärziffern nennt man auch NIBBLE) Oktalsystem Zeichen: 0,1,2,3,4,5,6, =3 * * * * 8 0 = Zeichen einer Binärzahl lassen sich durch eine Oktalziffer darstellen

85 3.2.2Konvertierung: Intuitivmethode Addition von geigneten Zweierpotenzen (Dezimalzahl Dualzahl) positive Zweierpotenzen für Vorkommaanteil negative Zweierpotenzen für Nachkommaanteil Vorgehen (getrennt nach Vor- und Nachkommateil) Suche größte Zweierpotenz, die noch in die Zahl passt Subtrahiere die Zweipotenz von der Zahl daraus ergibt sich die neue Zahl für die Suche der Zweierpotenz Dieses Vorgehen terminiert beim Vorkommateil: wenn die Zahl = 0... beim Nachkommateil: wenn die Zahl erreicht ist, vielleicht nie Beispiel: = = = = , , ,5= 0,3125 0, , ,25 = 0,0625 0, , ,0625= 0 0,1101

86 3.2.2Konvertierung: Restwertmethode Erzeugen des Hornerschemas (Ausklammern der Basis b) c 0 = a n b n + a n-1 b n a 2 b 2 +a 1 b 1 + a 0 b 0 c 0 = ((... (a n b + a n-1 ) b a 2 ) b +a 1 ) b + a 0 c 0 / b = c 1 Rest a 0, mit c 0 = (... (a n b + a n-1 ) b a 2 ) b +a1, c1 / b = c 2 Rest a 1, mit c 1 =... (a n b + a n-1 ) b a 2,... c n / b = 0 Rest a n ( terminiert mit c n+1 = 0 ) Konversion der Nachkommastellen (folgt aus Hornerschema): 1.Multiplikation mit Basis (bis ganzzahliges Ergebnis oder gewünschte Genauigkeit) 2.Abspalten der Vorkommastelle des Ergebnisses, weiter mit 1. Beispiel 19 : 2 =9Rest 1 9 : 2 =4Rest 1 4 : 2 =2Rest 0 2 : 2 =1Rest 0 1 : 2 =0Rest 1 0,6875 * 2 =1,3751 abspalten 0,375 * 2 =0,750 abspalten 0,75 * 2 =1,51 abspalten 0,5 * 2 =11 abspalten ,1011

87 3.2.2Arithmetik Addition Subtraktion Multiplikation Division = = = = 0 Übertrag = = 1 Übertrag = = 0 0 * 0 = 0 0 * 1 = 0 1 * 0 = 0 1 * 1 = Überträge Überträge * Überträge : 11 =

88 3.2.3Ganze positive Zahlen Positive ganze Zahlen werden meist direkt in ihrer binären Darstellung kodiert. Die BCD (Binäry Coded Digits) - Darstellung von Zahlen ist eine Mischform aus Dezimal- und Binärdarstellung: Jede Ziffer der Dezimalzahl wird binär dargestellt. Die Darstellung jeder Ziffer erfolgt mit 4 Bits. Die Reihenfolge der Ziffern bleibt erhalten. Beispiele: Pseudotetraden

89 3.2.4Ganze negative Zahlen: Probleme Darstellung des Vorzeichens im ersten Bit, z.B. 0000=01000= =11001= =21010= =31011= =41100= =51101= =61110= =71111=-7 Nachteil durch Redundanz der Darstellung der 0 Nachteil durch Probleme beim formalen Addieren

90 3.2.4Ganze negative Zahlen: Zweierkomplement Zweierkomplementdarstellung -2 n... +(2 n -1) Negative Zahl durch bitweise Komplementierung und Addition von =01000=-8Beispiel: =11001= Binärdarstellung 0010=21010= Komplement 0011=31011= Komplement + 1 = =41100= =51101= =61110= =71111=-1 Vorteile Darstellung des Vorzeichens im ersten Bit Abdeckung von 16 Zahlen, also keine Redundanz Kein Nachteil durch Probleme beim formalen Addieren Subtraktion durch Addition des Zweierkomplements (Überlauf weglassen) (Überlauf weggelassen)

91 3.2.5Gebrochene Zahlen: Binärdarstellung Darstellung mit Vor- und Nachkommateil Beispiele Gebrochene BinärzahlGebrochene Dezimalzahl 0.10, , , ,1 Mit 32 Bit lassen sich nur 2 32 verschiedene Zahlen darstellen. Problem: extrem große und extrem kleine Zahlen lassen sich mit wenigen Bits nicht darstellen Bei 8 Bit mit 4 Vorkomma und 4 Nachkommastellen (ohne Vorzeichen): < n < ,0675 < n < 15,9425

92 3.2.5Gebrochene Zahlen: Exponentialdarstellung Anforderung sehr große und sehr kleine Zahlen sollen darstellbar sein Masse Elektron = 9 * g Anzahl Moleküle pro Mol = 6,022 * die relativen Genauigkeiten sind wichtiger als die absoluten Ältere Quellen geben die Anzahl der Moleküle pro Mol mit 6,065 * an Eine Änderung in der Mantisse von 0,04 entspricht einer Toleranz von 6,065 / 6,022 1,0071 also ca. 0,7%. Fixkommadarstellung wäre große Verschwendung zur Darstellung dieser beiden Größen wären 194 Bit nötig 87 Bit Vorkommateil 107 Bit Nachkommateil Idee: Signifikante Stellen und Größenordnung werden getrennt Signifikant Masse Elektron: 9 Größenordnung Masse Elektron:

93 3.2.5Gleitpunktzahlen: Real Darstellung Darstellung durch Real-Zahlen, bestehend aus drei Teilen: Vorzeichenbit V Gibt an, ob die Zahl positiv oder negativ ist Mantisse M Wird mit dem Exponenten multipliziert Die Normalform wird erreicht, indem das Komma soweit nach links oder rechts geschoben wird, bis die erste Stelle nach dem Dezimalpunkt die erste von Null verschieden Ziffer ist. Der Exponent wird entsprechend der Verschiebungen erhöht oder vermindert. Exponent E Potenz einer Basiszahl (2) mit der die Mantisse multipliziert wird wird oft in BIAS-Darstellung abgelegt, d.h. wird mit 126 addiert um negatives Vorzeichen zu vermeiden. Vorsicht: 126 (nicht 128). Asymmetrisch, da 2 1 bei der Normalisierung zweimal geschoben wird, 2 -1 gar nicht Vorsicht: Bei manchen Maschinen wird so normalisiert, dass die erste Stelle vor dem Komma gleich 1 wird, dann ist der BIAS 127

94 3.2.5Gleitpunktzahlen: Umwandlung Umwandlung Dezimalzahl in binäre Gleitpunktzahl (nach IEEE 754) Umwandlung der Dezimalzahl in Binärzahl mit Nachkommateil Verschieben des Kommas nach links oder rechts bis zur Normalform Damit ist erste Nachkommastelle = 1 und daher redundant, kann also in der Mantisse weggelassen werden. 2 * größere Genauigkeit der Mantisse Addition des BIAS =126 (um negative Exponenten zu vermeiden) Umwandlung in binäre Form Das Vorzeichen der Mantisse wird bestimmt: positiv 0, negativ 1 IEEE 754 sieht noch eine optionale Rundung der Mantisse vor Nicht jede gebrochene Dezimalzahl lässt sich endlich als gebrochene Binärzahl darstellen (und umgekehrt). Dadurch entstehen Rundungsfehler

95 3.2.5Gleitpunktzahlen: Beispiele Beispiel: 148, Konvertieren: ,101 2.Normalisieren: ,101 = 0, *2 +8 Exponent ist 8. M= (die führende 1 ist in Normalform redundant) 3.Bias addierenE= = = VorzeichenV = 0 5.Ergebnis :VEEEEEEEEMMMMMMMMMMMMMMMMMMMMMMM Beispiel: -2, Konvertieren: 10,11 2.Normalisieren: 10,11 = 0,1011*2 +2 Exponent ist 2. M= 011 (die führende 1 ist in Normalform redundant) 3.Bias addierenE= = = VorzeichenV = 1 5.Ergebnis :VEEEEEEEEMMMMMMMMMMMMMMMMMMMMMMM

96 3.2.5Gleitpunktzahlen: Arithmetik Addition/Subtraktion Die Exponenten werden angeglichen, indem die Mantisse des Operanten mit dem kleineren Absolutbetrag entsprechend verschoben wird. Anschließend werden die Mantissen addiert Beim Verschieben können Stellen verloren gehen. Multiplikation Die Mantissen der Operanten werden multipliziert Die Exponenten werden addiert Sind die Exponenten zu groß, kann es zu Exponenten-Overflow kommen Division Die Mantissen der Operanten werden dividiert Der Exponent ergibt sich aus der Differenz des Dividenden und Divisors Ist der Divisor zu klein und/oder der Dividend zu groß kann es zu einem Exponenten-Underflow kommen. Das Ergebnis wird dann zu 0, alle Ziffern sind verloren Nach allen Operationen wird die Normalform ggf. wiederhergestellt

97 3.2.6Standards Short (8Bit) Integer (16Bit) Unsigned Int (16Bit) LongInt (32Bit) Real nach IEEE 754 Float1 VZ-Bit, 8 Bit E, 23 Bit M (32Bit) Double1 VZ-Bit, 11 Bit E, 52 Bit M(64Bit) zwei Varianten 0,5 M < 1 bzw. 1 M < 2 Numbersignexponent mantissa normalized number0/101 to FEany value denormalized number0/100any value zero0/1000 infinity0/1FF0 NaN0/1FFany value but 00

98 3.2.6Standards: Beispiel (Delphi) In Borlands Delphi (Pascal) sind folgende Typen festgelegt: TypBereichSignifikantGröße Real482,9 x 10^-391,7 x 10^ Single1,5 x 10^-453,4 x 10^ Double5,0 x 10^-3241,7 x 10^ Extended3,6 x 10^-49511,1 x 10^ Comp-2^63+12* Currency Der generische Typ Real ist in der aktuellen Implementierung mit dem Typ Double identisch.

99 3.3Zusammenfassung des Kapitels Kodierung von Zeichen ASCII EBCDIC UNICODE Darstellung von Zahlen Zahlensysteme Konvertierung Arithmetik Ganze positive Zahlen Ganze negative Zahlen Gebrochene Zahlen Gleitpunktzahlen Standards

100 Kapitel 4Datenstrukturen Information aus der realen Welt werden in einem informationsver- arbeitenden System als Daten abgelegt. Diese stellen also eine (vereinfachte) Abstraktion der Wirklichkeit dar und spiegeln in vielen Fällen die Strukturen der Wirklichkeit wider. In diesem Kapitel wird ein Überblick über die wichtigsten abstrakten Datenstrukturen gegeben, wobei dieser Begriff zum Begriff des Datentyps erweitert wird. Inhalt 1.Datenstrukturen - Datentypen 2.Datentypen: Ein Überblick 3.Konkrete Datentypen 4.Abstrakte Datentypen

101 4.1Datenstrukturen - Datentypen In der Literatur wird meist der Begriff Datenstruktur verwendet. In diesem Unterkapitel soll der Unterschied ziwschen diesem Begriff und dem Begriff des Datentyps erläutert werden. Inhalt 1.Datenstrukturen 2.Datentypen 3.Variablen eines Datentyps

102 4.1.1Datenstrukturen In der Informatik werden Objekte der realen oder abstrakten Welt erfasst Bei der Erfassung beschränkt man sich möglichst auf die für den weiteren Transport / Speicherung/Verarbeitung/Umsetzung notwendige Information Zur internen Repräsentation werden diese Objekte abstrahiert Zur Abstraktion gehört die Erkennung von Strukturen - im Sinne einer Aggregation. Also Aus welchen Teilobjekten bestehen Objekte ? In welchem Verhältnis stehen die Teilobjekte zueinander ? Welches sind die atomaren Teilobjekte ? Anschließend werden diese Objekte typisiert. Typisierung ist die Einteilung von abstrakten internen Objekten in Gruppen mit gleichen oder ähnlichen Eigenschaften.

103 4.1.2Datentypen Typen sind also nicht die intern repräsentierten Objekte, sondern beschreiben die Eigenschaft einer Gruppe von Objekten. Zu diesen Eigenschaften gehören: Struktur Wertebereich anwendbare Operatoren, Funktionen, Relationen Beziehungen zu anderen Typen interne Repräsentationsweise … Einige Anmerkungen:: Der Begriff Datentyp ist weitergehend als der Begriff Datenstruktur In der Objektorientierten Programmierung wird statt Datentyp auch der Begriff Klasse verwendet (Klassen beschreiben mehr Eigenschaften) Konkrete Repräsentanten eines Datentyps werden (u.a) Variable oder - bei oo-Sprachen - Instanz genannt Beispiel: Imaginäre Zahlen

104 4.1.3Variable eines Datentyps Einen speziellen Repräsentanten eines Datentyps bezeichnet man als Variable. Die Festlegung, von welchem Datentyp eine Variable ist, bezeichnet man als Variablendeklaration. Die Zuordnung eines Typs Typ an eine Variable X wird (zunächst) wie folgt notiert: X : Typ; Eine Variable hat alle Eigenschaften eines Datentyps. Zusätzlich dazu hat eine Variable: einen konkreten Wert. Der Wert muss aus dem Wertebereich des Datentyps sein (oder undefiniert) Die Zuweisung eines Wertes Wert an eine Variable X sei (zunächst) wie folgt notiert: X = Wert; einen konkreten Speicherplatz Dieser Speicherplatz ist so dimensioniert, dass die Struktur der Variable abgebildet werden kann Dieser Speicherplatz wird (meist) implizit durch die Deklaration zugeordnet Beispiel: x : Datentyp; // x ist vom Typ: Datentyp X = 531; // Zuweisung von 531 an X

105 4.2Datentypen: Überblick Nachdem sich nun der Begriff des Datentyps als Oberbegriff der Datenstruktur erwiesen hat, konzentrieren wir uns im Rest des Kapitels auf wichtige Datentypen. In diesem Unterkapitel wird ein Klassifikationssystem für die in der Informatik verwendeten Datentypen aufgestellt und kurz erläutert Inhalt 1.Klassifikation der Datentypen 2.Erläuterung der Klassifikation

106 4.2.1Klassifikation der Datentypen Datentypen IdealisierteAbstrakteKonkrete EinfacheStrukturiertePointer(Zeiger) Boolean (Wahrheitswert) Integer (Ganzzahl) Char (Zeichen) Enumeration (Aufzählung) OrdinaleReal (Fließkomma) Array (Feld) Record (Verbund) Union (Variantenverb.)...

107 4.2.2Erläuterung der Klassifikation Idealisierte Datentypen aus der Mathematik bekannte Datentypen: R, N, Z,... Variablen dieser Typen sind oft nicht endlich darstellbar (Bsp: 2) In einem Computer-Algebra-System symbolisch darstellbar (Bsp: 2^( 1/2)) Konkrete Datentypen in einem Rechner von Hard- oder Software bereitgestellte Datentypen entweder vordefiniert oder durch den Benutzer definierbar Abstrakte Datentypen verbergen ihren inneren Aufbau vor dem Benutzer bestehen aus beliebigen Strukturen über konkrete/idealisierte Datentypen, sowie aus Zugriffsfunktionen bzw. Prozeduren Beispiel:Baum insert (Element) delete (Element) search (Element)

108 4.3Konkrete Datentypen Die am häufigsten abstrahierten Objekte der realen Welt sind, zumindest was die für eine weitere Verarbeitung notwendigen Informationen betrifft, einfach strukturiert und lassen sich demnach mit konkreten Datentypen abbilden. Dieses Unterkapitel gibt einen Überblick über alle konkreten Datentypen und beschreibt diese. Inhalt 1.Einfache Datentypen 2.Strukturierte Datentypen 3.Verweise 4.Abstrakte Datentypen

109 4.3.1Einfache: boolean (Wahrheitswert) zur Darstellung von Wahrheitswerten Wertebereich: true, false intern in manchen Programmiersprachen als 1 bzw 0 dargestellt Operatoren: und, oder, nicht, Vergleiche,... Operatoren entsprechend der boolschen Algebra oft auch allgemeine arithmentische Operationen möglich Vorsicht vor Integer-Arithmetik mit boolean-Variablen Notation: booleanVar : boolean; Beispiel: switch : boolean; switch = false; // = 0 switch = not(switch); // = not(0) = 1 switch = switch and not(switch); // = 1 and 0 = 0 switch = switch or not (switch); // = 0 or 1 = 1

110 4.3.1Einfache: integer (Ganzzahl) zur Darstellung ganzer Zahlen mit oder ohne Vorzeichen Wertebereich: Unterschiedlich unsigned integer: Ganze Zahlen ohne Vorzeichen ( ) oft 16 bit bzw. 32 bit als shortInt bzw. longint bezeichnet Vorsicht:16 bit Integer ist verdammt wenig ((± 32267) Speicherplatz ist nicht mehr teuer benutzen Sie longInt (Ausnahmen bestätigen die Regel) Operatoren: Grundrechenarten, Vergleiche Operatoren entsprechend der klassischen Algebra Notation: integerVar : integer; Beispiel: i : integer; i = 1; // = 1 i = i + 32;´ // = = 33 i = i / 17; // = 33 / 17 = 1 ! i = i ; // bei unsigned Int.: Fehler !

111 4.3.1Einfache: char (Zeichen) zur Darstellung von Zeichen Vorsicht:Typischerweise wird die ASCII-Codierung zugrundegelegt, kann aber auch Unicode sein Wertebereich: Alle Zeichen Intern codiert als ASCII oder - neuerdings immer öfter - als Unicode ASCII: 8 Bit (7 benutzt), Unicode: 16 Bit Intern oft als integer repräsentiert Operationen: Vergleich oft auch allgemeine arithmentische Operationen möglich Vorsicht vor Integer-Arithmetik mit boolean-Variablen Notation: charVar : char; Beispiel: symbol : char; symbol = A; // = A symbol = symbol + 32;´ // = A + 32 = a symbol = symbol - 128; // = a = Fehler

112 4.3.1Einfache: enum (Aufzählung) zur Darstellung endlicher benutzerdefinierter Wertebereich Es ist guter Stil, Mengen mit (garantiert) kleiner Mächtigkeit (<10) als enum-Type zu deklarieren, anstatt sie z.B. als Integer zu kodieren. Intern werden enum-Werte oft als integer abgelegt Operatoren: Vergleich oft auch allgemeine arithmentische Operationen möglich Vorsicht vor Integer-Arithmetik mit enum-Variablen Notation: enumVar : enum { Wertemenge }; Beispiel: ampelfarbe : enum {gruen,gelb,rot} ; ampelfarbe = gruen; // = gruen ampelfarbe = ampelfarbe +1 ; ´ // = gruen + 1 = gelb ampelfarbe = ampelfarbe +1 ; ´ // = gelb + 1 = rot ampelfarbe = ampelfarbe +1 ; ´ // = rot + 1 = Fehler !

113 4.3.1Einfache: real (Fließkomma) zur näherungsweisen Darstellung reeller Zahlen Wertebereich: Unterschiedliche Genauigkeiten und Wertebereiche Wertebereich entspricht typischerweise der IEEE 754 Norm, also: Float: 32 bit Double: 64 bit Operationen: Grundrechenarten, erweiterte Arithmetik, Vergleich Notation: realVar : real; Beispiel: //--- Variable-declaration pi, flaeche, radius : real; // all real ! //--- Initialisation pi = 3,141; // needs not to be more accurate radius = 5; // might be changed by user //--- Computation of surface flaeche = 2 * pi * (radius ^ 2); // common formula

114 4.3.2Strukturierte: Array (Feld) Arrays sind eine Aggregationen von Daten des gleichen Typs (des Basistyps) Die Grenzen des Arrays sind (meist) statisch bestimmt Operation: Auswahl Die Auswahl eines Datenelemtes über erfolgt über einen ganzzahligen Index über den (Auswahl-)Operator [ ] Vorsicht: Zugriff außerhalb des deklarierten Bereiches führt zu Fehlern Notation: ArrayVar : array[min.. max] of Datentyp Beispiele Eindimensionales array: Vektor : array[1..4] of real; Zweidimensionales array: Matrix : array[1..3] of array[1..2] of real; Operator m : array[1..3] of array[1..2] of real; v : array[1..4] of real; v[3] = 5,03; v[4] = 4,12; m[1][2] = v[3] * 12 - v[4];

115 4.3.2Strukturierte: Record (Verbund) Verbunde sind Aggregationen von Daten möglicherweise unter- schiedlichen Typs manchmals auch structure oder struct genannt Operation: Auswahl Die Auswahl erfolgt durch Angabe den des Komponentennamens (durch einen Punkt vom Variablennamen getrennt) Notation: recordVar : record { komponent1 : type1;... }; Beispiel: d : record { tag : Integer; monat : Integer; }; d.monat = 10; d.tag = 20;

116 4.3.2Strukturierte: Variant Record (Variantenverb.) Verbunde, deren Struktur mögliche Alternativen zulassen manchmals auch union genannt lassen Varianten eines Record-Types zu Operation: Auswahl (wie bei records über Punkt-Operator) Notation: varrecVar : record { komponent1 : type_1;...; TAGGED TYPE case variant (variant1,...) of { (implizit) variant1 : type_n;... } } Unterelement variant implizit definiert bei tagged type Nur ein Unterelement aus variant1,... (sinnvoll) verwendbar Beispiel: adam,eva : record { name : array [1..20] of char;adam.sex = m; case sex (m,f) of {adam.muscle = 20,5; f: {IQ: integer};eva.sex = f; m: {muscle: real}; // in cmeva.IQ = 132; }

117 4.3.2Strukturierte: Variant Record adam,eva : record { name : array [1..20] of char;adam.sex = m; case sex (m,f) of {adam.muscle = 20,5; f: {IQ: integer};eva.sex = f; m: {muscle: real}; // in cmeva.IQ = 132; } Umsetzung: Variant Records mit Untagged Types (z.B. C, C++ : Union) (2. Variante) struct { char[20] name; enum {m,f} sex;adam.sex = m; union {adam.muscle = 20,5; int IQ;eva.sex = f; real muscle; // in cmeva.IQ = 132; } adam, eva; namesexIQ / muscle

118 4.3.3Verweis: Pointer (Zeiger) Mit einfacher Datentypen und mit den konkreten Datentypen Liste und Verbund lassen sich nur statische Struktur aufbauen d.h. Strukturen, deren Speicherbedarf beliebig aber fest sind Bem.: Die Beliebigkeit ist begrenzt durch die Gesamtspeicherkapazität Mit Zeiger-Datentypen lassen sich Strukturen aufbauen, die sich dynamisch auf- und abbbauen lassen d.h. Strujturen, deren Speicherbedarf sich dynamisch verändern kann Bem.: Auch hier ist die Beliebigkeit begrenzt durch die Gesamtspeicher- kapazität Beispiel: knoten : record { symbol : char; links : Verweis; rechts : Verweis; } B CEDA Huffman (Bsp. aus Kap.2)

119 4.3.4Vereinfachung der Notation (typedef) Person : record { surname : array [1..20] of char; forename : array [1..20] of char; birthday : record { year: integer; month : enum {jan,...}; day : integer; }; }; Akt_Datum : record { year: integer; month : enum {jan,feb,...}; day : integer; }; In (fast) allen Programmiersprachen ist es möglich, beliebig strukturierte Datentypen neu zu bezeichnen und diese Typ-Bezeichner wie vordefinierte Typen zu verwenden: Notation: typedef NeuTyp : Typ; Beispiel: typedef Datum : record { year: integer; month : enum {jan,feb,...}; day : integer; }; Person: record { surname : array [1..20] of char; forename : array [1..20] of char; birthday : Datum }; Akt_Datum: Datum;

120 4.3.5Beispiel: Kombination von Datentypen Um nun beliebig komplexe Strukturen der realen Welt in einem Rechensystem abbilden zu können, kann man die vorgestellten Datentypen beliebig miteinander Kombinieren Beispiel.: typedef Person : record { surname : array [1..20] of char; forename : array [1..20] of char; birthday : record { year: integer; month : enum {jan,feb,...}; day : integer; }; next : Verweis; previous : Verweis; };

121 Datenstrukturen 4.4Abstrakte Datentypen Grundsätzlich lassen sich alle Objekte der realen Welt ausschließlich mit Hilfe einfacher Datentypen abbilden. Diese Abbildung ist aber meist unnatürlich, weil sie die Struktur realer Objekte nicht ausreichend berücksichtigt. Abhilfe schaffen hier strukturierte Datentypen, die allerdings grundsätzlich nur endliche Objektmengen repräsentieren können. Hier schaffen Zeigertypen Abhilfe. Kann man nun mit diesen Mitteln Strukturen realer Objekt natürlich abbilden, so fehlen diesen Datentypen einige der Eigenschaften, die Datentypen von Datenstrukturen unterscheiden, dies sind insb. Operationen und Beziehungen zu anderen Typen. Einen vertieften Einblick in die bunte Welt abstrakter Datentypen bietet die Vorlesung des 2. Semesters

122 4.5Zusammenfassung des Kapitels Wir sind damit auch an die Grenzen dessen gelangt, was in dieser Vorlesung über die Statik von Objekten gesagt werden soll und wenden uns einem noch spannenderem Themenbereich zu ;-) Datentypen IdealisierteAbstrakteKonkrete EinfacheStrukturiertePointer(Zeiger) Boolean (Wahrheitswert) Integer (Ganzzahl) Char (Zeichen) Enumeration (Aufzählung) OrdinaleReal (Fließkomma) Array (Feld) Record (Verbund) Union (Variantenverb.)...

123 Kapitel 5Algorithmenentwurf In den vorangegangenen Kapiteln wurde, aufbauend auf dem Begriff der Information, beschrieben, wie die statischen Objekte der Informatik aussehen und notiert werden können. In diesem Kapitel wird aufgezeigt, wie man die Verarbeitung dieser Objekte (also die Dynamik) beschreiben kann. Wesentlicher Begriff dabei ist der Begriff des Algorithmus Inhalt 1.Ein Beispiel 2.Definition 3.Die Struktelemente 4.Strukturierung 5.Blockung 6.Iteration und Rekursion Teile dieses Kapitels sind aus: R.Manthey: Vorlesung Informatik 1, Uni Bonn, 2001

124 5.1Ein Beispiel Zunächst soll ein kleines Beispiel in eine mögliche Aufgabenstellung aus dem (bekannten) Bereich der Mathematik einführen und dadurch auch eine (eingeschränkte) Vorstellung über die Aufgaben und Elemente eines Algorithmuses geben. Inhalt 1.Das Problem (Beispiel) 2.Ein Algorithmus I 3.Ein Algorithmus II 4.Vergleich der Algorithmen 5.Ein Algorithmus III 6.Fragestellungen 7.Ein weiterer Algorithmus

125 5.1.1Das Problem Eine quadratischen Gleichung: Allgemeine Darstellung der quadratischen Gleichung Allgemeine Lösung der quadratischen Gleichung Lösung der quadratischen Gleichung x 2 + 8x + 7 = 0 x 2 + px + q = 0 x 1,2 = -p/2 p 2 /4 - q + - x 1,2 = -8/2 8 2 /4 - 7 = x 1 = -1 x 2 = -7

126 Zuweisungen 5.1.3Ein Algorithmus I 1.Lies die Zahlen p und q ein 2.Berechne die Zahl w = p 2 /4 - q 3.Berechne die Zahl x 1 = -p/2 + w 4.Berechne die Zahl x 2 = -p/2 - w 5. Gib x 1 und x 2 als Ergebniss aus Ein Algorithmus Berechnungen Ausgaben Eingaben Variable Konstante x 1,2 = -p/2 p 2 /4 - q + -

127 5.1.4Ein Algorithmus II Ein zweiter Algorithmus 1.Lies die Zahlen p und q ein 2.Berechne die Zahl p/2 ; Nenne diese Zahl a 3.Berechne die Zahl a 2 ; Nenne diese Zahl b 4.Berechne die Zahl b-q ; Nenne diese Zahl c 5.Berechne die Zahl c ; Nenne diese Zahl d 6.Berechne die Zahl -a ; Nenne diese Zahl e 7.Berechne die Zahl e + d ; Nenne diese Zahl x 1 8.Berechne die Zahl e - d ; Nenne diese Zahl x 2 9. Gib x 1 und x 2 als Ergebniss aus FHSymbol1 Es gibt (oft unendlich) viele Algorithmen zur Lösung eines Problems x 1,2 = -p/2 p 2 /4 - q + -

128 5.1.5Vergleich der Algorithmen Berechne die Zahl w = p 2 /4 - q Berechne die Zahl x 1 = -p/2 + w Berechne die Zahl x 2 = -p/2 - w Berechne die Zahl p/2 ; Nenne diese Zahl a Berechne die Zahl a 2 ; Nenne diese Zahl b Berechne die Zahl b-q ; Nenne diese Zahl c Berechne die Zahl c ; Nenne diese Zahl d Berechne die Zahl -a ; Nenne diese Zahl e Berechne die Zahl e + d ; Nenne diese Zahl x 1 Berechne die Zahl e - d ; Nenne diese Zahl x 2 A1A2 Anzahl Berechnungen107 Anzahl Zuweisungen37 Anzahl Variablen59 FHSymbol1 Welcher Algorithmus ist besser ? Warum ?

129 1.Lies die Zahlen p und q ein 2.Berechne die Zahl a = p/2 3.Berechne die Zahl b = a 2 4.Berechne die Zahl c = b-q 5.aWenn c negativ ist brich den Algorithmus ab Ansonsten mache mit nächstem Schritt weiter 6.Berechne die Zahl d = c 7.Berechne die Zahl e = -a 8.Berechne die Zahl x 1 = e + d 1 9.Berechne die Zahl x 2 = e - d 10. Gib x 1 und x 2 als Ergebniss aus 5.1.6Ein Algorithmus III Problem: Negatives Wurzelargument Bedingte Ausführung 5.bWenn c negativ ist gehe zu Schritt 1 Schleife

130 5.1.7Fragestellungen Wer gibt p und q ein ? Wie wird p und q eingegeben ? Werden p und q in endlicher Zeit eingegeben ? Sind p und q im richtigen Format ? Ist Variable a im richtigen Format ? Gibt es die Quadrat-Funktion ? Ist c positiv ? Ist Variable e im richtigen Format ? Sind die restlichen Variablen im richtigen Format Reicht die Genauigkeit der Darstellung ? Wo wird das Ergebnis ausgegeben ? Ist ausreichend Variablenkapazität für den Algorithmus vorhanden ? Läuft der Algorithmus schnell genug ?... 1.Lies die Zahlen p und q ein 2.Berechne die Zahl a = p/2 3.Berechne die Zahl b = a 2 4.Berechne die Zahl c = b-q 6.Berechne die Zahl d = c 7.Berechne die Zahl e = -a 8.Berechne die Zahl x 1 = e + d 1 9.Berechne die Zahl x 2 = e - d 10. Gib x 1 und x 2 als Ergebniss aus FHSymbol1 Welche offenen Fragen bestehen noch ?

131 5.1.8Ein weiterer Algorithmus

132 5.2Definition Der Begriff des Algorithmus ist zentral in der Informatik und soll in diesem Unterkapitel formal definiert werden Inhalt 1.Herkunft 2.Der Algorithmus 3.Beispiel: Algorithmenbeweis 4.Weitere Prinzipien 5.Algorithmen und Programme 6.Ausflug: Algorithmus und WinOSe

133 5.2.1Herkunft Muhammad ibn Musa abu Djafar al-Choresmi (ca n.Chr) arabischer Mathematiker, geboren in Choresmien (heute: Usbekistan) lebte und wirkte in Bagdad im Haus der Weisheit war beteiligt an der Übersetzung der Werke griechischer Mathematiker ins Arabische schrieb ein Kurzgefasstes Lehrbuch für die Berechnung durch Vergleich und Reduktion die lateinische Übersetzung dieses Buches (liber algorismi) kam durch Kreuzfahrer nach Europa verfasste auch ein Buch mit dem Titel Al-Mukhtasar fi Hisab al-Jahr va l- Muqabala Algebra Algorithmus

134 5.2.2Der Algorithmus Definition: Ein Algorithmus (algorithm) ist die Beschreibung eines Verfahrens, um aus gewissen Eingabegrößen bestimmte Ausgabegrößen zu berechnen. Dabei müssen folgende Bedingungen erfüllt sein Spezifikation Durchführbarkeit Korrektheit Verfahren ohne Verständnis des Problemes FHSymbol1 Erwarten Sie nie, dass ein Computer für Sie mitdenkt

135 5.2.2Der Algorithmus : Spezifikation Eingabespezifikation: Es muss genau spezifiziert sein, welche Eingabegrößen erforderlich sind und welchen Anforderungen diese Größen genügen müssen, damit das Verfahren funktioniert Ausgabespezifikation Es muss genau spezifiziert sein, welche Ausgabegrößen (Resultate) mit welchen Eigenschaften berechnet werden EINGABE Algorithmus

136 5.2.2Der Algorithmus : Durchführbarkeit Endliche Beschreibung das Verfahren muss in einem endlichen Text vollständig beschrieben sein Effektivität Jeder Schritt des Verfahrens muss effektiv (d.h. tatsächlich) mechanisch ausführbar sein Bem.: Effektivität ist nicht zu verwechseln mit Effizienz (Wirtschaftlichkeit) Determiniertheit Der Verfahrensablauf ist zu jedem Zeitpunkt fest vorgeschrieben

137 5.2.2Der Algorithmus : Korrektheit partielle Korrektheit Jedes berechnete Ergebnis genügt der Ausgabespezifikation, sofern die Eingaben der Eingabespezifikation genügt haben Terminierung Der Algorithmus hält nach endlich vielen Schritten mit einem Ergebnis an, sofern die Eingaben der Eingabespezifikation genügt haben

138 5.2.2Der Algorithmus : Zusammenfassung Definition Ein Algorithmus (algorithm) ist die Beschreibung eines Verfahrens, um aus gewissen Eingabegrößen bestimmte Ausgabegrößen zu berechnen, der gekennzeichnet ist durch: Spezifikation der Ein- und Ausgabegrößen eine endliche Beschreibung des Verfahrens effektive Ausführbarkeit der Verfahrensschritte Determiniertheit der Verfahrensschritte partielle Korrektheit Terminiertheit Bemerkung: Algorithmen, die eine oder mehrere dieser Eigenschaften nicht besitzen werden dann als Nicht- Algorithmen bezeichnet. Bsp: Nicht-Deterministische Algorithmen.

139 5.2.3Beispiel: Algorithmenbeweis In gängiger mathematischer Notation könnte ein Verfahren zur Berechnung der Modulus-Funktion a mod b wie folgt aussehen: afalls a < b mod(a,b)= mod(a-b,b)falls a b Um festzustellen, ob diese Berechnungsvorschrift einen Algorithmus im Sinne der Definition darstellt, müssen folgende Punkte beachten werden: Spezifikation Eingabe Ausgabe Durchführbarkeit Endliche Beschreibung Effektivität Determiniertheit Korrektheit Partielle Korrektheit Terminierung

140 5.2.3Beispiel: Spezifikation Lassen sich die möglichen Ein- und Ausgabewerte genau spezifizieren ?

141 5.2.3Beispiel: Durchführbarkeit Ist der Algorithmus durchführbar ?

142 5.2.3Beispiel: Korrektheit (partielle) Ist der Algorithmus korrekt (im Sinne der Spezifikation)

143 5.2.3Beispiel: Korrektheit (Terminierung) Terminiert der Algorithmus ? Bemerkung: Es gibt kein Verfahren, das zu einem beliebigen Algorithmus angibt, ob er terminiert oder nicht (Halte-Problem)

144 5.2.3Weitere Prinzipien Neben den in der Definition angegebenen Eigenschaften gibt es weitere wichtige Prinzipien, die bei der Erstellung eines Algorithmuses zu beachten sind: Effizienz Der Algorithmus soll möglichst wenig Aufwand verursachen –Das Ergebnis mit möglichst wenig Rechenschritten (oder mit möglichst wenig Speicherbedarf) erzielen Korrektheit beweisbar? Ein nicht-korrekter Algorithmus ist nach unserer Definition kein Algorithmus! Trotzdem sind nicht-korrekte Verfahren eher die Regel als die Ausnahme

145 5.2.4Algorithmen und Programme: Der Weg gegeben: das Problem durch Spezifizieren wird das Problem formal beschrieben Durch Algorithmierung (Algorithmenentwurf) wird ein Algorithmus erzeugt durch Verifizieren kann der Algorithmus auf Übereinstimmung mit der Spezifikation überprüft werden Durch Programmieren wird aus den Algorithmus ein Programm erzeugt durch Testen kann das Programm auf Übereinstimmung mit der Spezifikation und dem Algorithmus überprüft werden. ProblemAlgorithmusProgramm SpezifizierenVerifizierenTesten AlgorithmierungProgrammierung

146 5.2.4 Algorithmen und Programme: Beziehungen Programmieren setzt Algorithmenentwicklung voraus Kein Programm ohne Algorithmus ! Jedes Programm repräsentiert einen bestimmten Algorithmus. Ein Algorithmus kann durch viele Programme repräsentiert werden. AlgorithmusProgramm Programmierung Problem Algorithmierung Problem Algorithmus1 Algorithmus2 Programm21 Programm22...

147 5.2.5Ausflug: Algorithmus und WinOSe Klassische Programmierung Windows Programmierung Algorithmus OS Eventqueue

148 5.3Strukturelemente Um die Dynamik - also die Abfolge von Aktionen - eines Algorithmu- ses zu beschreiben, benötigt man formale Beschreibungsmittel, sowie eine Festlegung, wie diese Beschreibungmittel zu notieren und zu interpretieren sind. Dieses Unterkapitel stellt die formalen Beschreibungsmittel für Algorithmen vor. Diese Beschreibungsmittel sind dabei gleichzeitig Strukturierungselemente für Algorithmen, denn sie definieren die Struktur von Algorithmen. Inhalt: 1.Die Elemente 2.Folge 3.Auswahl 4.Wiederholung

149 5.3.1Die Elemente: Aus dem Beispiel Zuweisungen Berechnungen Mathematische Grundoperationen komplexe Funktionen... Bedingte Ausführungen Schleife... Variable Texte Zahlen... Konstanten (Literale) Texte Zahlen... EINGABE AUSGABE

150 5.3.1Die Elemente: Notation Für die Beschreibung von Algorithmen gibt es viele Möglichkeiten Alltagssprache Konkrete Programmiersprache Dazwischen gibt es eine Vielzahl von Notationen, die den Übergang zwischen Problembeschreibung und Programm erleichtern sollen Eine mögliche - eindimensionale - Notation ist Pseudocode: // Dies ist eine Zuweisung x = 42; Kommentare werden (hier) mit vorangestellten Slashes // gekennzeichnet Aktionen werden (hier) mit Semikolon ; getrennt Visualisierung durch graphische - zweidimensionale -Notation Flussdiagramme Struktogramme (=Nasi-Schneidermann-Diagramme) Aktion

151 5.3.1Die Elemente: atomare Elemente Anweisungen sind die atomaren Elemente eines Algorithmus, die Elemente also, aus denen ein Algorithmus aufgebaut ist. Es gibt (zunächst) drei Arten dieser atomaren Elemente Zuweisung: Pseudocode X = y; Auf der linken Seite der Zuweisung steht eine Variable auf der rechten Seite der Zuweisung steht entweder eine Variable, ein Literal oder eine Berechnung aus Varaibelen und Literalen Eingabe Pseudocode: x ; Als Eingabegerät kann ein geeignetes physikalisches Gerät (Tastatur, Schnittstelle,...) angegeben werden. Ausgabe Pseudocode: x >> ; Als Ausgabegerät kann ein geeignetes physikalisches Gerät (Bildschirm, Drucker, Schnittstelle,...) angegeben werden Ein- und Ausgabe können auch als Zuweisung verstanden werden.

152 5.3.1Die Elemente: Kontrollelemente Die atomaren Elemente eines Algorithmuses können durch drei einfache Strukturierungsmethoden, den Kontrollelementen, zueinander in Beziehung gesetzt werden: 1.Folge (Sequenz) 2.Auswahl (Selektion, Fallunterscheidung) 3. Wiederholung (Iteration, Schleife) Die Kontrollelemente bestimmen die Reihenfolge von Aktionen in Algorithmen Eine Aktion (A i ) - auch Verarbeitung genannt - ist ein atomares Element oder eine durch die Strukturmethoden zusammengefasste Menge mehrerer Aktionen

153 5.3.2Folge Folgen bestimmen die lineare Reihenfolge von Aktionen in Algorithmen: FlussdiagrammStruktogrammPseudocode: A1A1 A2A2 AnAn... A1A1 A2A2 AnAn... { A 1 ; A 2 ;... A n ; }

154 5.3.3Auswahl : bedingte Verarbeitung Eine Aktion wird, in Abhängigkeit einer boolschen Bedingung ausgeführt oder nicht auch einarmiges if genannt. FlussdiagrammStruktogrammPseudocode: Beispiel: if (x<0) then x = -x; A1A1 B A1A1 if B then A 1 ; B f w fw

155 A2A Auswahl : einfache Alternative In Abhängigkeit einer boolschen Bedingung wird entweder eine Aktion oder eine andere Aktion ausgeführt auch zweiarmiges if genannt. FlussdiagrammStruktogrammPseudocode Beispiel: if (x<0) then x:=-x else x=0; A1A1 B A1A1 if B then A 1 else A 2 ; B f w fw A2A2

156 5.3.3Auswahl : mehrfache Alternative In Abhängigkeit einer Bedingung (mit mehreren möglichen Werten w 1, w 2,..., w n ) wird eine Aktion aus einer Menge möglicher Aktionen ausgewählt und ausgeführt FlussdiagrammStruktogrammPseudocode Beispiel: switch x: { case 0: x = x/2; case 1: x = x+1; } Oft auch mit else-Alternative (statt w n ) A1A1 B switch B: { case w 1 : A 1 ; case w 2 : A 2 ;... case w n : A n ; } B w1w1 w1w1 A2A2 AnAn A1A1 A2A2 AnAn wnwn w2w2 wnwn

157 5.3.4Schleife: mit vorausgehender Prüfung Solange eine boolsche Bedingung erfüllt ist, wird eine Aktion ausgeführt. Die Bedingung wird vor der ersten Ausführung der Aktion geprüft heißt auch: abweisende Schleife (While-Schleife) FlussdiagrammStruktogrammPseudocode Beispiel: while x < 100 { x = x + 1; } A1A1 A1A1 while B { A 1 } B f w B

158 5.3.4Schleife: mit nachfolgender Prüfung Solange eine boolsche Bedingung erfüllt ist, wird eine Aktion ausgeführt. Die Bedingung wird (erst) nach der ersten Ausführung der Aktion geprüft heißt auch: Do-While-Schleife Manchmal auch als Variante Repeat-Schleife - z.B. in Pascal - aber: Die repeat-Schleife wird solange ausgeführt bis eine boolsche Bedingung erfüllt ist. FlussdiagrammStruktogrammPseudocode Beispiel: do { x = x + 1; } while x <= 100 A1A1 A1A1 do { A 1 } while B B f w B

159 5.3.4Schleife: Beispiel (abweisende Schleife) Untersuche ob eine gegebene natürliche Zahl Primzahl ist. p > 2 ist Primzahl, falls sie durch kein t mit 12) and (p mod 2 != 0)) then { t = 3; // initialize t while ((t*t=p oder p mod t == 0 if (t*t>p) then p ist Primzahl >> Bildschirm; else p ist keine Primzahl >> Bildschirm; } else { p > Bildschirm; } // Primzahl ?

160 5.3.4Schleife: Beispiel (Vergleich while do-while) Sind diese Schleifen im Ergebnis identisch ? while x < 100do {{ x = x + 1; x = x + 1; }} while x < 100 und jetzt ? if (x < 100) then { do { x = x + 1; } while x < 100 } Welche Lösung ist eleganter ? aber: oft wird eine erstmalige Aktion benötigt, um ein Datum überhaupt überprüfen zu können.

161 5.3.4Schleife: Beispiel (Vergleich do-while while) Suchen eines Zeichens do { x << Datei; } while ( x != SearchChar && x != eof )... das Ganze als while-Schleife ? while ( x != SearchChar && x != eof ) { x << Datei; } Nochn Versuch: x << Datei; while ( x != SearchChar && x != eof ) { x << Datei; }

162 5.3.4Schleife: Beispiel (Schleife mit Zählern) Sehr häufig werden Schleifen verwendet, deren Bedingung abhängig von Zählerwerten sind. Die Zählerwerte werden vor Eintritt in die Schleife initialisiert Die Bedingung prüft den Zählerwert Im Schleifenkörper wird der Zähler erhöht (increase) oder erniedrigt (decrease) Vorsicht mit: dem Zählertyp, dem Additionswert, der Bedingung Algorithmus: // --- Initialisierung s = 0; i = 1; // Initialisierung des Schleifenzählers // --- Schleife (Berechnet Summe 1..n) while ( i <= n ) { s = s + i; i = i + 1; // Erhöhung des Schleifenzählers (oft um 1) }

163 5.2.4Schleife: Die For-Schleife Da Schleifen mit Zähler sehr häufig auftreten, stellen viele Programmiersprachen ein eigenes sprachliches Mittel dafür zur Verfügung: Die For Schleife Pseudocode:Beispiel: for var=start_value to end_valuefor i=1 to 10 {{ A; x = x + i; }} Der Zähler ( var ) wird pro Schleifendurchlauf implizit um 1 erhöht (Bei manchen Sprachen - z.B. Basic, C, C++ - kann man dies ändern) Dieser Code ist äquivalent mit folgender Schleife: i = start_value while i <= end_value { A; i = i+1; }

164 5.3.4Schleife: Beispiel (Endlosschleife) Manchmal macht es Sinn, Schleifen endlos laufen zu lassen: z.B. bei der zyklischen Abprüfung von Systemzuständen (Windows Event- Queue) manchmal macht das keinen Sinn - passiert aber trotzdem ;-) FlussdiagrammStruktogrammPseudocode Beispiel: while true { Druckerpapier ist teuer >> Drucker; } A1A1 A1A1 while true { A 1 } B

165 5.4Strukturierung Mit Hilfe atomarer Elemente und der Kontrollelemente lassen sich Algorithmen strukturieren. In diesem Kapitel sind einige Begriffe zur Strukturierung erläutert. Insbesondere wird ein weiteres - viertes - Kontrollelement vorgestellt (und auch gleich wieder verworfen) Inhalt 1.Control Flow 2.Strukturierung durch Sprung 3.Strukturiert-iterative Beschreibungsform 4.Strukturierungstypen

166 5.4.1Control Flow Mithilfe der Kontrollelemente können die atomaren Elemente (Anweisungen) strukturiert werden Die Anordnung der Anweisungen (als atomare Elemente) eines Algorithmus, die bestimmt, in welcher Reihenfolge Dinge geschehen, heißt control flow (Steuerungsverlauf, Kontrollfluss) des Algorithmus genannt Manchmal wird auch der Programmablauf oder Kontrollfaden (thread of control, thread), also die tatsächlich abgespulten Schritte und Anweisungen so bezeichnet

167 5.4.2Strukturierung durch Sprung Bei der Vorstellung der Kontrollelemente wurde (aus hinterhältig, didaktischen) Gründen auf ein viertes Element verzichtet: Der Sprung (Goto-Anweisung) Die Konstruktion fahre fort mit Schritt x (goto x) stellt einen solchen Sprung (jump) im Steuerungsverlauf dar Zur Anwendung von goto werden Schritte mit einer Marke (Label) versehen, um das Ziel des Sprunges zu kennzeichnen Dies ist die elementarste Form, eine Wiederholung oder sonstige Verzweigung im Ablauf auszudrücken Dadurch erhalten wir die elementar-iterative Beschreibungsform von Algorithmen, die die Strukturierung mit ein-/mehrfacher Auswahl und Schleifen funktional abdeckt. Beispiel: while x 100 goto 2 x = x+1 x = x+1; } goto 1; 2:...

168 5.4.2Strukturierung durch Sprung Anwendung von Sprüngen ist sehr gefährlich! Sprünge strukturieren komplexe Programm nicht ausreichend - der Steuerungsverlauf kann verworren und unübersichtlich sein Um den Steuerungsverlauf auch bei komplexen Algorithmen übersichtlich zu halten, schränkt man die Sprünge ein: Schleifen der Flussdiagramme sind höchstens ineinander geschachtelt Schleifen überkreuzen sich nicht! Bei gut strukturierten Algorithmen würde man z. B. nur wieder eine geschlossene Schleife oder einen (vorzeitigen) Sprung bedingt durch die Behandlung des Trivialfalls erlauben Wir sprechen in diesem Fall von strukturierten Sprüngen im Gegensatz zu freien Sprüngen, die prinzipiell beliebige Ziele haben können

169 5.4.3Strukturiert-iterative Beschreibungsform Sprünge können die bestimmte höhere Strukturierungsarten funktional abzubilden. Hier gilt auch der Umkehrschluss In der strukturiert-iterativen Beschreibungsform kommen Sprünge nur noch implizit bei der Ausführung höherer Iterationsstrukturen vor Dieses sind Fallunterscheidungen (Auswahl) wie if-then-else oder insbesondere Schleifenkonstrukte Diese bewirken, dass der Programmfluss In einer Auswahl zu genau einer Auswahl geht. in einer Schleife von einer Prüfung zu den Aktionen des Schleifenkörpers und wieder zurück zur Prüfung geht. Viele höhere Programmiersprachen (Pascal, C, C++) erlauben jedoch die Verwendung von Sprüngen Aus Optimierungsgründen (Nähe zur Maschinensprache) Aus Strukturierungsgründen)

170 5.4.4Strukturierungstypen Beispiel: Schemen einiger Kontrollflüsse Strukturiert-iterativElementar-iterativSpaghetti-Code

171 5.4.5Strukturierung durch Blockung Idee: Eine Zusammenfassung von Aktionen bekommt einen Namen und kann durch das Nennen des Namens (Aufruf) aktiviert werden. In einen Block können Daten formal hinein und herausgelangen. Ein Block kann eigenen Daten besitzen. Vorteile: Gliederung des Algorithmus durch hierarchische Dekomposition (Divide et impera: Teile und herrsche) Wiederverwendbarkeit durch mehrfachen Aufruf statt durch mehrfaches notieren. universeller ( Anzahl muss nicht bekannt sein) fehlerunanfälliger Kapselung unwichtiger Details (information Hiding) Vorteile bei der Organisation von Programmiertätigkeit durch Verteilbarkeit der Aufgaben.

172 5.5Zusammenfassung des Kapitels Ein Beispiel Drei Algorithmen im Vergleich zur Lösung einer quadratischen Gleichung Definition des Algorithmenbegriffes Definition und dessen Anwendung im Beispiel. Weitere Prinzipien und der Zusammenhang von Algorithmen und Programmen. Strukturelemente: Die atomaren Elemente und die Konstruktionselemente Folge, Auswahl, Wiederholung Strukturierung Der Begriff des Control Flows, das Problem der Strukturierung mit Sprung und Blockung

173 Kapitel 6Algorithmentheorie Im vorangegangenen Kapitel wurde beschrieben, mit welchen Elementen Algorithmen aufgebaut werden, und was man dabei zu beachten hat. Dieses Kapitel geht nun darauf ein, ob ein Problem überhaupt algorithmisch fassbar ist, ob eine gefundener Algorithmus auch das tut was er soll und wieviel Zeit bzw. Platz er dafür benötigt. Inhalt 1.Berechenbarkeit 2.Korrektheit 3.Komplexität Teile dieses Kapitels sind aus: R.Manthey: Vorlesung Informatik 1, Uni Bonn, 2001

174 6.1Berechenbarkeit Wir haben den Begriff und die Elemente eines Algorithmus vorgestellt und Algorithmen zur Lösung von Problemen verwendet. In diesem Unterkapitel werden nun einige Fragen zur Anwendbar- und Sinnhaftigkeit von Algorithmen gestellt und beantwortet. Inhalt: 1.Einige Fragen 2.Das Entscheidungsproblem 3.Die Turing-Maschine 4.Berechenbarkeit 5.Rekursive Funktionen 6.Churchsche These H. Ernst:Grundlagen und Konzepte der Informatik,Vieweg-Verlag,2000

175 6.1.1Einige Fragen 1.Kann jedes Problem durch einen Algorithmus beschrieben werden, d.h. prinzipiell - bei genügender Sorgfalt - gelöst werden ? 2.Kann jeder Algorithmus in ein Programm übertragen werden ? Welchen Anforderungen muss eine Programmiersprache genügen, damit jeder Algorithmus damit formuliert werden kann ? 3.Ist ein Computer grundsätzlich in der Lage, einen bekannten, als Programm formulierten Algorithmus auszuführen ? 4.Ist ein solcher Computer formalisierbar ? Wie sieht ein solches abstraktes Model aus ? Gibt es genau ein Model oder mehrere ? Sind diese Modelle äquivalent ? Gibt es andere Modelle oder Beschreibungsformen, die diesem formalisierten Computermodell entsprechen ? Frage 1 und Frage 4 sind wesentlich für den Begriff der Berechenbarkeit, Frage 2 wird im anschließenden Kapitel behandelt, Frage 4 ist Gegenstand der Vorlesung Compilerbau

176 6.1.2Das Entscheidungsproblem Bis weit ins 20ste Jahrhundert war die Mehrzahl der Mathematiker (insb. David Hilbert: ) der Ansicht, dass man von jeder Aussage algorithmisch beweisen könne, ob sie wahr oder falsch sein. Anders ausgedrückt: Es sei entscheidbar, ob ein Problem lösbar oder unlösbar ist. Die Frage, ob dies entscheibar ist oder nicht ging als Entscheidungs- problem in die Geschichte der Mathematik (und Informatik) ein. Kurt Gödel wies in seinem Unvollständigkeits-Theorem 1931 nach, dass alle widerspruchsfreien axiomatischen Formulierungen der Zahlentheorie unentscheidbare Aussagen enthalten. damit wurde insb. belegt, dass streng algorithmisch arbeitende Computer prinzipiell nicht jedes Problem lösen können. Auf fast schon philosophischer Ebene wurde damit auch belegt, dass Wahrheit eine andere Qualität als Beweisbarkeit besitzt. nicht alle wahren Aussagen können auch bewiesen werden.

177 6.1.3Die Turing-Maschine: Definition Als abstraktes Modell eines Computers beschrieb Alan Turing ( ) also noch vor der Erfindung des Digitalrechners - eine nach ihm benannte abstrakte Maschine Formal kann eine Turing-Maschine wie folgt beschrieben werden: Alphabet: A = {a 0,..., a n }, der Zeichenvorrat der Turing-Maschine, wobei a 0 das Leerzeichen ("blank") darstellt (Oft: a 1 =0, a 2 =1) Bandinschrift: B: Z A eine Zuordnung, die jeder Stelle des rechtsseitig unendlichen Bandes ein Zeichen zuordnet. Dabei wird festgesetzt, dass B(k) = a 0 für alle bis auf endlich viele. Kopfposition: k Z Zustände: eine endliche Menge von Maschinenzuständen.Q = {q 0,..., q m } Darunter sind q 0, der Anfangszustand und H Q, die Menge der Haltezustände, ausgezeichnet. Statt Haltzustände wird oft auch eine Halteaktion angegeben Turing-Tabelle: eine Übergangsrelation: d : A Q A Q {r, l, n, h}, das jedem (gelesenen) Zeichen in Abhängigkeit eines Zustandes ein neues Zeichen, einen Folgezustand und eine Aktion (r,l,n,h} zuordnet

178 6.1.3Die Turing-Maschine: Programm Die Aktionen: r (right): das Verschieben des Kopfes nach rechts l (left): das Verschieben des Kopfes nach links optional n (none): keine Bewegung des Kopfes optional h (halt): Impliziter Übergang in einen Endzustand a1a1 a2a2 a3a3 a4a4...a6a6 die Maschine im Zustand das unter dem Kopf gelesene Zeichen die Aktion der neue Zustand q q r oder l akak das neue Zeichen fallsso ist alal

179 6.1.3Die Turing-Maschine: Beispiel Das Busy beaver-Problem: Wieviele 1-en kann ein terminierendes Touring-Programm auf einem leeren Band mit einer vorgegebenen Anzahl von Zuständen maximal erzeugen. In dieser Notation wird statt eines Übergangs in den Haltezustand (z.B. q5) die Aktion halt ausgeführt. Der Rekord für |Z|=5 liegt bei en (J.Buntrock, H.Marxen, 1989) Es wurde gezeigt, dass es möglich ist, mehr als en zu generieren - allerdings nicht wie. 11 Schritte, 6 Einsen 96 Schritte, 13 Einsen

180 6.1.4Definition: Berechenbarkeit Ein Problem ist genau dann algorithmisch lösbar, wenn es durch eine Turing-Maschine darstellbar ist. Eine Funktion f(x) heißt berechenbar, genau dann wenn es einen Algorithmus (eine Turing-Maschine) gibt, der bei gegebenem x das Ergebnis f(x) liefert Ein Computer ist äquivalent zu einer universellen Turing-Maschine. d.h. ein Computer ist äquivalent zu einer Turing-Maschine, die jede andere Turing-Maschine simulieren kann. Zur Simulation einer beliebigen Turing-Maschine muss auf dem Eingabeband eine Beschreibung der zu simulierenden Maschine codiert werden und außerdem deren Eingabeband gespeichert sein. Die Menge verschiedener universeller Turing-Maschinen ist abzählbar - denn das Band ist binär codiert, jede Kombination lässt sich auf eine natürliche Zahl abbilden. Die Menge aller Funktionen f(x) ist überabzählbar (z.B. Funktionen die auf eine reelle Zahl abbilden) Es gibt (unendlich viele) nicht berechenbare Funktionen

181 6.1.5Beispiel: Das Halteproblem Nicht berechenbare Probleme sind also keine Probleme, die noch nicht gelöst sind, sondern solche, für die es keine Lösung gibt. Das wohl bekannteste dieser Probleme ist das Halteproblem: Es gibt kein Programm, das für ein beliebiges gegebenes Programm, und für beliebige gegebene Eingabeparameter entscheidet, ob das gegebene Programm anhält. Beweis:Geg. Programm P mit Quelltext(P) als Eingabe Annahme:Es gibt ein solches Programm (Test) Test(P) janein P stoppt mit P yn Test1(P) stoppe Test = ja yn Test(P) Test(Test1)=ja Test1(Test1) läuft endlos Test(Test1)=nein Widerspruch !

182 6.1.6Rekursive Funktionen Es gibt innerhalb der mathematischen Funktionen zwei Unterklassen: primitiv-rekursive Funktionen: jede primitiv-rekursive Funktion ist berechenbar es gibt berechenbare Funktionen, die nicht primitiv-rekursiv sind primitiv-rekursive Funktionen lassen sich genau mit Algorithmen ohne Schleifenkonstrukte (aber mit Blockung) darstellen. -rekursive Funktionen jede -rekursive Funktion ist berechenbar es gibt berechenbare Funktionen, die nicht -rekursiv sind -rekursive Funktionen lassen sich mit Algorithmen mit Schleifenkonstrukte (und Blockung) darstellen. Es gilt folgende Beziehung innerhalb von Funktionen: -rekursive Funktionen primitiv-rekursive Funktionen berechenbare Funktionen

183 6.1.6Churchsche These Wir haben bislang verschiedene Äquivalenzen gefunden: Primitiv und -rekursive Funktionen sind Teilmengen von berechenbaren Funktionen. Eine Funktion ist genau dann berechenbar, wenn es eine Turing-Maschine zu deren Berechnung gibt,. Die Darstellung mit Hilfe einer Turing-Maschine ist äquivalent mit der einer universellen Turingmaschinm, die wiederum eine Abstraktion eines Computers darstellt Dies legt die Formulierung einer der Churchschen These nahe: Alle im intuitiven Sinn vernünftigen Formalisierungen von Problemlösungen sind äquivalent Wenn ein Problem nicht durch eine Turing-Maschine gelöst werden kann, so ist es algorithmisch überhaupt nicht lösbar Da Begriffe wie intuitiv und vernünftig nicht definiert sind, ist die Churchsche These nicht beweisbar.

184 6.2Korrektheit Wir haben diskutiert, ob man jede (mathematische) Funktion berechnen kann und haben dabei die Äquivalenz eines Algorithmus mit berechenbaren Funktionen gesehen. In diesem Unterkapitel geht es nicht mehr nur darum, ob eine Funktion berechenbar ist, bzw. ein Algorithmus für deren Berechnung existiert, sondern ob der gegebene Algorithmus tatsächlich das macht, was er machen soll Inhalt 1.Ansatz 2.Definition 3.Logik zur Verifikation (C.A.R. Hoare) 4.Regeln 5.Terminierung 6.Beispiele 7.Beweis des Euklidschen Algorithmus 8.Kritische Anmerkungen U.Kastens:Modellierung, Vorlesung WS00/01, Uni Paderborn

185 6.2.1Ansatz Wir haben zu Beginn des Kapitels den Begriff der Korrektheit definiert: partielle Korrektheit: Jedes berechnete Ergebnis genügt der Ausgabespezifikation, sofern die Eingaben der Eingabespezifikation genügt haben Terminierung: Der Algorithmus hält nach endlich vielen Schritten mit einem Ergebnis an, sofern die Eingaben der Eingabespezifikation genügt haben Zum Beweis der Korrektheit gehen wir also von der Eingabespezifi- kation aus und versuchen, mit den Aktionen (Statements) des Algorithmus die Ausgabespezifikation abzuleiten. Die Eingabespezifikation wird dabei als Vorbedingung P(V) oder {P} und die Ausgabespezifikation Q(V) oder {Q} als Nachbedingung mathematisch formuliert Über die Aktionen des Algorithmus wird die Vorbedingung über Zusicherungen Z i (V) zur Nachbedingung abgeleitet Also: P(V) Z 1 (V)... Z n (V) Q(V)

186 6.2.2Definition: Korrektheit Beispiel: Lösung der quadratischen Gleichung qugl (IN: p,q: real, OUT x1,x2:real) // Vorbedingung: (p*p)/4 > q // Nachbedingung: x1 = (-b + sqr(p*p/4-q)) / (2*a) // x2 = (-b - sqr(p*p/4-q)) / (2*a) { w : real; w = sqr(p*p/4 - q); x1 = -p/2 + w; x2 = -p/2 - w: } Ein Algorithmus heißt korrekt bezüglich seiner Spezifikation, wenn für jeden Aufruf, der die Vorbedingung erfüllt, nach dem Aufruf des Algorithmus die Nachbedingung erfüllt ist (und er terminiert) Achtung: Die Vorbedingung ist vom Aufrufer zu erfüllen, die Nachbedingung ist durch den Algorithmus (bzw. den Implementierer) zu erfüllen.

187 6.2.3C.A.R. Hoare: Logik zur Verifikation C.A.R. Hoare formulierte 1969 ein Kalkül zum Beweis von Aussagen über Algorithmen und Programme damit sind - im Gegensatz zum Testes - statische Aussagen über Zustände des Algorithmus ( Werte der Variablen) möglich. Diese Aussagen gelten für alle Ausführungen des Algorithmus Durch logisch Schlüsse über die Elemente eines Algorithmus kann gezeigt werden, dass an einer bestimmten Stelle im Algorithmus eine bestimmte Aussage gilt. eine Aussage an jeder Stelle eines Teils des Algorithmus invariant gilt Schleifen terminieren. Also: ein Algorithmus aus jeder zulässigen Eingabe die geforderte Ausgabe berechnet

188 6.2.3C.A.R. Hoare: Beispiel min (IN: a,b: integer, OUT min:integer) // Vorbedingung: a,b > 0 (nicht unbedingt notwendig) // Nachbedingung: (min=a min=b) (min a) (min b) { if a

189 6.2.3C.A.R. Hoare: Vorgehen Aussagen über den Algorithmenzustand, über Werte von Variablen werden in den Algorithmus eingefügt: { P } A1 { Q } A2 { R } bedeutet: Q gilt immer zwischen der Ausführung von A1 und der Ausführung von A2 Beispiel: { i + 1 0} i := i + 1; { i 0 } a [i] := k; {...} Zur Verifikation eines Algorithmus muss für jede Anweisung S ein Nachweis geführt werden: { Vorbedingung P } S { Nachbedingung Q } nachweisen: Wenn vor der Ausführung des Schrittes S die P gilt, dann gilt Q nach der Ausführung von S, falls S terminiert. Beispiel: { i + 1 0} i := i + 1; {i 0} mit Zuweisungsregel nachweisen Die Aussagen werden entsprechend der Struktur von S verknüpft. Für jede Anweisungsform wird eine spezielle Schlussregel angewandt. Die Spezifikation liefert Vorbedingung und Nachbedingung des gesamten Algorithmus:

190 6.2.4Regel: Zuweisung Die Zuweisung x = expr wertet den Ausdruck expr aus und weist das Ergebnis der Variablen x zu. Es gilt dann: {P[x/expr]} x := expr {P} oder {P(x)} x = f(x) {P(f --1 (x))} P[x/expr] steht für die Substitution von x durch expr in P Die Nachbedingung P erhält man dadurch, dass man jedes Vorkommen von expr in der Vorbedingung durch x (die linke Seite der Zuweisung) ersetzt Wenn man also zeigen will, dass nach der Zuweisung eine Aussage P für x gilt, muss man zeigen, dass vor der Zuweisung dieselbe Aussage P für expr gilt. Beispiele: {a>0} x = a {x>0} {i+1>0} i=Succ(i) {i>0}: f(x)=Succ, f -1 (x)=Pred(x), {P(Pred(x+1)}=(i+1-1>0) {i+1>0} i = i+1 {i>0}

191 6.2.4Regel: Zuweisung - Beispiele {P[x/expr]} x := expr {P} 1.alle Aussagen der Vorbed. für expr, gelten für x in der Nachbedingung 2.Aussagen der Vorb. über x gelten in der Nachbedingung nicht mehr 3.Die Nachbedingung P erhält man dadurch, dass man jedes Vorkommen von expr in der Vorbedingung durch x ersetzt ggf. ist die Vorbedingung so umzuformen, dass expr explizit Teil der Vorbedingung ist (auf der linken Seite einer Aussage) Alles was vorher für die rechte Seite der Zuweisung galt, gilt hinterher für die linke - Alles was vorher für die linke galt, gilt nicht mehr - Alle anderen Aussagen gelten weiterhin 1.{y=5}x=y{x=5} 2.{a>0 x>7}x=a{x>0 x>7}falsch wg. Punkt 2 3.{a>0 z>0}x=a{x>0 z>0}z>0 ist nicht betroffen 4.{i+1>0}i=i+1{i>0} 5.{i 0} {i+1>0}i=i+1{i>0}passend umformen 6.{i=2} {i+1=3}i=i+1{i=3}passend umformen 7.{z=5}x=1{z=5 x=1}z nicht betroffen, x neu

192 6.2.4Regel: Konsequenz Abschwächung der Nachbedingung wenn giltunddann gilt auch {P} S {R} {R} {Q}{P} S {Q} Beispiel {a+b>0} S {x>0}{x>0} {X 0} {a+b>0} S {X 0} Verschärfung der Vorbedingung wenn giltunddann gilt auch {P} {R] {R} S {Q}{P} S {Q} Beispiel (Notation: Im Algorithmus können Implikationen in Ausführungsrichtung eingefügt werden) {a+b>0} x = a+b; {x>0} {2*x 0} y = 2 * x {y 0}

193 6.2.4Regel: Sequenz Folgendes Schema lässt sich auf eine Sequenz von Aktionen (Statements) anwenden: wenn giltunddann gilt auch {P} S {R} {R} S 2 {Q} {P} S 1,S 2 {Q} Beispiel: {x>0 y>0} a = x; {a>0 y>0} {a>0 y>0} {a>0 y>0} b = y; {a>0 b>0} Bei trivialen Ableitungen können die Zwischenschritte (Zusicherungen, Aussagen) demnach auch weggelassen werden: {x>0 y>0} a = x; b = y; {a>0 b>0}

194 6.2.4Regel: Bedingte Anweisung Schema: wenn giltunddann gilt auch {P B} S {Q} {P B} {Q} {P} if B then S {Q} Um die Nachbedingung einer bedingten Anweisung zu beweisen, muss 1.aus der Vorbedingung und der Anweisungs-Bedingung über die Anweisung die Nachbedingung nachgewiesen werden 2.aus der Vorbedingung und der Negation der Anweisung die Nachbedingung direkt folgen Beispiel: Gegeben: if a<0 then a = -a Beweise, dass der Algorithmus a 0 für alle a liefert: 1.{P a 0} a=-a {P a>0} {P a 0} 2.{P ( a<0)} {P a 0} dann gilt auch {P} if a<0 then a=-a {P a 0}

195 6.2.4Regel: Bedingte Anweisung - Notation Beispiel: Gegeben: if a<0 then a = -a Beweise, dass der Algorithmus a 0 für alle a liefert: 1.{P a 0} a=-a {P a>0} {P a 0} 2.{P ( a<0)} {P a 0} dann gilt auch {P} if a<0 then a=-a {P a 0} Notation: {P} if a 0} a = -a {P a>0} {P a 0} // leere Alternative: {P (a<0)} {P a 0} {P a 0}

196 6.2.4Regel: Einfache Alternative Schema: wenn giltunddann gilt auch {P B} S 1 {Q} {P B} S s {Q} {P} if B then S 1 else S 2 {Q} Aus der gemeinsamen Vorbedingung P muss für beide Alternativen dieselbe Nachbedingung Q nachweisbar sein Beispiel: Gegeben: a>0, b>0, a b und ein Algorithmus (s.u) Beweise, dass nach den Operationen immer noch gilt: a>o, b>0 {a>0 b>0 a b} if a>b then {a>0 b>0 a b a>b} {b>0 a-b>0} a = a-b; {b>0 a>0} else {a>0 b>0 a b a b} {a>0 b-a>0} b = b-a; {a>0 b>0} {a>0 b>0}

197 6.2.4Regel: Schleife Schema: wenn giltdann gilt auch {P I B} S {I} {I} while B { S } {I B Q}// I = Schleifeninvariante Schleifeninvarianten sind Zusicherungen in Schleifen, die beim Durchlaufen des Schleifenkörpers erhalten bleiben. Es gelte PZusicherung über Variable vor Schleifeneintritt QZusicherung über Variable nach Schleifenende ISchleifeninvariante BWiederholbedingung der Schleife SStatements (Aktionen) im Schleifenkörper Die Nachbedingung einer Schleife ist über die Invariante nachgewiesen, wenn gilt: 1.P I die Invariante muss vor Schleifeneintritt wahr sein 2.(I B) Idie Invariante darf in Schleife nicht verändert werden 3.(I B) Qdie Nachbedingung muss sich nach Verlassen der Schleife aus der Invariante nachweisen lassen

198 6.2.4Regel: Schleife - Schema Das Schema der Gültigkeit von Aussagen sei anhand des Flussdiagramms für Schleifen verdeutlicht: B ? S P I I B I f w Q(V) Um Q(V) zu beweisen, muss man I(V) so wählen, dass Q(V) aus I(V) B(V) ableitbar ist Hier muss man beweisen, dass sich I in S aus I B ableiten lässt I muss aus P ableitbar sein

199 6.2.4Regel: Schleife - Beispiel Algorithmus zum Potenzieren // Vorbedingung: b 0 (positive Exponenten) // Nachbedingung: z = a b x=a, y=b, z=1; { x=a, y=b, z=1; y 0} {INV: z * x y = a b y 0} while y>0 { { INV y>0 z*x (y-1)+1 =a b (y-1)+1 > 0 } y = y-1; { z*x y +1 =a b y+1>0 } { ((z*x)/x)*x y +1 = a b y 0 } z = z*x; { z/x*x y +1 = a b y 0 } { z * x y = a b y 0 INV } } { INV B z * x y = a b y 0 y 0 z*x 0 = z = a b Q } B ? S P I I B I f w Q

200 6.2.4Regel: Schleife - Schleifeninvariante Das Finden der richtigen Invariante kann ganz schön kniffelig sein: Ein paar Tips: Wenn die Nachbedingung nicht gegeben ist, versuche die Semantik des Algorithmus zu verstehen, z.B. anhand von Beispielen. Betrachte die Anweisungen in der Schleife: Meist wird etwas vergrößert (z.B. die Variable der Abbruchbedingung), während etwas anderes verkleinert wird - oder umgekehrt. Kombiniere diese: z * x y Setze Ein- und Ausgabevariablen in Bezug zueinander z * x y = a b Verwende die Schleifenbedingung zum Einklemmen der Schleifenvariable. Beachte, dass aus INV und B(V) Q(V) ableitbar sein soll Das bedeutet, dass man die Invariante aus der Nachbedingung konstruieren kann, indem man die negierte Bedingung mit berücksichtigt z * x y = a b y=0 z*x 0 = z = a b Q

201 6.2.5Terminierung Die Terminierung einer Schleife muss separat nachgewiesen werden Beweis der Terminierung 1.Gib einen ganzzahligen Ausdruck E an über Variablen, die in der Schleife vorkommen und zeige, dass E bei jeder Iteration durch S verkleinert wird 2.Zeige, dass E nach unten begrenzt ist, z.B. dass 0 E eine Invariante der Schleife ist 3.Zeige, dass die Grenze auch erreicht wird. E kann auch monoton vergrößert und nach oben begrenzt sein Beweis der Nicht-Terminierung: Beweise, 1.dass R B eine Invarianz der Schleife ist (also R in die Schleife geht) und dass es eine Variablenbelegung gibt, so dass R B vor der Schleife gilt 2.dass R einen speziellen Zustand charakterisiert, in dem die Schleife nicht anhält Es gibt Schleifen, für die man nicht entscheiden kann, ob sie für jede Vorbedingung terminieren.

202 6.2.5Terminierung - Beispiele { a>0 b>0 } while a b { while a>b { a=a-b } while a0 b>0 } while a b { while a b { a=a-b } while a1 } while n>1 if n gerade then n = n/2 else n=3*n+1 // Terminierung unbewiesen

203 6.2.6Beispiel: Multipl. durch fortgesetze Addition // Vorbedingung P: a 0 b 0, Beh.: Nachbedingung Q: z = a*b x = a; y = b; z = 0; { x 0 b 0 z=0 } // Auch hier: Die Summe von x*y+z bleibt konstant a*b { INV: z+xy = ab, x,y 0 } while x > 0 { { INV x>0 } { (z+y)-y+xy = ab, x>0,y 0 } z = z + y; { z-y+xy = ab, x>0,y 0 } { z-y+((x-1)+1)y = ab, (x-1)+1>0,y 0 } x = x - 1; { z-y+(x+1)y = ab, x+1>0,y 0 } { z-y+xy+y = z+xy = ab, x,y 0 } INV } { INV B = (z+x*y=a*b) (x=0) z+0*y=a*b Q } B ? S P I I B I f w Q

204 6.2.6Beispiel: Die ägyptische Bauernmultiplikation // Vorbedingung P: a 0 b 0, Beh.: Nachbedingung Q: z = a*b x = a; y = b; z = 0; { x,y 0 z=0 x=a y=b } // Schleife verdoppelt x und halbiert y: Invariante: INV INV = { z+x*y = a*b x,y 0 } while x > 0 { { INV x>0 } if (odd(x) then { (z+y)-y+x*y = a*b) x>0,y 0 } z = z+y; { odd(x) z-y+x*y = a*b x>0,y 0 } // leere Anweisung { even(x) z+x*y = a*b x>0,y 0 } { ( odd(x) z-(2y/2)+x*(2y/2) = a*b x>0,(2y/2) 0 ) ( even(x) z+x*(2y/2) = a*b x>0,(2y/2) 0 ) } y = y * 2; { ( odd(x) z-y/2+x*y/2 = a*b x>0,y/2 0 ) ( even(x) z+x*y/2 = a*b x>0,y/2 0 ) } { (odd(x) z-y/2+(2(x div 2)+1)*y/2 = a*b (2(x div 2)+1)>0,y 0 ) (even(x) z+(2(x div 2))*y/2 = a*b 2(x div 2) >0,y 0 ) } x = x div 2; // div = Ganzzahldivision { ( odd(2x+1) z-y/2+(2x+1)*y/2 = a*b (2x+1)>0,y/2 0 ) ( even(2x) z+ 2x *y/2 = a*b 2x >0,y/2 0 ) } { (z-(y - y(2x+1))/2 = z-(y-2xy-y)/2 = z-(-2xy/2)= z+xy = a*b ) (z + 2x * (y*2) = z+xy = a*b )} INV } { INV B = (z+x*y=a*b) (x=0) z+0*y=a*b Q }

205 6.2.7Kritische Anmerkungen Die Verifikation entspricht einer mathematischen Beweisführung und kann entsprechend kniffelig, aufwändig, wenn nicht gar unmöglich sein. Durch formale Überprüfung der Korrektheit, lassen sich Schlüsselstellen eines Algorithmus (eines Programmes) verifizieren Durch das Denken mit Zusicherungen, Invarianten und mathematische Folgerungen wird die Erstellung fehlerfreier Programme gefördert. Auch wenn es semi-automatische Systeme zur formalen Verifikation von Algorithmen gibt, ist es praktisch nicht möglich, auch nur halbwegs komplexe Programmsysteme damit zu verifizieren Selbst wenn es möglich wäre, Algorithmen vollständig formal zu beweisen, so wäre dies keine Garantie, dass ein Programmsystem entsprechend den Wünschen eines Kunden funktioniert. Dazu gehören alle Mechanismen eines ordentlichen Software-Engineerings.

206 6.3Komplexität In diesem Kapitel haben wir den Begriff Berechenbarkeit definiert als all das, was algorithmisch beschreibbar ist. Wir haben eine Methode vorgestellt, mit der man (meist) zeigen kann, dass ein Algorithmus das tut was er soll. Was noch fehlt - und hier behandelt werden soll - ist die Frage nach dem Zeit- und Platzbedarf eines Algorithmus. Inhalt 1.Wie gut ist ein Algorithmus 2.Die O-Notation 3.Häufige O-Ausdrücke 4.Einige Regeln 5.Quantitatives 6.Platzbedarf

207 6.3.1Qualität eines Algorithmus Die Abarbeitung eines Algorithmus benötigt Resourcen, vor allem: ZeitLaufzeit des Algorithmus PlatzSpeicherplatzbedarf des Algorithmus Problem bei der Resourcenermittlung - der Resourcenbedarf ist Abhängig von: der Problemgröße (z.B. Multiplikation einer 10x10 bzw. 100x100 Matrix) der Eingabewerte (z.B. Sortieren einer bereits sortierten Menge) der Fragestellung (bester, mittlerer, schlechtester Fall) der Güte der Implementierung (z.B. (un)geschickte Typwahl) der Hard- und Software (z.B. Schneller Rechner, optimierter Compiler) Es gibt auch Qualitätsmerkmale eines Algorithmus, der sich nicht am Resourcenbedarf festmachen (aber das ist eine andere Geschichte...) Wartbarkeit Robustheit Eleganz...

208 6.3.2Die O-Notation: Definition Definition: Eine Funktion g(n) wird O(f(n)) genannt (Die Laufzeit, der Aufwand, die Zeitkomplexität von g(n) ist O(f(n))), falls es Konstanten c und n 0 gibt, so dass: g(n) c f(n), für fast alle n > n o ist f(n) ist damit eine obere Schranke für die Laufzeit des Algorithmus (allerdings nur ab einem bestimmten c und n 0 ) Beispiel: Bei der Analyse eines Algorithmus hat sich herausgestellt, dass die Laufzeit g(n) = 3n 2 + 7n - 1 ist. Behauptung: Die Laufzeit von g(n) ist O(n 2 ), also f(n)=n 2, Beweis: Es muss Konstanten c und n 0 geben, so dass gilt 3n 2 +7n-1 c n 2, für alle n > n 0 setze n 0 =7 und c=4, dann gilt: 3n 2 +7n-1 3n 2 +7n 3n 2 +n 2 = 4n 2

209 6.3.2Die O-Notation: Schranken Die Notation gibt nur eine obere Schranke der Komplexität, das muss nicht notwendigerweise die beste Schranke sein. Beispiel: Eine weitere obere Schranke für g(n) = 3n 2 + 7n - 1 ist auch O(n 3 ), welche sicher nicht die beste ist. Bei der Suche nach der Größenordnung von f(n) wird man versuchen, das kleinste f(n) zu finden, für das g(n) < c. f(n) Dieses ist dann eine kleinste, obere Schranke für den Aufwand Zur Bestimmung des tatsächlichen asymptotischen Aufwands wird man also noch eine größte, untere Schranke h(n) = ( g(n)) suchen für die gilt: lim n h(n)/f(n) = 1 Eine untere Schranke ist die Zeit, die jeder Algorithmus (ab einem n>n 0 ) benötigt Das ist im Allgemeinen viel schwieriger !

210 6.3.2Die O-Notation: Achtung Achtung ! Die Konstanten c und n 0 werden üblicherweise nicht angegeben und können sehr groß sein Beispiel: Algorithmus A habe eine Laufzeit von O(n 2 ) Algorithmus B für das gleiche Problem eine Laufzeit von O(1,5 n ) Welcher Algorithmus ist besser ? schnelle Antwort: A (das stimmt auch für große n) bessere Antwort: Wie groß ist n ? Wie groß sind die Konstanten ? z.B. für c A =1000 und c B =0,001 nc A n 2 c B 1,5 n , , ,3 502, , , Bis hier ist B besser als A

211 6.3.3Häufige O-Ausdrücke: O(1) Teile von Ausdrücken, die eventuell ein paar Mal durchlaufen werden, wobei die (maximale) Anzahl der Durchläufe nicht abhängig von den Eingabewerten sind, haben konstante Laufzeit: O(1) Beispiel: max, i, y : integer; max = 0; y << Tastatur; if (y < 20) then max=10 else max=100; for i=1 to max { y = y+1; } Die Anzahl der Schleifendurchläufe ist zwar abhängig von y (entweder 20 oder 100), die maximale Anzahl aber nicht (immer 100, egal wie groß oder klein y ist)

212 6.3.3Häufige O-Ausdrücke: O(log n) - rekursiv Rekursive Algorithmen, die in jedem Schritt die Menge der Eingabedaten halbieren haben eine Laufzeit von O(log n) eigentlich O(ld n), aber da ld n 3,322 log b = c log b ist O(ld b)=O(log n) Beispiel: Suche in einem sortierten Binärbaum search (IN: x:integer; tree:*node; OUT: found:boolean) { if tree == nil then { // there is no tree to search => x not found found = false; return; // ATTENTION: return already here } if (x < node.value) then search(x,node.left, found) else if (x > node.value) then search(x,node.right,found) else if (n == node.value) found=true; }

213 6.3.3Häufige O-Ausdrücke: O(log n) - Zeitbedarf Block mit rekursivem Aufruf der/s halben Eingabemenge/-Wertes rek_block (IN: Eingabemenge OUT: Ausgabewert) { if ( Trivialfall) then { Ausgabewert = Trivialwert } // optional: Aktionen mit konstantem Aufwand rek_block (Eingabemenge / 2); } Bestimmung des Zeitbedarfs Der Zeitbedarf für das Durchlaufen ergibt sich aus: Abfrage des Trivialfalls und (optional) Aktionen O(1) Rekursiver Aufruf mit Eingabemenge/Wert die/der halb so groß ist, also n/2. also : T n = 1 + T n/2 (T n = Zeitbedarf für n, n 2) T 1 = 0 (eigentlich 1, kann aber vernachlässigt werden) Annahme (o.B.d.A.): Eingabemenge/-wert ist Potenz von 2 also n = 2 k, Diese Annahme kann man machen, denn falls n keine Zweierpotenz ist, erhöht man die Eingabemenge/-wert auf die nächste 2er Potenz und bekommt noch immer eine obere Schranke. T 2 k = T 2 k-1 +1 = T 2 k =... = T k = k T 2 k = k T n = k = ld n

214 6.3.3Häufige O-Ausdrücke: O(n) - rekursiv Rekursive Algorithmen, die in jedem Schritt die Menge der Eingabedaten halbieren aber dazu jedes Element betrachten müssen haben eine Laufzeit von O(n) Beispiel: Suche in einer sortierter Liste (array) mit 0 am Ende search (IN: x:integer; list:*liste; OUT: found:boolean) { i : integer; if (list[1]==0) then found = false; // list with no element i=1; while (list[i] <> 0) i=i+1 // get length of list if (x==list[i/2]) then found = true; else if (x

215 6.3.3Häufige O-Ausdrücke: O(n) - iterativ Iterative Algorithmen die eine lineare Liste durchlaufen deren Länge abhängig von der Menge der Eingabeelemente ist (einfache Schleife), haben die Laufzeit O(n) Beispiel: Suche in einer sortierter Liste (array) mit 0 am Ende search (IN: x:integer; list:*liste; OUT: found:boolean) { i : integer; found = false; // initialize OUT-value i=1; while ((list[i] <> 0) and (not found)) { i=i+1; if (list[i]==x) then found = true; } } Anmerkung: Dieser Algorithmus funktioniert auch mit unsortierten Listen Warum dann einen rekursiven, teilenden Algorithmus ? Anzahl eingeschränkter Vergleiche O(n) Anzahl vollständiger Vergleiche O(log n)

216 6.3.3Häufige O-Ausdrücke: O(n) - rekursiv Rekursive Algorithmen, die die Eingabedaten in zwei Hälften aufspalten, und beide Hälften getrennt abarbeiten, haben eine Laufzeit von O(n) Beispiel: Erstellen eines Lineals (siehe auch: Skript Dr. Geisse) linael (IN: links,rechts,höhe:integer) { mitte : integer; if (höhe>0) then { mitte = (links + rechts) / 2; zeichne (mitte,höhe); lineal (links,mitte,höhe-1); lineal (mitte,rechts,höhe-1); } } Zeitbedarf: T n = 2T n/2 + 1 (T n = Zeitbedarf für n, n 2, T 1 =0) Annahme (o.B.d.A.): n = 2 k, T 2 k = 2T 2 k /2 T 2 k = T 2 k-1 + 1/2 = 2T 2 k /2 1/4 T 2 k = T 2 k-2 + 1/2 + 1/4... 1/2 k T 2 k = T /2 + 1/ /2 k = 1 - 1/2 k T 2 k = 2 k -1 T n = n-1 Laufzeit O(n)

217 6.3.3Häufige O-Ausdrücke: O(n log n) Rekursive Algorithmen, die die Eingabedaten in zwei Hälften aufspalten, und die Eingabedaten einmal durchlaufen (davor, währenddessen, oder danach), haben eine Laufzeit von O(n log n) Beispiel: Sortieren einer Liste a : array[1..max] of integer (C.A.R. Hoare) Quicksort (IN:l,r:integer) { // l left, r right index i,j,x : integer; // i,j: indexes, x,y: elemets i=l; j=r; // initialize i with left, j with right index x = a[(l+r)/2}] // get element in the middle do { // walk with i from left, with j from right while a[i] o { j=j-1 } // skip larger elements from right if (i stop loop if l

218 6.3.3Häufige O-Ausdrücke: O(n 2 ) - rekursiv Rekursive Algorithmen, die die Eingabedaten jeweils um eins verringern, dabei aber alle Daten betrachten müssen, haben eine Laufzeit von O(n 2 ) Beispiel: Sortieren einer Liste a : array[1..max] of integer StraightSelection (IN:l,r:integer) { // l left, r right index i: integer; // index i = l; // start with left element while (i

219 6.3.3Häufige O-Ausdrücke: O(n 2 ), O(n 3 ) - iterativ Iterative Algorithmen die eine Liste - deren Länge abhängig von der Menge der Eingabeelemente ist - (fast) sooft durchlaufen, wie die Liste lang ist (doppelt verschachtelte Schleife), haben die Laufzeit O(n 2 ) Beispiel: Sortieren einer Liste a : array[1..max] of integer StraightSelection (IN:l,r:integer) { // l left, r right index i: integer; // index i = l; // start with left element for i=1 to r-1 // walk through complete list { for j=i+1 to r // walk through rest of list { if (a[j]

220 6.3.4Einige Regeln Hat ein Algorithmus eine Laufzeit, die mit einem Polynom k-ten Grades darstellbar ist (a k n k + a k-1 n k a 0 ), so ist die Laufzeit O(n k ) Beispiel:Laufzeit: 9n 3 + 7n Laufzeit O(n 3 ) Wird ein Teil A mit Laufzeit O(x) vor einem Teil B mit Laufzeit O(y) ausgeführt, so ist die Gesamtlaufzeit das Maximum der Laufzeiten. Beispiel:Laufzeit A ist O(n 2 ), Laufzeit B ist O(n) Laufzeit A,B = O(n 2 ) + O(n) = O(n 2 ) Wird ein Teil A mit Laufzeit O(x) innerhalb eines Teiles B mit Laufzeit O(y) ausgeführt, so ist die Gesamtlaufzeit das Produkt der Laufzeiten. Beispiel:Laufzeit A ist O(n 2 ), Laufzeit B ist O(n) Laufzeit A(B) = Laufzeit B(A) = O(n 2 ) O(n) = O(n 3 ) Beispiel:Eine Dreifach verschachtelte Schleife (O(n 3 )) ist eine Schleife O(n) in einer zweifach verschachtelten Schleife (O(n 2 )) : O(n 3 ) = O(n 2 ) O(n)

221 6.3.5Quantitatives nld n(ld n) 2 nn ld nn ,

222 6.3.6Platzbedarf Unter Aufwand wird i.A. der zeitliche Aufwand, also die Zeitkomplexität verstanden Manchmal ist auch die Platzkomplexität bzw. Speicherbedarf relevant. Darunter versteht man dann, ganz entsprechend zur Zeitkomplexität, eine obere Schranke für den Speicherbedarf eines Algorithmus für ein Problem mit einer Eingabemenge der Größe n. Auch beim Speicherbedarf von Algorithmen existieren die Komplexitätsklassen (n, n 2, n log n,...) Auch beim Speicherbedarf unterscheiden sich geschickte und ungeschickte Algorithmen für die Lösung eines gegebenen Problems. Da Computerspeicher endlich, die Zeit aber potentiell unendlich ist hat der Speicherbedarf oft die höhere Priorität. Meist wird daher der Algorithmus gewählt, der sehr Nahe am minimal möglichen Speicherbedarf bei möglichst optimalem Aufwand liegt.

223 6.3.6Platzbedarf Oft kann man eine bessere Zeitkomplexität zu Lasten des Speicherbedarfs erreichen (und umgekehrt) Beispiel: Trivialer Hashsort (Unsortierte Liste a: array [1..n] of type) b: array [1..max(type)] // max(type) is largest element in type, // e.g. max(unsigned integer) = i,j : integer; for i=1 to n { b[a[i]] = a[i]; } j = 1; for i=1 to max(type) { // shift to beginning of list if ((not_empty(b[i])) and (i<>j)) then { b[j]=b[i]; j=j+1;} } 1.Schleife + 2.Schleife: O(n) + O(1) = O(n) Man wägt daher Speicherbedarf und Zeitkomplexität gegeneinander ab.

224 6.4Zusammenfassung des Kapitels Berechenbarkeit: 1.Einige Fragen und das Entscheidungsproblem 2.Die Turing-Maschine und der Begriff der Berechenbarkeit 3.Rekursive Funktionen und die Churchsche These Korrektheit 1.Ansatz und Definition 2.Logik zur Verifikation: Die Hoareschen Regeln 3.Beispiele und Beweis des Euklidschen Algorithmus 4.Kritische Anmerkungen Komplexität 1.Wie gut ist ein Algorithmus und die O-Notation 2.Häufige O-Ausdrücke und einige Regeln bei deren Anwendung 3.Quantitatives 4.Platzbedarf

225 Kapitel 7Sprachen Wir haben Information als grundlegenden Begriff der Informatik eingeführt und über Codes und Datenstruktur abstrahiert. Andererseits haben wir den Umgang mit Information, zunächst am einfachen Beispiel (Rechnen mit Zahlen in beliebigen Zahlensystemen), dann abstrakter und mächtiger mit Hilfe von Algorithmen kennengelernt. Dieses Kapitel führt nun in die wesentliche Anwendung dieser grundlegenden Überlegungen ein. Es beschreibt die fundamentalen theoretischen Grundlagen von Sprachen im Allgemeinen und Programmiersprachen im Besonderen. Inhalt 1.Programmiersprachen 2.Syntax und Semantik 3.Reguläre Ausdrücke 4.Endliche Automaten 5.Grammatiken

226 7.1Programmiersprache Programmiersprachen sind das Mittel der Informatik, Algorithmen problemorientiert zu formulieren. Die wichtigen Begriffe Programmiersprache und Programm sind dabei - zumindest was den zweiteren betrifft - nicht ganz klar und sollen zunächst kurz eingeführt werden. Danach soll ein sehr kurzer Überblick über die Entwicklung von Programmiersprachen gegeben werden, der mit einem Resumée abschließt. Inhalt 1.Was ist eine Programmiersprache 2.Was ist ein Programm 3.Generationen von Programmiersprachen 4.Programmiersprachen heute

227 7.1.1Was ist eine Programmiersprache Eine Programmiersprache ist eine künstliche Sprache zur präzisen Formulierung von Algorithmen. Sie ist: vollständig (zumindest in einigen Aspekten) eindeutig maschinell verarbeitbar Die Programmiersprache spielt eine Mittlerrolle zwischen Mensch und Maschine Beschreibung soll für den Menschen generierbar und verständlich sein Beschreibung soll für die Maschine verständlich und exakt, wiederholbar ausführbar sein. Programmiersprachen sind abhängig von Anwendungsgebiet Art der Rechnersysteme Mentalität der Programmierer

228 7.1.2Was ist ein Programm Ein Programm durchläuft einige Repräsentationsformen Quelltext Der Quelltext ist die dem Menschen geläufigste Repräsentationsform eines Programmes. Der Quelltext wird meist vom Menschen mit einem Editor erstellt und formalisiert einen Algorithmus Teilweise wird Quelltext auch von anderen Programmen generiert Der Quelltext eines Programmes befindet sich oft in genau einer Datei, in größeren Programmen meist in mehreren Dateien Objektmodul Wird ein Programm z.B. mit Hilfe eines Compilers übersetzt, so ist es bereits in binärer Repräsentation, allerdings so noch nicht lauffähig auf einem Prozessor Ausführbares Programm Das Programm ist binär repräsentiert und mit allen Teilen zusammen- gebunden, die notwendig für die Ausführung auf einem Prozessor sind. Prozess Ein Prozess ist ein Programm, welches gerade auf dem Prozessor (auf den Prozessoren) ausgeführt wird.

229 7.1.3Generationen von Programmiersprachen 1.Generation: Maschinensprachen 2.Generation: Assemblersprachen 3.Generation: Prozedurale Sprachen 4.Generation: Datenbankabfragesprachen 5.Generation: Deklarative Sprachen Was ? Wie ? Speicher- stelle Relation Objekt

230 7.1.3Generation: 1. Maschinensprachen Prozessorspezifische Sprache, meist in Binärform : Direkte Ausführung durch Prozessor möglich Extrem aufwendige Programmierung Einsatz heute nur noch in (manchen) Mikroprozessorsteuerungen im ROM-BIOS, Bootblock zur Wartung alter Steuergeräte, wenn deren Einsatz bzgl. des Programmieraufwandes noch lohnend ist

231 7.1.3Generation: 2. Assemblersprachen Verwendung mnemonischer Bezeichner, strukturäquivalent zu Binärcode (seit ca. 1950) mov ecx,dword ptr [esp+4] test ecx,ecx jne E push 0FDh call dword ptr ds:[4010B8h] E pop ecx ret B mov esi,ecx D push F call C A7 ret... Übersetzung des Codes durch Assembler Einsatz heute noch bei systemnaher Programmierung

232 7.1.3Generation: 3. Prozedurale Sprachen Prozedurale Sprachen setzen Algorithmen und Datenstrukturen, wie sie in den vorangegangenen Kapiteln beschrieben wurden sehr natürlich um. Rechnerunabhängige Sprachen in einer meist anwendungsabhängigen Schreibweise (Syntax) und Bedeutung (Semantik). Fortran1954wissenschaftlich/technisch Cobol1957kommerziell Algol1957wissenschaftlich/technisch PL/11960universell Basic1963einfach wissenschaftlich/technisch Pascal1968universell, Lehre Chill1968Systemprogrammierung (T-Kom) Pearl1970Regelung C1970universell, Systemprogrammierung Ada1975universell, Militär Modula1975Lehre C++1980universell, Systemimplementierung

233 7.1.3Generation: 4. Datenbankabfragesprachen Einfacher Umgang mit Datenbanken (4GL, seit 1965): Definition des Datenbank-Layouts Operationen auf Datenbanken Generierung von graphischen Benutzeroberflächen Beispiele: SQL (Standard Query Language) NATURAL Heute oft in Kombination mit prozeduralen Sprachen unterstützt durcvh graphische Sprachelemente Extreme Beschränkungen durch Fokus auf Datenbanken, daher nicht (mehr) weit verbreitet.

234 7.1.3Generation: 5. Deklarative Sprachen Beschreibung des Problems in einem (meist) mathematischen Formalismus. Lösung, basierend auf der Beschreibung, durch das System. Logische Sprachen, z.B. Prolog funktionale Sprachen, z.B. ML logisch-funktionale Sprachen (Zur Zeit) Keine wesentlichen Einsatzgebiete

235 7.1.4Programmiersprachen heute Seit den Zeiten der Maschinensprachen hat eine Entwicklung zu mehr Abstraktion stattgefunden Abstraktion des Algorithmus von einfachsten Maschinenbefehlen (bestehend aus Zuweisungen, Vergleichen und Sprüngen) über prozedurale Sprachen (mit ihren Mitteln der strukturierten Programmierung) bis hin zu deklarativen Sprachen (die Probleme vollständig beschreiben, deren Lösung dann generisch stattfinden kann) Abstraktion der Datenstrukturen von der blanken Speicherstelle und Register bis hin zu relationalen Strukturen (4GL-Sprachen) und objektorientierten Strukturen (mit Vererbungsbeziehungen und Datenkapselung) Stand heute: Tatsächlich sind die Sprachen der 3. Generation, insbesondere die mit objektoerientierter Erweiterung, die zur Zeit wesentlichen. Grund für das Scheitern der 4GL-Sprachen ist der eingeschränkte Fokus auf relationale Strukturen - Grund des Scheiterns deklarativer Sprachen ist die unangepasste Abstraktionsfähigkeit der Datenstrukturen und insbesondere der Aufwand generischer Algorithmen.

236 7.2Syntax und Semantik Im vorangegangenen Unterkapitel haben wir Programmiersprachen als präzise, vollständig und eindeutig beschrieben. Diese Beschreibung trifft tatsächlich aber nicht auf alle Aspekte der Sprache zu. In diesem Unterkapitel sollen nun die Aspekte einer Programmier- sprache beschrieben werden, sowie die Möglichkeiten, diese Aspekte zu beschreiben. Inhalt 1.Syntax vs. Semantik 2.Syntax 3.Semantik

237 7.2.1Syntax vs. Semantik Bei der Beschreibung einer Programmiersprache unterscheidet man zwischen Syntax und Semantik der Sprache: Unter der Syntax einer Programmiersprache bezeichnet man den formalen Aufbau, also die Struktur, einer Sprache Unter der Semantik einer Programmiersprache bezeichnet man, die Bedeutung der Konstrukte einer Programmiersprache Beispiel: Syntax für die Zuweisung:linke_seite = rechte_seite; Semantik der Zuweisung:Der Wert der rechten Seite wird bestimmt und wird an die Speicherstelle abgelegt, die durch die linke Seite bezeichnet ist. Beachte Die Syntax kann (meist) vollständig formal angegeben werden Die Semantik wird meist nur informell beschrieben Fehler, die auf fehlerhaftes Verständnis der Semantik beruhen sind oft schwer zu finden.

238 7.2.2Syntax Wie wir gesehen haben, beschreibt die Syntax einer Programmier- sprache deren Struktur. Dabei ist lässt sich die Struktur von Programmiersprachen noch in zwei Abstraktionsebenen einteilen: Lexikalische Struktur: Hierunter versteht man die Struktur der atomaren Elemente oder Grundsymbole der Programmiersprache Syntaktische Struktur: Hierunter versteht man die Zusammensetzung von Grundsymbolen der Sprache zu komplexeren Strukturen Notation: Die Syntax einer Sprache lässt sich (meist) formal beschreiben. Dazu gibt es verschiedene Beschreibungsmittel bzw. Notationen. lexikalische Struktur syntaktische Struktur

239 7.2.2Syntax: Lexikalische Struktur Die lexikalische Struktur: beschreibt also den Aufbau der Grundsymbole aus einzelnen Zeichen Diese Zeichen sind Buchstaben, Ziffern und Sonderzeichen Die resultierenden Grundsymbole nennt man auch Token Beispiel: Zahlen bestehen aus beliebig vielen, aber mindestens einer Ziffer IEEE 754 Zahlen bestehen aus Ziffern und Kommas in Mantisse und Exponent mit einem (kleinen oder großen) E dazwischen. Dabei sind einige Teile optional Bezeichener beginnen mit einem Buchstaben, gefolgt von Ziffern, Buchstaben und dem Sonderzeichen _ Die lexikalische Struktur lässt sich mit regulären Ausdrücken beschreiben endlichen Automaten untersuchen Ein Programm zur Umsetzung lexikalischer Strukturen in Token nennt man Scanner.

240 7.2.2Syntax: Syntaktische Struktur Die syntaktische Struktur beschreibt also die Zusammensetzung von Grundsymbolen der Sprache zu Ausdrücken, Anweisungen und letztlich zu einem vollständigen Programm. Beispiel: Ein Ausdruck besteht aus: einem Ausdruck gefolgt von einem Operator, gefolgt von einem Ausdruck z.B.: 5 * 7 oder aber einer einzelnen Zahl z.B. 5 Eine abweisende Schleife besteht aus: dem Schlüsselwort while, einem bollschen Ausdruck (in Klammern) und einer Anweisung. z.B. while (a>5) i=i+1; Die syntaktische Struktur lässt sich durch Grammatiken beschreiben Ein Programm zur Analyse der syntaktischen Struktur (und zu dessen weiteren Verarbeitung) nennt man Parser.

241 7.2.3Semantik Die Semantik beschreibt also die Bedeutung der Konstrukte einer Programmiersprache. Beispiel: if (a>5) then a=5 else a=0 Die Bedeutung dieser Alternative lässt sich wie folgt beschreiben: Die boolsche Bedingung der Alternative wird ausgewertet: Ist das Ergebnis wahr so werden die Anweisungen des then-Zweiges ausgeführt, Ansonsten werden die Anweisungen des else-Zweiges ausgeführt. Die Beschreibungsformen - also die Notation der Beschreibung - sind typischerweise nicht vorgeschrieben bzw. formalisiert. Da es für die meisten Programmiersprachen keine formalen Notationen der Semantik gibt, gibt es auch meist kein Programm, welches für eine Programmiersprache automatisch einen Übersetzer für Programme dieser Sprache generiert. Scanner und Parser können automatisch generiert werden Compiler meist nicht

242 7.3Reguläre Ausdrücke Im vorangegangenen Unterkapitel haben wir gesehen, dass die lexikalische Analyse auf einer formalen Beschreibung der lexikalischen Strukturen einer Programmiersprache aufbaut. Diese formale Beschreibung ist die der regulären Ausdrücke. Dieses Unterkapitel führt nun in die regulären Ausdrücke ein. Inhalt 1.Beispiel 2.Definition: reguläre Ausdrücke 3.Definition: reguläre Sprachen 4.UNIX-Notation 5.Beispiele

243 7.3.1Beispiel BeispielZiffer =[0-9] Zahl ={Ziffer}+ Buchstabe =[A-Za-z] Bezeichner ={Buchstabe}({Ziffer}|{Buchstaben})* Notation (Auszug aus der UNIX-Notation) Einfache Notationsregeln: Hintereinander schreibenbedeutet: Konkatenation | bedeutet: Alternative Die Klammerung ist möglich (und äquivalent der math. Bedeutung) [0-9] ist die Kurzform von 0 | 1 |... | 9 {x} wird ersetzt durch die Definition von x + bedeutet: beliebig oft, aber mindestens einmal * bedeutet: beliebig oft, auch kein mal

244 7.3.2Definition: reguläre Ausdrücke Definition Reguläre Ausdrücke sind Formeln, mit denen (bestimmte) Sprachen definiert werden könnn Sei ein endlichen Alphabet bestehend aus Zeichen. Reguläre Ausdrücke sind wie folgt induktiv definiert 1. ist ein regulärer Ausdruck 2.Für jedes a ist a ein regulärer Ausdruck 3.wenn a und b reguläre Ausdrücke sind, dann auch: a) aba konkateniert mit b b) ( a | b ) a oder b c) ( a )* a beliebig oft, einschließlich 0-mal wobei die Wiederholung Vorrang vor der Konkatenation und diese wiederum Vorrang vor der Alternative hat. Um Präzedenzen explizit darzustellen ist es möglich, beliebig zu lammern. Beispiel: Sei ={a,b,c,d,e}: (ab|cd*)* ist ein regulärer Ausdruck denn, a und b ist regulärer Audruck wg. 2., ab ist regulärer Ausdruck wg. 3.a c und d ist regulärer Audruck wg. 2., d* ist regulärer Ausdruck wg. 3. c), cd* ist regulärer Ausdruck wg.3.a) (ab|cd*) ist regulärer Ausdruck wg. 3.b) (ab|cd*)* ist regulärer Ausdruck wg. 3.c)

245 7.3.3Definition: reguläre Sprachen Definition Alle durch einen regulären Ausdruck r definierten Folgen von Zeichen nennt man Wörter der Sprache L(r) Die Menge der durch reguläre Ausdrücke beschreibbaren Sprachen ist genau der Menge der regulären Sprachen Beispiele: ={a,b} a,b,c r = r = a | bc | ccc L(r) = { } L(r) = {a,bc,ccc} a,b,c r = (abc|bc)a*(bc|ab)* L(r) = {abcabc, bcabc, abcaab, bcaab, abcaabc,....} Es gibt Sprachen, die sich nicht durch reguläre Ausdrücke definieren lassen: L(r) = {ab,aabb,aaa,bbb,....., a n b n } Alle Programmiersprachen

246 7.3.3UNIX-Notation - die klassischen Elemente Für Token einer real existierenden Programmiersprache ist die einfache Notation regulärer Ausdrücke teilweise sehr umständlich. Beispiel: Bezeichner: (a|b|c|....|z|A|B|...|Z|_)(a|b|c|....|z|A|B|...|Z|_|0|1|....|9)* Daher hat sich in der Informatik eine zwar komplexere aber dafür flexiblere Notation eingebürgert: Die UNIX-Notation Die UNIX Notation übernimmt die folgenden Konstruktionsregeln (mit den zugehörigen Präzedenzregeln) aus der klassischen Notation für reguläre Ausdrücke 1.Konkatenation zweier reg. Ausdrücke erfolgt ohne expliziten Operator 2.Alternativen werden mittels j gebildet 3.ein normales\ Zeichen steht fur sich selbst 4.ein nachgestellter * steht für beliebige Wiederholung 5.Klammerung erfolgt durch ( und )

247 7.3.3UNIX-Notation - Die Sonderzeichen Zusätzlich unterscheidet man in der UNIX Notation zwischen weiteren Sonderzeichen und normale Zeichen. Weitere Sonderzeichen sind z.B. : * + [ ] ? ^ ( ). $ Falls ein Sonderzeichen nicht als solches interpretiert werden soll, ist ein "\ voranzustellen Die Bedeutung der Sonderzeichen ist wie folgt 6.. steht für ein beliebiges Zeichen außer '\n (Zeilenumbruch) 7.Auch in Apostrophe eingeschlossene Strings werden verbatim interpretiert. 8.ein nachgestelltes + steht für nichtleere Wiederholung 9.ein nachgestelltes ? bezeichnet einen optionalen Anteil 10.^ am Anfang eines regulären Ausdrucks steht für Zeilenanfang 11.$ am Ende eines regulären Ausdrucks steht für Zeilenende

248 7.3.3UNIX-Notation - Die Zeichenklasse eine Zeichenklasse steht für genau ein Zeichen. Sie kann durch Zeichen-Aufzählung x 1, x 2,... x n und Bereichsangaben x 1 -x n gebildet werden: [x 1 -x n] steht für ein Zeichen aus dem Bereich und entsprich der klassischen Notation x 1 |x 2 |... |x n Beispiel: [0-9] [x 1 x 2...x n] steht für genau ein Element aus der Menge der angegebenen Zeichen Beispiel: [abc_] Beide Schreibweisen (Bereich und Aufzählung) können beliebig kombiniert werden. Beispiel: [a-zA-Z0-9_] Ein ^-Zeichen am Anfang der Zeichnklasse ( [^....] ) spezifiziert die komplementäre Zeichenmenge. Beispiel: [^0-9] steht für ein beliebiges Zeichen außer einer Ziffer

249 7.3.4Beispiele 1.Alle mit kleinem a beginnenden Zeichenketten: a.* 2.Alle nichtleeren Dezimalziffernfolgen: [0-9]+ 3.Alle Wörter, die aus genau 3 Zeichen bestehen und nicht mit einer Ziffer enden:..[^0-9] 4.Pascal-Bezeichner = [A-Za-z][A-Za-z0-9]* 5.C-Float-Literale = -?[0-9]+((\.[0-9]+)|((\.[0-9]+)?[eE]-?[0-9]+) C-Float-Literale bestehen aus einem Vorkomma-Anteil\ (ggf. mit Minuszeichen) (Syntax: -?[0-9]+) einem optionalen Nachkomma-Anteil (Syntax: \.[0-9]+) und einem ebenfalls optionalen Exponenten-Anteil (Syntax: [eE]-?[0-9]+). Dabei ist zu beachten, dass entweder der Nachkomma-Anteil oder der Exponent vorhanden sein muss. Wenn beides fehlt, liegt eine Integer- Konstante vor. Daher ist die folgende Spezifkation nicht korrekt: -?[0-9]+(\.[0-9]+)?([eE]-?[0-9]+)? Viel komplizierter wird es in der Praxis nur selten !

250 7.4Endliche Automaten Wie wir gesehen haben, lassen sich die Grundelemente einer Programmiersprache, die Token, durch reguläre Ausdrücke formal beschreiben. Es gibt nun eine zweite äquivalente Beschreibungsart, die zudem der Ausgangspunkt für eine maschinelle Überprüfung von Wörtern bezüglich gegebener regulärer Ausdrücke ist: Endliche Automaten. Diese sind Gegenstand dieses Unterkapitels Inhalt Definition Graphische Darstellung Funktionsweise Beispiel: NEA, DEA Automaten und reguläre Ausdrücke

251 7.4.1Definition Definitionen Ein endlicher Automat M ist ein 5-Tupel M = ( Z,,, z 0, E ) mit: Z ist eine endliche Menge der Zustände ist das Eingabealphabet mit Z : Z x Z ist die Überführungsfunktion z 0 ist der Startzustand E Z ist die Menge der Endzustände Ist in die Wertemenge Z eindeutig für alle Zustände und Zeichen und ist Z ( ist das leere Zeichen), so nennt man den Automaten deterministisch ansonsten Indeterministisch. Die von M akzeptierte Sprache L(M) ist definiert als: L(M) = { x * | z 0 geht mit x in einen Zustand aus E über}

252 7.4.2Graphische Darstellung Ein endlicher Automat kann als gerichteter Graph dargestellt werden: Die Zustände werden als Knoten repräsentiert Die Überführungsfunktion wird als Kanten dargestellt Der Anfangszustand wird mit einem eingehenden Pfeil markiert Die Endzustände werden mit einem zweiten Kreis umringt M = { Z =z 0, z 1, z 2, z 3, S =a,b, d =(z 0,b,z 3 ), (z 0,a,z 1 ), (z 1,b,z 0 ), (z 1,a,z 2 ), (z 2,b,z 1 ), (z 2,a,z 3 ), z 0, E = z 3, } z1z1 z2z2 z3z3 z0z0 a b a b b a

253 7.4.3Funktionsweise Der endliche Automat versucht, ein Eingabewort, also eine Sequenz von Eingabezeichen, zu akzeptieren. Der Automat befindet sich anfänglich im Eingangszustand z o Jetzt werden das Wort, Buchstabe für Buchstabe im Automat verarbeitet. Dabei ergibt ein aktueller Zustand und der gerade gelsenen Buchstabe über die Überführungsfunktion einen Folgezustand, der dann der aktuelle Zustand für den Folgebuchstaben wird. Das Wort ist akzeptiert, wenn sich der Automat nach der Verarbeitung des letzten Buchstabens in einem Endzustand befindet Das Wort ist nicht akzeptiert, wenn sich der Automat nach der Verarbeitung des letzten Buchstabens nicht in einem Endzustand befindet, oder die Übergangsfunktion bei der Abarbeitung keinen Wert für einen aktuellen Zustand und das zugehörige aktuell gelesene Zeichen findet. Beispiel: Der Automat des vorangegangen Beispiels akzeptiert z.B. b,aaa,abaa,... Er akzeptiert nicht: aa (kein Endzustand), aab ( b in Z 2 nicht definiert)

254 7.4.3 Beispiel: NEA, DEA Beispiel eines nichtdeterministischen endlichen Automaten (NEA) Beispiel eines (äquivalenten) deterministischen endlichen Automaten (DEA) Jeder indeterministische endliche Automat lässt sich in einen deterministischen endlichen Automaten (automatisch) umformen, der die gleiche Sprache akzeptiert (also L(NEA) = L(DEA) ) a z1z1 z2z2 z3z3 z0z0 a b a a z0z0 a z1z1 b z2z2 a a z3z3 a b b

255 7.4.3Automaten und reguläre Ausdrücke Satz: Die Menge der regulären Sprachen ist identisch mit der Menge, der von endlichen Automaten akzeptierten Sprachen. Beweisidee: Für jeden endlichen Automaten gibt es einen regulären Ausdruck, der die vom Automaten akzeptierte Sprache beschreibt. Umgekehrt gibt es für jeden regulären Ausdruck einen endlichen Automaten, der die durch den regulären Ausdruck beschriebenen Sprache akzeptiert. Beweis durch Konstruktion eines Automaten aus einem regulären Ausdruck und umgekehrt ( Compilerbau, 4. Semester) Beispiel: (a|bc)* z0z0 a b z2z2 c z2z2 z2z2 z2z2

256 7.5Grammatiken Die Grundsymbole einer Programmiersprache, die deren lexikalische Struktur definieren, lassen sich mit Hilfe regulärer Ausdrücke beschreiben und mit endlichen Automaten überprüfen. Reguläre Sprachen bzw. endl. Automaten sind aber nicht mächtig genug, komplexere Strukturen wie z.B. syntaktische Strukturen einer Programmiersprache zu beschreiben. Dieses Unterkapitel stellt nun eine Beschreibungsform vor, die auch (bestimmte) komplexere Strukturen, wie sie typisch für Programmiersprachen sind, zu beschreiben vermag: Grammatiken. Inhalt 1.Beispiel aus der deutschen Sprache 2.Definitionen 3.Notationen 4.Chomsky Hierarchie

257 7.5.1Beispiel: Deutsche Sprache Beispiel: Ein Satz ist eine Folge von Subjekt Prädikat und möglicherweise Objekt, abgeschlossen mit einem Punkt (".") Ein Subjekt ist ein Eigenname oder ein Artikel, gefolgt von einem Substantiv Ein Prädikat ist ein Verb Ein Objekt ist ein Artikel, gefolgt von einem Substantiv Eigenname: Adam, Eva Verb: ißt, beißt Artikel: der, die Substantiv: Apfel, Schlange Grammatik: Nichtterminalsymbole und Terminalsymbole bilden die Elemente Regeln zu deren Verwendung Ein Startsymbol (Satz)

258 7.5.1Beispiel: Notation Beispiel Ein Satz ist eine Folge von Subjekt Prädikat und möglicherweise Objekt, abgeschlossen mit einem Punkt (".") := [ ]. Ein Subjekt ist ein Eigenname oder ein Artikel, gefolgt von einem Substantiv :=( | ) Ein Prädikat ist ein Verb := Ein Objekt ist ein Artikel, gefolgt von einem Substantiv := Eigenname: Adam, Eva := "Adam" | "Eva"....

259 7.5.1Beispiel: Ein Wort der Sprache Beispiel := := | der | die | das := | | :=kleine | bissige | große :=Hund | Katze :=jagt | sieht := Ableitungsbaum: derkleinebissigeHundjagtdiegroßeKatze

260 7.5.2Definitionen Eine Grammatik G ist ein 4-Tupel G = ( N, T, P, S ) mit: N ist eine endliche Menge, die Menge der Nichtterminalen T ist eine endliche Menge, das Terminalalphabet mit N T= P ist eine endliche Menge von Regeln oder Projektionen mit P ist eine Teilmenge von (N T) + (N T)* die Grammatik heißt kontextfrei, wenn gilt: P ist eine Teilmenge von N (N T)* S N ist das Startsymbol ein Wort v ist direkt ableitbar aus u (notiert: u v ), wenn gilt: u = xyz, v = xyz ( x, y Worte); y := y ist Regel in P ein Wort w ist ableitbar aus u (notiert: u w ), wenn gilt: u u 1 u 2 … w ( u 1,u 2,… Worte) Die von G dargestellte Sprache L(G) ist definiert als: L(G) = { w T* | S w } ( S : Startsymbol)

261 7.5.2Definition: Beispiel Eine Grammatik G ist ein 4-Tupel G = (, T, P, S ) mit: N ist eine endliche Menge, die Menge der Nichtterminalen T ist eine endliche Menge, das Terminalalphabet mit N T = P ist eine endliche Menge von Regeln oder Projektionen mit P ist eine Teilmenge von (N T) + (N T)* die Grammatik heißt kontextfrei, wenn gilt: P ist eine Teilmenge von N (N T)* S N ist das Startsymbol Aus unserem Beispiel := := | der | die | das := | | := kleine | bissige | große := Hund | Katze := jagt | sieht :=

262 7.5.2 Definition: Beispiel G = ( N={,,,,,,, } T={ kleine, bissige, große, Hund, Katze, jagt, sieht} P = { := := | der | die | das := | | :=kleine | bissige | große :=Hund | Katze :=jagt | sieht := } S = )

263 7.5.2 Definition: Beispiele G = { N,T,P,A }, N = { A,B,C }, T = { a,b,c }, P = { A := aAa, A := BC, B := bbB, B := BC, B :=, C := Cc, C := c } a 2 b 2 c 3 a 2 L(G) a 4 b 2 c b 2 c a 4 L(G) G = { N,T,P,S }, N = { A,B,C,S }, T = { a,b,c }, P = { S := ABC, A := ABA, C := CBC, A := a, B := b, C := c } {w T* | w= (ab) n ac(bc) n, n>=1} = L(G) b 2 a 2 c 3 L(G) G = { N,T,P,S }, N = { A,B,C,S }, T = { a,b,c }, P = { S := ABC, A := Aa, A := a, B := bBc, B := b, C := c } {w T* | w= a n b n c n, n>1} L(G) a 3 b 2 c 2 L(G) a 2 b 2 c 3 L(G) …

264 7.5.3Notationen: BNF / EBNF Die BNF (John Backus, Peter Naur, 1960) ist die Grundform und entspricht der Definition eventuell erweitert um den alternativ-Operator (|) siehe Beispiele Die EBNF erweitert die BNF um 3 (2) Operatoren den Alternativ Operator: | den Wiederholungs-Operator: { … } Notiert auf der rechten Seite einer Regel, drückt er aus, dass der geklammerter Ausdruck beliebig oft wiederholt werden kann - einschließlich kein mal. Teilweise wird die minimal und maximal mögliche Anzahl von Wiederholungen zusätzlich notiert: { … } der Optional-Operator: [ … ] Notiert auf der rechten Seite einer Regel, drückt er aus, dass der geklammerter Ausdruck ein oder keinmal wiederholt werden kann, also optional ist. Es lässt sich zeigen, dass beide Notationen gleich mächtig sind, dass sich also BNF notierte Grammatiken auch in EBNF notieren lassen (trivial) und umgekehrt (wie ?) max min

265 7.5.3Notationen: Syntaxdiagramme Syntaxdiagramme sind eine einfache graphische Repräsentation der syntaktischen Struktur: Konkatenationen werden durch Sequenzen, Alternativen durch Verzweigungen, Wiederholungen durch Rückkopplung dargestellt. Elemente sind Terminale und Nichtterminale Unser Beispiel (vereinfacht) im Syntaxdiagramm = [ ]. = | = = "Adam" | "Eva" Eigename ArtikelSubstantiv VerbArtikelSubstantiv. Satz: Adam Eva Eigenname:

266 7.5.4Chomsky Hierarchie Grammatiken - und damit die von ihnen definierten Sprachen - bilden eine Hierachie von Mächtigkeiten Typ 0rekursiv aufzählbarKeine Einschränkung Typ 1kontextsensitivLinke Seite aller Regeln kürzer/gleich als rechte Typ 2kontextfreizusätzlich: linke Seite aller Regeln ein Nichtterminal Typ 3regulärzusätzlich: rechte Seite beginnt mit Terminal Eine Sprache L heißt vom Typ x (x=0,1,2,3), falls es eine Typ x Grammatik G gibt mit L(G) = L Reguläre Ausdrücke beschreiben Typ 3-Sprachen, kontextfreie Grammatiken beschreiben Typ 1-Sprachen Typ 0-Sprachen Typ 1-Sprachen Typ 2-Sprachen Typ 3-Sprachen nicht entscheidbar entscheidbar, aber zu komplex entscheidbar mit endl. Automat mit Stack entscheidbar mit endl. Automat

267 7.5.4Chomsky Hierarchie: Beispiel Aus den Teilmengenbeziehungen der Chomsky-Hierarchie lässt sich also insbesondere ableiten dass alle Sprachen, die sich mit regulären Ausdrücken beschreiben lassen auch durch kontextfreie Grammatiken darstellen lassen dass sich nicht notwendigerweise alle durch Grammatiken darstellbaren Sprachen auch durch reguläre Ausdrücke beschreiben lassen z1z1 z2z2 z3z3 z0z0 a b a b b a := b|a a a := | ab | ab := | ba | ba Grammatik Endlicher Automat

268 7.6Zusammenfassung des Kapitels Programmiersprache Was ist eine Programmiersprache / ein Programm Generationen von Programmiersprachen / Programmiersprachen heute Syntax und Semantik Syntax vs. Semantik Syntax / Semantik Reguläre Ausdrücke Definitionen: reguläre Ausdrücke und reguläre Sprachen UNIX-Notation Endliche Automaten Definition, Graphische Darstellung und Funktionsweise Automaten und reguläre Ausdrücke Beispiel aus der deutschen Sprache 1.Definition und Notationen 2.Chomsky Hierarchie

269 Übungen

270 Übung 2.1Information 1.Wieviele Fragen benötigen Sie beim Zahlenraten a)um eine aus 100 Zahlen zu erraten b)um eine aus n Zahlen zu erraten 2.Eine Nachrichtenquelle sendet Zeichen aus dem Alphabet X = {a,b,c,d} mit den Wahrscheinlichkeiten p(a)=1/4, p(b)=p(c)=1/8 a)Berechnen Sie die Entropie der Quelle b)Wie groß ist der Informationsgehalt der Nachricht abcd c)Wie groß ist der mittlere Informationsgehalt der Nachricht abcd d)Wie groß ist der mittlere Informationsgehalt einer Nachricht mit 1000 Zeichen e)Wie groß ist der Informationsgehalt einer Nachricht mit 1000 Zeichen unter der Annahme, dass alle Zeichen gleich wahrscheinlich sind.

271 Übung 2.2Huffmann 1.Berechnen Sie a)Informationsgehalt jedes Symbols b)Mittlerer Informations- gehalt des Alphabets c)Huffmann Codierung d)Redundanz Ihres Huffmann-Codes e)relative Redundanz Ihres Huffman-Codes des Alphabets der deutschen Sprache (siehe Tabelle) Tip: Verwenden Sie eine Tabellenkalkulation Buch stabe Häufigkeit in % Buchs tabe Häufigkei t in% Buch stabe Häufigkeit in % a6,51j0,27s7,27 b1,89k1,21t6,15 c3,06l3,44u4,35 d5,08m2,53v0,67 e17,40n9,78w1,89 f1,66o2,51x0,03 g3,01p0,79y0,04 h4,76q0,02z1,13 i7,55r7,00

272 Übung 2.3Hamming 1.Bestimmen Sie a)Die Hamming-Distanz des ASCII-Codes b)Welche Bitfehler sind erkennbar ? c)Welche Bitfehler sind korrigierbar ? 2.Bestimmen Sie die Hamming-Distanz der nach der Hamming-Methode kodierten Codewörter. a)Betrachten Sie dabei zunächst nur die Codewörter für 0000 bis 1111 b)Welche Bitfehler sind erkennbar ? c)Welche Bitfehler sind korrigierbar ? 3.Betrachten Sie den mit der Hamming-Methode codierten Code für 1000 a)Kippen sie jedes Bit je einmal und bestimmen sie das gekippte Bit mit der Hamming-Methode. b)Was passiert, wenn zwei Bits gekippt sind - verdeutlichen Sie dies anhand eines Beispiels.

273 Übung 3.1Zahlensysteme 1.Die Duodezimalindianer haben zwölf Finger a)Berechnen Sie nach dem Zahlensystem der Duodezimalindianer die wichtigsten Werte des täglichen Lebens: a)300g Pizza b)Eine Flasche Bier (0,5 bzw. 0,33 Liter) c)ALDI 2.95 b)Konvertieren Sie die obigen Werte auch in Bin, Hex und Okt 2.Grundrechenarten (verwenden Sie keinen Rechner) a)Berechnen Sie / b)Konvertieren Sie und ins Binärsystem c)Dividieren Sie die Binärdarstellungen der beiden Zahlen d)Machen Sie die Gegenprobe im Binärsystem 3.Konvertieren Sie 0,1 10 ins Binärsystem mit der Restwertmethode 4.Addieren Sie paarweise alle Zahlen von -3 bis +4 (26 Additionen), verwenden Sie dabei die Darstellung negativer Zahlen im Zweierkomplement.

274 Übung 3.2Gebrochene Zahlen 1.(optional) Programmieren Sie in PHP4/HTML-Forms einen Konverter zur Konvertierung ganzer und gebrochener Zahlen zwischen beliebigen Zahlensystem und zur Darstellung im IEEE 754 float und double Format. 2.Stellen Sie 1.als IEEE 754 float-Zahl dar 2.(optional) als IEEE 754 double-Zahl dar 3.Geben Sie im Binärsystem und Dezimalsystem 1.den größt- bzw. kleinst-möglichen positiven bzw. negativen Wert einer float-Zahl an (für IEEE 754 float)

275 Übung 3.3IEEE (optional) Betrachten sie das Programm konvd auf der GDI-Website (www.prof-kneisel.de -> Lehre -> GDI (Tabelle: Sonstiges)) 1.Bestimmen Sie (durch Ausprobieren) 1.Vorzeichenbit, 2.Exponentenbits, 3.Mantissenbits 4.Bias Für die Datentypen a.Extended b.Double c.Currency d.Single Bemerkung: Die im Programm konvd dargestellten Werte entsprechen den Binärrepräsentationen von Borlands Delphi-Datentypen.

276 Übung 4.1Strukturierte Datentypen 1.Formen Sie die Kneisel-Notation und die Beispiele aus Kapitel 4.3 in C++ - Notation um. 2.Beschreiben Sie Gemeinsamkeiten und Unterschiede von Datenstruktur, Datentyp und Variable. 3.Was sind die Vor- und Nachteile von Arrays gegenüber verketteten Listen 4.Definieren Sie einen Datentyp für das Objekt Schachspiel. Berücksichtigen Sie dabei z.B. die Namen der Spieler, alle Züge, den Gewinner,... 5.Betrachten Sie den Stundenplan auf meiner Homepage 1.Skizzieren Sie einen Datentyp für das Objekt Stundenpläne 2.Welchen Speicherplatz benötigt eine Variable dieses Typs ? 3.An welchen Stellen sehen Sie Alternativen zu Ihrer Typdefinition ?

277 Übung 4.2Abstrakte Datentypem 1.Definieren Sie den Datentyp für eine a.einfach verkettete Liste (die Datenwerte seien vom Typ: integer) b.doppelt verkette Liste (die Datenwerte seien vom Typ: integer) 2.Definieren Sie den Datentyp für ein beliebiges Netz - siehe Bild der Datenwert jedes Knotens sei vom Typ integer die maximale Anzahl von Nachfolgeknoten sei begrenzt)...

278 Übung 5.1Schleifen 1.Konstruieren Sie (beliebig) und wandeln Sie um... 1.eine While-Schleife in eine Do-While-Schliefe 2.eine Do-While-Schleife in eine While-Schleife 3.Formulieren Sie Ihr Vorgehen für allgemeine While- und Do-While- Schleifen, mit Bedingungen B und Aktionen.A. 2.Betrachten Sie Ihre konstruierte While-Schleife 1.Wandeln Sie diese in einen Algorithmus mit Sprung-Befehlen um. 2.Formulieren Sie Ihr Vorgehen für allgemeine While-Schleifen, mit Bedingungen B und Aktionen.A. 3.Betrachten Sie Ihre konstruierte Do-While-Schleife. 1.Wandeln Sie diese in einen Algorithmus mit Sprung-Befehlen um. 2.Formulieren Sie Ihr Vorgehen für allgemeine Do-While-Schleifen, mit Bedingungen B und Aktionen.A.

279 Übung 5.2Spiel des Lebens Das Spiel des Lebens findet in einer Welt statt, die einfachen Regeln gehorcht. Die Welt besteht aus einem unendlich großen Schachbrett in dessen Feldern primitive Tierchen, die Nöpel wohnen. Diese sitzen ein Jahr unbeweglich auf ihren Feldern, unterhalten sich mit ihren Nachbarn - es gibt erhitzte Diskussionen, Gedichtvorträge, Tratsch und Klatsch über andere Nöpel, politische Reden, Deklamationen, Verleumdungen und Schmeicheleien. Jedes Jahr genau um 12 Uhr in der Silvesternacht lösen sich Nöbel entweder in Luft auf, bleiben sitzen oder werden aus dem Nichts erschaffen. Dabei schlägt das Schicksal nicht blind zu: Hat ein Nöpel (von acht möglichen) keinen oder nur einen Nachbarn, so stirbt er an Vereinsamung. Hat ein Nöpel vier oder mehr Nachbarn, so stirbt er an Erschöpfung ob der vielen Plaudereien. Überleben tun Nöbel mit zwei und drei Nachbarn. Nöpel werden auf leeren Feldern geboren, wenn dort im Jahr zuvor genau drei Nöpel gelebt haben

280 Übung 5.2Die Generationen 0,1,4,5,6,7,8 2,3 3

281 Übung 5.2Interessante Völker Der Gleiter Der Blinker

282 Übung 5.2Spiel des Lebens 1.Überlegen Sie sich Rahmenbedingungen für das Spiel des Lebens (Anhang B) 2.Formalisieren Sie dieses Problem 3.Stellen sie einen umgangssprachlichen Lösungsansatz auf 4.Formalisieren Sie den Lösungsansatz als Algorithmus 5.Spielen Sie den Algorithmus anhand eines Beispieles durch 6.Bewerten Sie den Algorithmus bezüglich seine Laufzeit und seines Platzbedarfes 7.optional: Programmieren Sie dieses Spiel

283 Übung 5.3Rekursion 1.Programmieren Sie die Fakultätsfunktion 1.Rekursiv 2.Iterativ 3.Ermitteln Sie die Laufzeiten beider Varianten in Abhängigkeit von n und stellen Sie diese tabellarisch dar. 2.Optional: 1.Programmieren Sie für das Weg des Springers-Problem ein Programm mit Backtracking. 2.Entwickeln Sie unterschiedliche Heuristiken zur Realisierung des waehleKandidat-Blockes. 3.Zeigen Sie, durch Berechnung der ersten n Lösungen, welche Heuristik die erfolgreichste ist.

284 Übung 5.4Acht Damen Problem Das acht Damen Problem: Acht Damen sind so auf einem Schachbrett aufzustellen, dass keine Dame eine andere bedroht: Eine mögliche Lösung: Formulieren Sie einen rekursiven Algorithmus zur Lösung des Acht- Damen Problems. Programmieren Sie den Algorithmus

285 Übung 6.1Turing-Maschine 1.Machen Sie sich mit der Funktionsweise des Busy Beaver-Programms vertraut Vollziehen sie die 11 Schritte der ersten Turing-Tabelle. 2.Versuchen Sie sich selbst am Turing Simulator der IGS (Link auf meiner Homepage) 3.Entwerfen Sie eine Turing-Maschine zur Multiplikation zweier natürlicher Zahlen.

286 Übung 6.2 Einfache Verifikation Gegeben ist folgender Algorithmus {a 0, c>0} // Vorbedingung P(a,b,c) a=b; d=b-a; if (c == 0) then d=5; else d=d+1; 1.Geben Sie eine Nachbedingung Q(d) für die Variable d an 2.Beweisen Sie dass sich durch den Algorithmus aus P(a,b,c) diese Nachbedingung Q(d) ableiten lässt 3.Schreiben Sie einen zweiten Algorithmus, der ebenfalls die Nachbedingung Q(d) aus P(a,b,c) ableiten kann 4.Verifizieren Sie Ihren Algorithmus

287 Übung 6.3Denksportaufgabe 1.Gegeben sei folgendes Verfahren In einem Topf seien s schwarze und w weiße Kugeln - insgesamt mindestens eine. Solange mindestens zwei Kugeln im Topf sind, nimm zwei beliebige Kugeln heraus. Falls Sie gleiche Farbe haben, wirf beide weg und lege eine neue schwarze Kugel in den Topf. Falls sie verschiedene Farben haben, wirf die schwarze weg und lege die weiße zurück in den Topf. 1.Welche Farbe hat die letzte Kugel 2.Welche Aussage - die einen Hinweis auf die Antwort gibt - gilt vor, in und nach der Schleife (Invariante) 3.Terminiert die Schleife ? Begründen Sie ihre Antwort.

288 Übung 6.4Invariante 1.Betrachten Sie nochmals das Verfahren aus der vorgegangenen Übung: In einem Topf seien s schwarze und w weiße Kugeln - insgesamt mindestens eine. Solange mindestens zwei Kugeln im Topf sind, nimm zwei beliebige Kugeln heraus. Falls Sie gleiche Farbe haben, wirf beide weg und lege eine neue schwarze Kugel in den Topf. Falls sie verschiedene Farben haben, wirf die schwarze weg und lege die weiße zurück in den Topf. 1.Beschreiben Sie das Verfahren als Algorithmus 1.Das Nehmen dürfen Sie als Block voraussetzen. 1.Entwerfen Sie den Kopf dieses Blocks, 2.Beschreiben Sie seine Parameter 3.beschreiben Sie sein Verhalten in Form einer Vor- und Nachbedingung 2.Bestimmen Sie die Invariante 3.Beweisen Sie die Korrektheit Ihrer Nachbedingung

289 Übung 6.5Vollständige Verifikation 1.gegeben ist der folgende Algorithmus zum schnellen Potenzieren (Legendre Algorithmus) // Vorbedingung P(V): a>0 b 0 x = a; y = b; z = 1; while y > 0 { if odd(y) then z = z*x; y = y div 2; // Ganzzahldivision x = x*x; } 1.Was ist die Nachbedingung dieses Algorithmus 2.Bestimmen die die Schleifeninvariante 3.Beweisen Sie die Korrektheit de Legendre Algorithmus

290 Übung 6.6Schranken 1.Angenommen, Ihr Algorithmus habe einen Aufwand von g(n) = 5n 3 + n für alle n a)Geben sie eine obere Schranke O(g(n)) an. b)Beweisen Sie, dass ihre Schranke tatsächlich eine obere Schranke ist. c)Konstruieren Sie einen Graphen fü die beiden Funktionen g(n) O(g(n) so, dass der Schnittpunkt deutlich wird. d)Geben Sie eine untere Schranke an 2.Sie haben zusätzlich einen Algorithmus mit O(2 n ) Aufwand. Vergleichen Sie diesen Algorithmus mit dem Algorithmus aus 1. a)Welches ist der schnellere Algorithmus ? b)Begünden Sie Ihre Antwort quantitativ

291 Übung 6.7O-Notation 1.gegeben seien folgende Werte: 1,3,4,8,9,15,17,25,28,29,31,36,41,45 a)Zeichnen Sie einen sortierten Baum minimaler Tiefe, der mit den gegeben Werten belegt ist. b)Schreiben Sie einen Algorithmus, der den Baum aufspannt (als Wiederholungs-Übung von Zeigern) c)Gegeben ist der Suchalgorithmus aus Häufige O-Ausdrücke: O(log n). Geben Sie für jeden Wert an, wie oft der Block durchlaufen wird 2.Formulieren Sie einen iterativen Algorithmus mit O(n 4 ) Geben Sie eine kurze rechnerische Begründung für Ihre Antwort

292 Übung 6.8Aufwand 1.Gegeben ist folgender Algorithmus: do (list:*liste) { i:integer; for i=1 to no_of_elements(list) { remove_last_element(list); do (list) // call list with one element less } a)Geben Sie den Aufwand an. b)Belegen Sie Ihre Antwort rechnerisch 2.Gegeben ist folgender Algorithmus for i=1 to n { j=1; while (j

293 Übung 7.1Syntax und Semantik 1.Geben Sie Beispiele für a)lexikalische Strukturelemente b)syntaktische Strukturelemente der Programmiersprache C++ an 2.Formulieren Sie die Semantik a)einer while-Schleife b)eines Unterprogrammaufrufes in C++ 3.recherchieren Sie nach weiteren Programmiersprachen

294 Übung 7.2Reguläre Ausdrücke 1.Geben Sie reguläre Ausdrücke für a)Integerliterale b)Die Schlüsselwort: while, function, if in C++, jeweils in klassischer und in UNIX-Notation an 2.Geben Sie einen regulären Ausdruck zu folgenden Sprachen an: a)Alle Folgen von Großbuchstaben, die jeden Vokal genau einmal in alphabetischer Reihenfolge enthält: Bsp.: SDFKJHZZTADGFPMNBEHGQIQWGFMNOLKHYXUQSKJH b)Alle Dualziffernfolgen, die 001 nicht als Teilfolge enthalten Gegenbsp.: Welche Sprachen sind durch die folgenden regulären Ausdrücke definiert ? a)(0?|1*)* b)(0|1)*0(0|1)(0|1) c)/\*((\*[^/])|[\*])*\*/

295 Übung 7.3Grammatiken 1.gegeben ist folgende Grammatik G: G = { N,T,P,S }, N = { A,B,C,S }, T = { a,b,c }, P = { S := ABC, A := ABA, C := CBC, A := a, B := b, C := c } a)Ist die Grammatik kontextfrei ? Begründen Sie Ihre Antwort b)Beweisen Sie: abababcbc L(G) c)Begründen sie verbal, weshalb b 2 a 2 c 3 L(G) d)Geben Sie einen regulären Ausdruck R an mit L(R) = L(G) e)Welchem Typ der Chomsky-Hierachie entspricht die Sprache, die durch G definiert ist ? f)Ist die Sprache L(G) vom Chomsky-Typ-0 ? Begründen Sie Ihre Antwort

296 Lösung 2.1Information 1.Wieviele Fragen benötigen Sie beim Zahlenraten a)7 b)nächste_ganze_Zahl_größer( ld n) 2.Eine Nachrichtenquelle sendet Zeichen aus dem Alphabet X = {a,b,c,d} mit den Wahrscheinlichkeiten p(a)=1/4, p(b)=p(c)=1/8 a)H(x) = p(x) *h(x) = ((1/4*2)+(1/8*3)+(1/8*3)+(1/2*1)) bit = 1,75 bit b)( ) bit = 9 bit c)4 * 1,75 bit = 7 bit d)1000 * 1,75 bit = 1750 bit e)1000 * H(x) = 1000 * (4 * (1/4 * 2 bit)) = 2000 bit

297 Lösung 2.2Huffmann a)siehe Tabelle rechts: h(x) b)mittlerer Informationsgehalt: H(x) = 4,06 bit Redundanz bei 8bit-Kodierung (z.B. ASCII mit Parity-Bit): R = L-H = 8 bit - 4,06 bit = 3,94 bit r = R/L = 0,49 p(x)(in %)h(x) (in Bit)p(x) * h(x) a6,513,940,2566 b1,895,730,1082 c3,065,030,1539 d5,084,300,2184 e17,402,520,4390 f1,665,910,0982 g3,015,050,1521 h4,764,390,2091 j7,553,730,2814 j0,278,530,0230 k1,216,370,0771 l3,444,860,1672 m2,535,300,1342 n9,783,350,3280 o2,515,320,1334 p0,796,980,0552 q0,0212,290,0025 r7,003,840,2686 s7,273,780,2749 t6,154,020,2474 u4,354,520,1967 v0,677,220,0484 w1,895,730,1082 x0,0311,700,0035 y0,0411,290,0045 z1,136,470,0731

298 Lösung 2.2Huffmann p(x) (in %) a6,51 b1,89 c3,06 d5,08 e17,40 f1,66 g3,01 h4,76 i7,55 j0,27 k1,21 l3,44 m2,53 n9,78 o2,51 p0,79 q0,02 r7,00 s7,27 t6,15 u4,35 v0,67 w1,89 x0,03 y0,04 z1,13 jqpvxy (1,82)kz (2,34)fb qxowmg fjqpvxy (3,48)bkz (4,23)cl qx (0,05)yow (4,40)gm (5,54)uhdt cl (6,50)bfjkqpvxyz (7,71)arsi qxy (0,09)jouw (8,75)dh (9,84)gmt (11,69)n jqxy (0,36)vnouw (18,53)dghmt (21,53) acl (13,01)rs (14,27)bfijkqpvxyz (15,26)e aclrs (27,28)befijkqpvxyz (32,66) abcefijklqprsvxyz (59,94) jqvxy (1,03)pzkdghmntouw (40,06) Die Bezeichnung der Kanten mit 0 oder 1 ist willkürlich o 1 c) Beispiele: a 0101 b c d 1111 e 001 f o o o o 1 1

299 Lösung 2.2Huffmann d)H(x) = 4.,06 bit L = 4,1 bit R = L-H = 0,04 bit e)r = R/L = 0,01 p(x) (in %)l(x)p(x)*l(x) a6,5140,2604 b1,8960,1134 c3,0650,1530 d5,0840,2032 e17,4030,5220 f1,6660,0996 g3,0150,1505 h4,7640,1904 j7,5540,3020 j0,2790,0243 k1,2170,0847 l3,4450,1720 m2,5350,1265 n9,7830,2934 o2,5150,1255 p0,7970,0553 q0,02110,0022 r7,0040,2800 s7,2740,2908 t6,1540,2460 u4,3540,1740 v0,6780,0536 w1,8950,0945 x0,03110,0033 y0,04100,0040 z1,1370,0791

300 Lösung 2.3Hamming 1.Hamming-Distanz bei ASCII-Code a)D=1 b)(D-1) = 0 c)(D-1)/2 = 0 2.Hamming-Codierung für a)D=3 (durch Vergleich der Distanz zwischen allen Codes) b)2-bit Fehler können erkannt werden c)1-bit Fehler können korrigiert werden

301 Lösung 2.3Hamming 3.Betrachten Sie den mit der Hamming-Methode codierten Code für 1000 a) P-Bits falsch=> Fehler bei bit , , , ,2,47 b)Kippen von Bit 1 und Bit 6: ,2,47 es wird ein Fehler erkannt (gut !). Allerdings wird der Fehler bei Bit 7 erkannt, wobei der Code bei der Korrektur also fälschlicherweise zu korrigiert wird, statt zu

302 Lösung 3.1Zahlensysteme 1.Die Duodezimalindianer haben zwölf Finger a)Berechnen Sie nach dem Zahlensystem der Duodezimalindianer die wichtigsten Werte des täglichen Lebens: a) g Pizza b)Eine Flasche Bier (0,6 12 bzw. ca. 0,3B62A68781B Liter) c)ALDI ca. 2,B b)Bin: ,10, , Okt: 4540,40, ,74631 Hex:12C0,80,547AE147AE1452,F333333

303 Lösung 3.1Zahlensysteme 2.Grundrechenarten : = : = *

304 3.0, · 0,1 = 0,2 --> Ziffer: 0 2 · 0,2 = 0,4 --> Ziffer: 0 2 · 0,4 = 0,8 --> Ziffer: 0 2 · 0,8 = 1,6 --> Ziffer: 1 2 · 0,6 = 1,2 --> Ziffer: 1 2 · 0,2 = 0,4 --> Ziffer: 0 2 · 0,4 = 0,8 --> Ziffer: 0 2 · 0,8 = 1,6 --> Ziffer: 1... Also: 0, C 6C E 64 2E ASCII:Der Ball ist rund. LongInt (mit 0en aufgefüllt) Lösung 3.1Zahlensysteme

305 4.Subtraktion durch Addition des Zweierkomplementes (1)0011(1)0010(1) (1)0010(1)0001(1) (1)0001(1) (1) (1)1110(1)1101(1) (1)1101(1)1100(1) (1)1100(1)1011(1)

306 Lösung 3.2Gebrochene Zahlen 3. = 3, = 11, Mantisse Exponent 0, * 2 2 VEEEEEEEEMMMMMMMMMMMMMMMMMMMMMMM Maximalwerte (bei bias = 126): größte negative * kleinste negative = * = kleinste positive = * = größte positive * Numbersignexponent mantissa normalized number0/101 to FEany value denormalized number0/100any value

307 Lösung 3.3IEEE 754

308 Lösung 4.1Strukturierte Datentypen 1. Umformen der Kneisel-Notation - Einfache Datentypen bool switch1; switch1 = false; // = 0 switch1 = switch1 && (!switch1); // = 1 and 0 = 0 int i; i = 1; // = 1 i = i + 32;´ // = = 33 char symbol; symbol = ´A´; // = A symbol = symbol + 32;´ // = A + 32 = a enum ampelfarbe {gruen,gelb,rot}; ampelfarbe = gruen; // = gruen ampelfarbe = ampelfarbe +1 ; ´ // = gruen + 1 = gelb float pi, flaeche, radius; // all real ! pi = 3.141; // needs not to be more accurate radius = 5; // might be changed by user flaeche = 2 * pi * pow(radius,2); // common formula

309 Lösung 4.1Strukturierte Datentypen 1. Umformen der Kneisel-Notation - Strukturierte Datentypen float m[3][2]; float v[4]; v[2] = 5.03; v[3] = 4.12; m[0][1] = v[2] * 12 - v[3]; struct { int tag; int monat; } d ; d.monat = 10; d.tag = 20; struct { char[20] name; enum {m,f} sex; union { int IQ; real muscle; } } adam, eva; typedef struct Datum {int year; enum month {jan,feb,...}; int day; } Akt_Datum; // Akt_Datum hier struct { char[20] surname; char[20] forename; Datum birthday; } Person; // alternativ: Datum Akt_Datum;

310 Lösung 4.1Strukturierte Datentypen 2.siehe Kapitel Arrays verkettete Listen maximale Anzahl der Elementemaximale Anzahl der Elemente ist bekanntist nicht bekannt Elemente nur eines TypsElemente unterschiedlichen erlaubtTyps (einfacher) möglich Belegung des Speicherbereichs fürBelegung nur des tatsächlich maximale Anzahl von Elementenbenötigten Speicherbereiches Einfacher Zugriff über IndexZugriff durch Durchlaufen der Liste Einfache ImplementierungKomplexere Implementierung Sortierung nur durch UmkopierenSortierung durch neue Verkettung möglichmöglich...

311 Lösung 4.1Strukturierte Datentypen 4,5Es gibt (unendlich) viele Lösungen für die Konstruktion einer Datenstruktur, daher sei hier nur eine mögliche Vorgehensweise beschrieben: Suche alle beteiligten Objekte (z.B. durch Brainstorming) Stelle die Objekte zueinander in Beziehung Ist-Teil-von-Beziehung (Aggregation)... (bei OO-Sprachen insb.: Erbt von) Stelle die Wertebereiche fest Gibt es generische Objekte ( = grundlegende Objekte, die z.B. in mehrerern Aggregationen vorkommen, auch in anderen Objekten) Bilde generische Objekte entsprechend Ihrer Aggregationen als Record (oder bei Listenstruktur als Array) ab Bilde das zu modellierende Objekt - auch unter Verwendung der generischen Objekte -als Record (bzw. Liste) ab. Beachte die Vor- und Nachteile dynamischer Strukturen. Eventuell benötigt man aus Effizienzgründen (-> Algorithmik) weitere Hilfsobjekte.

312 Lösung 4.2Abstrakte Datentypen 1.in C++ Notation struct list {int value;struct list{ int value; next *list; }; naxt *list; prev *list; } 2.in C++ Notatioon struct net (int value; next* net[max_succesors]; };...

313 Lösung 5.1Schleifen 1.while (x < 5)if (x < 5) thenwhile Bif B then { do {{do { x = x + 1; x = x + 1; A A }}}} while (x < 5) while B do {x = x + 1;do {A x = x + 1; while (x < 5) { A while B { } x = x + 1;} A while (x < 5)}while B} 2.1: if x >= 5 goto 21: if !B goto 2 x = x + 1; A goto 1 goto 1 2:...2: : x = x + 1; 1: A if x < 5 goto 1 if B goto 1 2:... 2:...

314 Lösung 5.2Spiel des Lebens: Aufgabe 1.Überlegen Sie sich Rahmenbedingungen für das Spiel des Lebens (Anhang B) 2.Formalisieren Sie dieses Problem Gegeben ist: Eine zweidimensionales Spielfeld Annahme:die Grenzen werden verbunden. Auch möglich:Unendliche Grenzen, abschneidende Grenzen Anfangszustand: beliebige Nöpelpositionen im Spielfeld Regeln: entsprechend der Spielregeln für Spiel des Lebens Gesucht: Zwischenzustand nach beliebigen Generation (entsprechend der Regeln) Optional: Erkennung von Endzuständen

315 Lösung 5.2Spiel des Lebens: Ansätze 3.Stellen sie einen umgangssprachlichen Lösungsansatz auf Entwurf der Datenstrukturen - zwei Ansätze: Der Spielfeldzustand wird als zweidimensionales Feld repräsentiert Der Spielfeldzustand wird über die Positionen der Nöpel präsentiert Entwurf des Algorithmus act_state = Startzustand solange kein Endzustand { get_next_state (act_state, next_state); } zwei entsprechende Ansätze: get_next_state (In: act_state, Out: next_state) Der Spielfeldzustand wird als zweidimensionales Feld repräsentiert: { durchlaufe Felder und setze Nöpel entsprechend } Der Spielfeldzustand wird über die Positionen der Nöpel präsentiert: { durchlaufe Nöpelliste und setze Nöpel entsprechend } Vor- / Nachteile ?

316 Lösung 5.2Spiel des Lebens: Feld 3.a) Der Spielfeldzustand wird als zweidimensionales Feld repräsentiert get_next_state (In: act_state, Out: next_state) { // determine survivors durchlaufe act_state // zweifach-verschachtelte Schleife { falls act_state[act_field] hat 2,3 Nachbarn in act_state setze next_state[act_field] } // determine babies durchlaufe next_state // zweifach-verschachtelte Schleife { falls next_state[act_field] hat 3 Nachbarn in act_state setze next_state[act_field] } } 0,1,4,5,6,7,8 2,3 3

317 Lösung 5.2Spiel des Lebens: Liste 3.b) Der Spielfeldzustand wird über die Positionen der Nöpel präsentiert get_next_state (In: act_state, Out: next_state) { durchlaufe act_state // einfache Schleife durch Nöpelliste { // determine survivors find_neighbors(act_nöpel, no_of_neighbors) falls no_of_neighbors = 2 oder 3 kopiere act_nöpel nach next_state // determine babies durchlaufe nachbar_nöpel von act_nöpel // max. 8 { find_neighbors(nachbar_nöpel, no_of_neighbors) falls no_of_neighbors = 3 kopiere nachbar_nöpel nach next_state } } } 0,1,4,5,6,7,8 2,3 3

318 Lösung 5.2Spiel des Lebens: Strukturen 3.Stellen sie einen umgangssprachlichen Lösungsansatz auf Entwurf der Datenstrukturen - zwei Ansätze: Der Spielfeldzustand wird als zweidimensionales Feld repräsentiert act_state: array [1..max_reihen][1..max_spalten] of boolean; Der Spielfeldzustand wird über die Positionen der Nöpel präsentiert typedef struct nöpel {reihe: int; spalte: int ; // next_nöpel: *nöpel } ; act_state: array [1..max_nöpel] of nöpel;

319 Lösung 5.2Spiel des Lebens: Komplexität 6.Bewerten Sie den Algorithmus bezüglich seine Laufzeit und seines Platzbedarfes get_next_state (In: act_state, Out: next_state) { durchlaufe act_state // einfache Schleife durch Nöpelliste { // determine survivors find_neighbors(act_nöpel, no_of_neighbors) // Durchsuche // alle Nöpel falls no_of_neighbors = 2 oder 3 kopiere act_nöpel nach next_state // determine babies durchlaufe nachbar_nöpel von act_nöpel // max. 8 { find_neighbors(nachbar_nöpel, no_of_neighbors) falls no_of_neighbors = 3 kopiere nachbar_nöpel nach next_state } } // Zeit: Nöpel * ( Nöpel + ( 8 * Nöpel ) ) = 9 * Nöpel 2 } // Platz: 2 * Nöpel

320 Lösung 5.3Rekursion 1.Programmieren Sie die Fakultätsfunktion fakultaet (IN: n:integer, OUT: result:integer) { if (n == 0) then result = 1; else { fakultaet (n-1, result); result = result * n; } } fakultaet (IN: n:integer, OUT: result:integer) { result; old_result : int; // declaration result = 1; old_result = 1 // initialization for i=1 to n { result = i * old_result; old_result = result } } // Anzahl Multiplikationen in beiden Fällen proportional n

321 Lösung 5.4Acht Damen Problem 1.siehe Homepage

322 Lösung 6.1.1Turing-Maschine Vollziehen sie die 11 Schritte der ersten Turing-Tebelle. 1,_ 2,1,> 1,1 3,1,< 2,_ 3,1,> 2,1 H,1,> 3,_ 1,1,< 3,1 2,_,< 4,_ H,_,> 4,1 H,_,> Ausgangszustand,Zeichen Folgezustand,schreibeZeichen,Aktion H H State

323 Lösung 6.1.2Turing-Maschine Eingabe der initialen Bandinschrift Eingabe der Turing-Tabelle Zustand x Zeichen Folgezustand x Zeichen x Aktion Beispiel: 1,_ 1,_,>

324 Lösung 6.1.3Turing-Maschine Aufgabenstellung Entwerfen Sie eine Turing-Maschine zur Multiplikation zweier natürlicher Zahlen. Spezifikation Eingabespezifikation Die Zahlen werden durch die entsprechende Anzahl von 1 am Band dargestellt Zwischen den Zahlen befindet sich ein x am Band Hinter der letzten Zahl ist ein =- Zeichen am Band Das restliche Band ist mit 0 beschrieben. Der Schreib/Lesekopf befindet sich links von der 1. Zahl. Ausgabespezifikation Das Ergebnis ist hinter dem =, durch eine entsprechende Anzahl von 1 darzustellen. Beispiel: Die zwei Zahlen 3 und 4 sind mittels eines Turing-Programmes zu multiplizieren

325 Lösung 6.1.3Turing-Maschine Idee: 1.Kopiere alles vor dem = (den 2.Multiplikator) ans Ende 2.Mache dies für jede 1 vor dem X (den 1.Multiplikator) Siehe Anhang C SucheStart0 0R 1SucheZahl20R SucheStartXEndZustandXL SucheZahl21 1R XZahl2StartXR 1GeheEnde0R Zahl2Start=Mach1Aus0=L GeheEnde1 1R =SucheNull=R 1 1R 0HolNaechsten11L 1 1L = =L 0Zahl2Start0R Mach1Aus00 1L XZahl1StartXL 1 1L 0SucheStart0R

326 Lösung 6.2 Einfache Verifikation Gegeben ist folgender Algorithmus {a 0, c>0} a=b; {a=b, b>0, c>0} d=b-a; {d=b-a, a=b, b>0, c>0} {d=0, b>0, c>0} if (c == 0) then {d=0, b>0, c>0, c=0} d=5; {d=5, b>0, falsch} {d=1} // aus falsch lässt sich alles folgern else {d=0, b>0, c>0, c<>0} {d+1=1, b>0, c>0} d=d+1; {d=1, b>0, c>0} {d=1, b>0, c>0} {d=1}

327 Lösung 6.3Denksportaufgabe 1.Denksportaufgabe 1. Welche Farbe hat die letzte Kugel ? Die Farbe der letzten Kugel ist abhängig von der Anzahl der weißen Kugeln: Ist die Anzahl gerade, so ist die letzte Kugel schwarz Ist die Anzahl ungerade, so ist die letzte Kugel weiß 2. Welche Aussage gilt vor, in und nach der Schleife (Invariante) Ist die Anzahl der weißen Kugeln gerade, so bleibt sie gerade Ist die Anzahl der weißen Kugel ungerade, so bleibt sie ungerade Es werden entweder 2 weiße Kugeln entfernt oder keine. 3.Terminiert die Schleife ? Begründen Sie ihre Antwort. JA. Die Anzahl der Kugeln vermindert sich bei jedem Zug um genau eine (nach Algorithmus: 2 nehmen, eine geben). Beim Erreichen von 2 Kugeln wird die Schleife noch einmal durchlaufen und terminiert mit einer Kugel.

328 Lösung 6.4Invariante {s+w >= 1} x=s; y=w; {x=s, y=w, x+y 1} {INV: ( (odd(w) odd(y)) (even(w) even(y)) ) x+y 1 } while (x+y>1) { {INV x+y>1} // Vorbedingung für take: x+y>1 take(a,b) // OUT: a no. black, b no white (drawn) {a+b=2, a,b 0} // = Nachbedingung für take switch a: { // a = no of black bullets drawn case 0: {x=x+1; y=y-2}; {INV} // add black, remove two w. case 1; (x=x-1); {INV} // remove black case 2; (x=x-1); {INV} // remove black } {INV} } {INV x+y>1 ( ((odd(w) odd(y)) (even(w) even(y)) ) x+y 1 x+y 1 ( ((odd(w) odd(y)) (even(w) even(y)) ) x+y=1) }

329 Lösung 6.5Vollständige Verifikation // Vorbedingung P(V): a>0 b 0 x = a; y = b; z = 1; // x=a y=b z=1 x>0 b 0 { INV: z x y =a b y 0 } while y > 0 { {INV y>0 (z*x/x)*x y =a b y>0 } if odd(y) then z = z*x; { odd(y) z/x*x y =a b y>0 z*x y-1 =a b y>0 } // else { even(y) z*x y =a b y>0 } { ( odd(y) z*x (2(y div 2)+1)-1 =a b 2(y div 2)+1>0 ) ( even(y) z*x 2(y div 2) =a b 2(y div 2) >0 ) } y = y div 2; // Ganzzahldivision { ( odd(y) z*x (2y+1)-1 =a b 2y+1>0 z*x 2y =a b 2y 0 ) ( even(y) z*x 2y =a b 2y >0 z*x 2y =a b 2y>0 ) } x = x*x; { (odd(y) z*x y =a b 2y 0) (even(y) z*x y =a b 2y>0) z*x y =a b ((odd(y) 2y 0) (even(y) 2y 0)) z*x y =a b y 0 } } { INV (y 0) (z*x y =a*b) (y=0) z*x 0 =a b = Q(V) }

330 Lösung 6.6.1Schranken 1.g(n) = 5n 3 + n für alle n a)Behauptung: Die Laufzeit von g(n) ist O(n 3 ), also f(n)=n 3, b)Beweis: Es muss Konstanten c und n 0 geben, so dass gilt 5n 3 + n c n 2, für alle n > n 0 setze z.B. n 0 =10 und c=6, dann gilt: n 3 > n gilt für n 11, n 5n 3 + n n n 5n 3 +n 3 = 6n 3 c) d)z.B.: 5n 3 n3n3

331 Lösung 6.6.2Schranken 2.Sie haben zusätzlich einen Algorithmus mit O(2 n ) Aufwand. Vergleichen Sie diesen Algorithmus mit dem Algorithmus aus 1. a)Welches ist der schnellere Algorithmus ? Für kleine n (n<14) ist der Algorithmus mit O(2 n ) der schnellere, ansonsten der mit g(n) = 5n 3 + n b)Begründen Sie Ihre Antwort quantitativ 2n2n

332 Lösung 6.7.1O-Notation 1.gegeben seien folgende Werte: 1,3,4,8,9,15,17,25,28,29,31,36,41, node: array[1..14] of knoten; // Normalerweise wird der Speicher dynamisch allokiert node[1].value = 17;node[12].value = 41; node[1].left = &node[2];node[12].left = &node[13]; node[1].right = &node[3];node[12].right = &node[14]; node[2].value = 8;node[13].value = 36; node[2].left = &node[4];node[13].left = nil; node[2].right = &node[5];node[13].right = nil; node[3].value = 31; node[14].value = 45; node[3].left = &node[6]; node[14].left = nil; node[3].right = &node[7]; node[14].right = nil;... Anzahl Aufrufe

333 Lösung 6.7.2O-Notation 2.Formulieren Sie einen iterativen Algorithmus mit O(n 4 ) for (i=1 to n) { for (j=1 to n) { for (k=1 to n) { for (l=1 to k) { // Statements } } } } Aufwand : n n (n(n+1))/2 = n 2 (n 2 /2+n/2)= n 4 /2 + n 3 /2 Laufzeit O(n 4 )

334 Lösung 6.8Aufwand 1.do (list:*liste) { i:integer; for i=1 to no_of_elements(list) { remove_last_element(list); do (list) // call list with one element less } Zeitbedarf: T n = n T n-1 (T n = Zeitbedarf für n, n 2, T 1 =1) T n =n T n-1 = n (n-1) T n-2 = n (n-1) (n-2) T n-3 =... = n T n = n! Laufzeit O(n!) (wirklich viel! Algorithmus inpraktikabel) 2.for i=1 to n { j=1; while (j

335 Lösung 7.1Syntax und Semantik 1.Geben Sie Beispiele für a)lexikalische Strukturelemente:Bezeichner, Literale, Schlüsselworte,... b)syntaktische Strukturelemente:Alle Elemente aus Algorithmenentwurf der Programmiersprache C++ an 2.Formulieren Sie die Semantik a)einer while-Schleife: siehe Schleife mit vorausgehender Prüfung b)eines Unterprogrammaufrufessiehe Block 1.recherchieren Sie nach weiteren Programmiersprachen Algol 60, Algol 68, Forth, PL/1, Fortran, Smalltalk, Simula 67, SETL, Snobol, Cobol, Pascal, Turbo-Pascal, DELPHI, Concurrent Pascal, SPSS, CLU, Alphard, SDL, Oberon, Oberon-2, Object Cobol, Ada, APL, CDL 2, Ada 95, Mesa, Modula-2, Chill, BCPL, C, Objective-C, Modula-3, C++,,Assemblersprachen, Prolog, Prolog II, Eiffel, Beta, Opal, CS,P Hope, Miranda, Lisp, Common Lisp, PHP, Perl, Scheme, Haskell, Standard ML, Clipper, Basic, Visual Basic, Java, JavaScript, SQL, Late,x Postscript, HTML, UML, Z, Act-One, VDM, awk, LEX, YACC, Maschinensprachen, RPG, Occam, Linda, T Lotus, OPS-5,... werden Sie zu Meta-Programmierern und -Programiererinnen

336 Lösung 7.2Reguläre Ausdrücke 1.Geben Sie reguläre Ausdrücke für a)Integerliterale:[1-9][0-9]* bzw. (1|2|3|4|5|6|7|8|9)(o|1|2|3|4|5|6|7|8|9)* b)while, function, ifwhile usw. bzw. while usw. 2.Geben Sie einen regulären Ausdruck zu folgenden Sprachen an: a)Alle Folgen von Großbuchstaben, die jeden Vokal genau einmal in alphabetischer Reihenfolge enthält: KONS = [B-DF-HJ-NP-TV-Z] {KONS}A{KONS}E{KONS}I{KONS}O{KONS}U{KONS} b)Alle Dualziffernfolgen, die 001 nicht als Teilfolge enthalten (0?1+)*0* 2.Welche Sprachen sind durch die folgenden regulären Ausdrücke definiert ? a)(0?|1*)*alle Binärzahlen, denn (0|1) ist Teilmenge von (0?|1*) b)(0|1)*0(0|1)(0|1)alle Binärzahlfolgen, bei denen die drittletzte Ziffer existiert und 0 ist c)/\*((\*[^/])|[\*])*\*/wohlgeformte C-Kommentare

337 Lösung 7.3Grammatiken 1.gegeben ist folgende Grammatik G: G = { N,T,P,S }, N = { A,B,C,S }, T = { a,b,c }, P = { S := ABC, A := ABA, C := CBC, A := a, B := b, C := c } a)Die Grammatik ist kontextfrei, da auf der linken Seite aller Regeln genau ein Nichtterminalsymbol steht b)Beweis durch Ableitung : S ABC ABABC ABABABC ABABABCBC... : abababcbc c)Es gibt keine Regel, die ein b vor ein a produziert, daher ist b 2 a 2 c 3 L(G), denn in b 2 a 2 c 3 ist ein b vor einem a. d)(ab)+c(bc)* e)Da die Grammatik G kontextfrei ist die Sprache vom Chomsky-Typ-2. Da sich die Sprache auch als regulären Ausdruck darstellen lässt, ist die Sprache sogar Chomsky-Typ 3. f)Ja, denn jede Chomsky-Typ2 bzw. 3 Sprache ist auch vom Chomsky-Typ0

338 Beispielklausur In diesem Kapitel wird ein Beispiel für eine Klausur vorgestellt. Dabei sind jeweils die Aufgaben und die Lösungen gegeben. Beachten Sie Diese Beispielklausur erhebt weder in Form, Inhalt noch Umfang einen Anspruch auf Vollständigkeit.- dies betrifft insbesondere reine Wissensfragen, die hier etwas vernachlässigt sind. Grundsätzlich ist der gesamte in der Vorlesung und den Übungen behandelte Stoff möglicher Gegenstand der Prüfung Vorbereitung Arbeiten Sie die gesamten Folien nochmals durch Bearbeiten Sie alle Übungsaufgaben nochmals Arbeiten Sie das Skript von Herrn Geise durch Bearbeiten Sie dessen Übungsaufgaben Bedenken Sie: In der Klausur sind keine Hilfsmittel zugelassen.

339 Informatik Fehlt in dieser Beispielklausur a)...

340 Information Eine Nachrichtenquelle sendet Zeichen aus dem Alphabet X = {a,b,c,d,e} mit den Wahrscheinlichkeiten p(a)=1/2, p(b)=p(c)=p(d)=p(e)=1/8 a)Wie groß ist der Informationsgehalt der einzelnen Zeichen b)Wie groß ist der Informationsgehalt der Nachricht abc c)Wie groß ist der mittlere Informationsgehalt einer Nachricht mit 1000 Zeichen d)Finden Sie einen möglichst optimalen Code für dieses Alphabet e)Angenommen die Wahrscheinlichkeiten wären p(b)=1/2, p(a)=p(c)=p(d)=p(e)=1/8. Wie groß wäre dann die Redundanz Ihres Codes aus Aufgabe d) Hamming a)Codieren Sie die Binärzahl 1000 mit der Hamming-Methode b)Wieviele Bits können als fehlerhaft erkannt werden ? c)Wieviele Bits können korrigiert werden ?

341 Zahlensysteme Stellen Sie die Dezimalzahl 7,25 a)Binär b)Hexadezimal c)Oktal dar Berechnen Sie im Binärsystem (mit Vollständiger Rechnung) a) : 101 b)Machen Sie schriftlich die Gegenprobe (auch im Binärsystem) c)10111 – 1010 (durch Addition des Zweierkomplements)

342 Zahlensysteme Fehlt in dieser Beispielklausur: a)Gleitpunktzahlen b)IEEE 754 c)...

343 Datenstrukturen Gegeben ist folgende Struktur a)Definieren Sie Datenstrukturen, mit denen diese Struktur einer zweifach verketteten Liste repräsentiert werden kann. b)Begründen Sie, weshalb diese Datenstruktur als dynamisch bezeichnet wird (im Gegensatz zu statisch) c)Geben Sie jeweils zwei Gründe für die Verwendung dynamischer bzw. statischer Datentypen an. d)Definieren Sie statische Datenstrukturen, mit denen man die oben aufgezeichnete Struktur möglichst vollständig abbilden kann. Vorname Nachname Vorname Nachname Vorname Nachname...

344 Algorithmenentwurf Gegeben ist folgender Algorithmus: x=a, y=5; while (x>0) { y = y+1; x = x-1; } a)Formen sie die while Schleife in eine repeat-Schleife um b)Bilden Sie die Funktion dieses Algorithmus ohne Schleifen, mit Hilfe von Sprüngen und Marken nach

345 Algorithmenentwurf Fehlt in dieser Beispielklausur: a)Weitere Umformungen b)Blockung c)Umwandlung Rekursion/Iteration d)...

346 Berechenbarkeit Beweisen Sie mit Hilfe einer Turing-Maschine, dass f: N N mit: f(x) ist Binärkomplement von x berechenbar ist. a)Geben Sie dabei an: Alphabet Bandinschrift (mit Codierverfahren) Kopfposition Zustände (mit dem Startzustand und den Endzustände) Zustandsübergänge b)Zeichen Sie für eine Zahl das Turingband vor- und nach Ausführung des Turingprogrammes

347 Korrektheit Tausch zweier Variablen a)Entwerfen Sie einen Algorithmus zum Vertauschen der Werte zweier Variablen (vom Typ integer) Vorbedingung:x=a, y=b Nachbedingung:x=b, y=a b)Beweisen Sie die Korrektheit Ihres Algorithmus Gegeben sei folgender Algorithmus: x=3, y=5; while (x>0) { y = y+1; x = x-1; } a)Was macht dieser Algorithmus ? b)Beweisen Sie Ihre Antwort für Frage a) mit Hilfe der Hoare'schen Logik

348 Komplexität Fehlt in dieser Beispielklausur: a)Fragen zu den Konstanten c und n 0 b)Beispiele für O(...) c)Bestimmung des Aufwandes für iterativen/rekursiven Algorithmus d)...

349 Reguläre Ausdrücke gegeben ist folgender regulärer Ausdruck R (in UNIX-Notation): [abc]*d[abc]+ (mit Alphabet = {a,b,c,d} ) a)formulieren Sie den Ausdruck in die klassische Notation für reguläre Ausdrücke um. b)Geben Sie 2 Worte aus L(R) deren Länge jeweils genau 10 Zeichen betragen c)Geben Sie zwei Worte aus * an, die nicht in L(R) sind d)Konstruieren Sie einen indeterministischen endlichen Automaten A mit L(A)=L(R) Konstruieren sie reguläre Ausdrücke (in UNIX-Notation) für a)Hexadezimalzahlen b)Eigennamen bestehend aus optionalen Titeln, Vor- und Nachnamen (eventl. Doppelnamen, keine Beachtung von Umlauten) Beispiele.: Prof. Dr. Peter Kneisel, Sabine Mustermann, Dr. Kloebner, Karl- Heinz Müller-Lüdenscheid) c)Lall-Sprache: Bestehend aus ls, die durch Vokale miteinander-Verbunden sind Beispiele: lal, lala, lelalilu, lelelalal

350 Endliche Automaten Gegeben ist folgender endlicher Automat A a)Von welchem Typ ist dieser Automat: Ist dies ein NEA oder ein DEA, begründen Sie Ihre Antwort b)Formen Sie den Automaten in den anderen Typ so um, dass immer noch die gleiche Sprache akzeptiert wird. c)Welches sind die Symbole, die der Automat verarbeitet ? d)Geben Sie die Übergangsfunktion an e)Formulieren Sie einen regulären Ausdruck R mit L(R) = L(A) z1z1 z0z0 a b z3z3 z2z2 a b

351 Grammatiken Fehlt in dieser Beispielklausur

352 Lösung: Information Eine Nachrichtenquelle sendet Zeichen aus dem Alphabet X = {a,b,c,d,e} mit den Wahrscheinlichkeiten p(a)=1/2, p(b)=p(c)=p(d)=p(e)=1/8 a)h(a) = -ld(1/2) = 1bit. h(b)=h(c)=h(d)=h(e)=-ld(1/8)=3bit b)1bit + 3bit + 3bit = 7 bit c)1000 x Mittlerer Informationsgehalt: H(x)= p(x i )h(x i ) = 1000 x ( 1/2x1 + 1/8x3 + 1/8x3 + 1/8x3 + 1/8x3 )bit = 1000 x 2bit = 2000 bit d)Nach Huffmann: p(de)=1/4, p(bc)=1/4, p(debc)=1/2, p(a)=1/2). p(abcde)=1 also z.B.: a=1, b=000, c=001, d=010, e=011 e)Redundanz = L(x)-H l(x)=1bit, l(b)=l(c)=l(d)=l(e)=3bit (entsprechend der Codierung in d.) L(x) = p(x i )l(x i ) = (0,125x1 + 0,5x3 + 0,125x3 + 0,125x3 + 0,125x3)bit = 2,75 bit h(b) = 1bit, h(a)=h(c)=h(d)=h(e)=-ld(1/8)=3bit H(x) = p(x i )h(x i ) = (0,5x1 + 0,125x3 + 0,125x3 + 0,125x3 + 0,125x3 )bit = 2 bit Redundanz = L(x)-H = 2,75bit – 2bit = 0.75 bit Hamming a)100P0PP (Relevant: Bit 3,5,7) 100P0P1 (even Parity: also 1 ergänzen) 100P0P1 (Relevant: Bit 3,6,7) 100P011 (even Parity: also 1 ergänzen) 100P011 (Relevant: Bit 5,6,7) (even Parity: also 1 ergänzen) b)Der Hamming-Abstand D ist 3bit, es können D-1 = 2bit Fehler erkannt werden c)Es können (D-1)/2 = 1bit Fehler korrigiert werden.

353 Lösung: Zahlensysteme Dezimalzahl 7,25 a)Vorkommateil:Nachkommateil 7 : 2 = 3 Rest: 12 · 0,25 = 0,5 --> Ziffer: 0 3 : 2 = 1 Rest: 12 · 0,5 = 1 --> Ziffer: 1 1 : 2 = 0 Rest: 1 -> 111->0,01 Binärz ahl: b)0111, = 7,4 16 (7 * * ) c)111,010 2 = 7,2 8 (7 * * 8 -1 ) Berechnung : 101 = x – auf gleiche Längenbringen Binärkomplement = Lösung: 1101 Überlauf weggelassen

354 Lösung: Datenstrukturen Doppelt verkettete Liste a)Person : record { vorname : array[1..64] of char; nachname: array[1..64] of char; prev : *Person; next : *Person; } b)Man kann aus diesen Strukturen beliebig lange Ketten von Personen bilden c)Pro: Dynamisch: Verwaltung von Objekten, deren Anzahl zur Entwicklungszeit nicht bekannt ist. Speicherverbrauch nur für die Objekte, die tatsächlich zur Laufzeit existieren. Pro Statisch: Einfach in der Realisierung, schnell in der Bearbeitung (Fehlerunanfälliger) d)Person : record { vorname : array[1..64] of char; nachname: array[1..64] of char; } Personeliste: array[ ] od Person;

355 Lösung: Algorithmenentwurf Umformung der while-Schleife: a)Als repeat-Schleife: x=a; y=5; if (x>0) { repeatdo {{ y = y+1; y = y+1; x = x–1; x = x-1; } until (x<=0)} while (x<=0} } b)Sprünge und Marken x=a; y=5; x=a; y=5; 1: if (x 0) y = y+1; { x = x–1; y = y+1; goto 1; x = x–1; 2:... goto 1 } 2:...

356 Lösung: Berechenbarkeit Definiere eine Turing-Maschine, die beliebige binäre Ziffernfolgen bitweise invertiert. Die Turing-Maschine: Alphabet :{_,0,1}, Bandinschrift:Zahl, codiert als Binärzahl, alles andere _ Kopfposition:links neben der Binärzahl Zustände:{q 0, q 1,q 2 }, Startzustand. q 0, Endzustände:{q 2 } Zustandsübergänge:A Q A Q {r, l} _,q 0 _,q 0,r 0,q 0 1,q 1,r 1,q 0 0,q 1,r 0,q 1 1,q 1,r 1,q 1 0,q 1,r _,q 1 _,q 2,r Das Turing-Band vor und nach Abarbeitung des Turing-Programmes für die Zahl:

357 Lösung: Korrektheit a) und b) z : integer { x=a,y=b } z=y; {x=a,y=b,z=b} y=x; {x=a,y=a,z=b} x=z; {x=b,y=a,z=b x=b,y=a} q.e.d Beweis durch Anwendung der Hoareschen Logik: a)Der Algorithmus liefert für y den Wert 8 Nachbedingung Q: (y=8) b)x=3, y=5; {x=3, y=5} { INV: y=8-x x 0 } while (x>0) { { INV x>0 (y+1)-1=8-x x 0 x>0 } y = y+1; { y-1=8-x x 0 x>0 y=9-((x-1)+1) (x-1)+1>0 } x = x-1; { y=9-(x+1) x+1>0 y=8-x x 0 INV } } { INV x 0 y=8-x x=0 y=8 = Q } q.e.d.

358 Lösung: Reguläre Ausdrücke gegeben ist folgender regulärer Ausdruck R (in UNIX-Notation): [abc]*d[abc]+ (mit Alphabet = {a,b,c,d} ) a)(a|b|c)*d(a|b|c)(a|b|c)* b)abcabcdabc c)abddab. abcabcaabbccd d)NEA: z.b. Konstruieren sie reguläre Ausdrücke (in UNIX-Notation) für a)[1-9A-F][0-9A-F]* b)(Prof\.)?(Dr\.)?([A-Z][a-z]*(\-[A-Z][a-z])?)? ([A-Z][a-z]*(\-[A-Z][a-z])?) c)VOKAL = [AEIOU] l( l)* ? z1z1 z0z0 a,b,c, z4z4 d z3z3 a,b,c

359 Lösung: Endliche Automaten Gegeben ist folgender endlicher Automat A a)Dies ist ein indeterministischer endlicher Automat, da es einen -Übergang gibt. b)NEA DEA, z.b.: c)a,b d) = { (z 0, a, z 1 ), (z 1, b, z 0 ), (z 1,, z 1 ), (z 2, a, z 3 ), (z 3, b, z 2 ) } e)a(ba)*a(ba)* a z1z1 z0z0 b z3z3 z2z2 a b a z0z0 b z3z3 z2z2 a b a z2z2


Herunterladen ppt "Grundlagen der Informatik Prof. Dr. Peter Kneisel."

Ähnliche Präsentationen


Google-Anzeigen