Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Basisinformationstechnologie HK-Medien

Ähnliche Präsentationen


Präsentation zum Thema: "Basisinformationstechnologie HK-Medien"—  Präsentation transkript:

1 Basisinformationstechnologie HK-Medien
Teil 1 – 2.Sitzung WS 02/03 BIT – Schaßan – WS 02/03

2 Ermitteln der GPZ Darstellung der Zahl x als 32-Bit GPZ:
Finde Zahlen m, e mit |x|=(1+m)*2e mit 0 ≤ m < 1 Codiere Vorzeichen V (0 für positiv, 1 für negativ) Codiere Mantisse m in 23 Bit  vorderstes Bit mit Wertigkeit 2-1, letztes mit Wertigkeit 2-23  falls Zahl nicht exakt codierbar, finde die in der Zahl m nächstmögliche Codierung BIT – Schaßan – WS 02/03

3 Ermitteln der GPZ (2) Codiere den Exponenten e in 8 Bit als natürliche Zahl e' mit Wert e' = e + 127 Ordne die Bits in der Reihenfolge Vorzeichen Exponent Mantisse an. BIT – Schaßan – WS 02/03

4 Beispiel GPZ Die Darstellung der Zahl –3,5: Setze v=1
|-3,5| = 3,5 = 1,75 * 2 = (1 + 0,75) * 21 Setze m=0,75, e=1 e = 1  e' = = 128 = ( )2 m = 0,75 = 0,5 + 0,25 = = ( )2 Das Ergebnis: ( )2 BIT – Schaßan – WS 02/03

5 Beispiel GPZ (2) Alternativer Weg:
Konvertierung des ganzzahligen Anteils: 3 = (11)2 Gebrochener Anteil: sukzessives Multiplizieren mit 2, wenn Ergebnis größer 1, dann 1 subtrahieren, solange wiederholen, bis Ergebnis = 0. 0,5 * 2 = 1  1 subtrahieren Festkomma-Darstellung: (11,1)2 BIT – Schaßan – WS 02/03

6 Beispiel GPZ (3) Normalisieren: 1,11 * 21
Mantisse m auffüllen mit Nullen m = ( )2 BIT – Schaßan – WS 02/03

7 Sonderfälle der Darstellung
Exponent e Codierung Exponent e' Mantissenwert m Interpretation -127 ±0 ≠0 0,m * 2-126 m 1,m * 2e 128 ±∞ NaN NaN = not a number BIT – Schaßan – WS 02/03

8 Normierte Gleitpunktzahl
Es soll für jede darstellbare Zahl genau eine Darstellung als GPZ existieren.  eindeutige Darstellung durch Normierung  allgemeine Darstellung nach IEEE: (-1)V * (1 + m1* mn*2-n) * 2E BIT – Schaßan – WS 02/03

9 Vorteile normierter GPZ
eindeutige Darstellung Die Mantissenbits können optimal ausge-nutzt werden, was besonders bei unend-lich vielen Nachkommastellen eine höhere Rechengenauigkeit ermöglicht. Rechenfehler (codiert als NaN) können genauer spezifiziert werden (Aufgabe des Betriebssystems oder Programms) BIT – Schaßan – WS 02/03

10 Probleme normierter GPZ
Problem: manche Zahlen sind als normierte GPZ nicht darzustellen Beispiel: 0,1 formal ist 0 nicht darstellbar, weshalb die kleinste darstellbare Zahl als 0 interpretiert wird. V (1 Bit) E (8 Bit) Mantisse M (23 Bit) Zahlenwert 0, 0, BIT – Schaßan – WS 02/03

11 Probleme normierter GPZ (2)
Rechnungen mit nicht darstellbarem Ergebnis liefern ein falsches (ungenaues) Ergebnis = 224 Die Zahlen des Zahlenstrahls sind ungleich verteilt, da für kleinere Zahlen mehr Nachkommastellen zur Verfügung stehen bei größeren Zahlen die Wertigkeit der letzten Bits der Mantisse zunimmt Das Ergebnis einer Rechnung muss selbst wieder normiert werden. BIT – Schaßan – WS 02/03

12 Vergleich zweier GPZ Welche GPZ ist größer?
a) b) B ist größer, denn das Vorzeichen ist positiv! a) b) A ist größer, denn es hat den größeren Exponenten! a) b) A ist größer, denn es hat die größere Mantisse! BIT – Schaßan – WS 02/03

13 Vergleich zweier GPZ (2)
Vergleiche können bit-weise durchgeführt werden: mit Ausnahme des Vorzeichen-Bits ist die Zahl die kleinere, die an der ersten verglichenen Bitposition eine 0 stehen hat. (Quelle: BIT – Schaßan – WS 02/03

14 Textkodierung: ASCII Um Text zu kodieren, hat sich in zuerst der "American Standard Code for Information Interchange" durchgesetzt ASCII-Zeichen sind mit 7 Bit kodiert. Dies sind die Zeichen von bis Die 128 verschiedenen Zeichen, die mit 7 Bit darstellbar sind, reichten aus, um das Alphabet, die Ziffern, Satz-, Sonder- und Steuerzeichen zu kodieren. BIT – Schaßan – WS 02/03

15 Textkodierung: ASCII (2)
ASCII 0 bis ASCII 31 und ASCII 127 sind Signal- und Steuerzeichen In einfachen Texteditoren kann man diese Steuerzeichen mit Ctrl-/Strg-[A-Z] erzeugen. Ctrl H = ASCII 8 = Backspace Ctrl I = ASCII 9 = Tabulator Ctrl M = ASCII 13 = Carriage Return BIT – Schaßan – WS 02/03

16 Textkodierung: ASCII (3)
Klein- und Großbuchstaben sind in alphabetischer Reihenfolge angeordnet, die Ziffern 0 bis 9 stehen in der natürlichen Reihenfolge 0 = ASCII 48 A = 65 a = 97 1 = ASCII 49 B = 66 b = = ASCII 57 Z = 90 z = 122 BIT – Schaßan – WS 02/03

17 Textkodierung: ASCII (4)
Das achte Bit wird als Kontrollbit bei der Datenübertragung benutzt: je nachdem, ob die Anzahl der Einsen in dem darzustellenden Zeichen gerade (even) oder ungerade (odd), wurde das erste Bit auf 0 oder 1 gesetzt, um eine gerade Anzahl Einsen in dem Byte zu erhalten (even parity). BIT – Schaßan – WS 02/03

18 Extended-ASCII: ANSI Aufgrund verbesserter Qualität der Daten-übertragung wurde das Kontrollbit über-flüssig, das achte Bit wurde frei für die Nutzung zur Kodierung von Zeichen. Das American National Standard Institute (ANSI) legte den Zeichensatz fest, der 8 Bit kodierte Zeichen verwendet. Internationaler Standard: ISO 6937/2 aber auch: ANSI-Zeichensatz BIT – Schaßan – WS 02/03

19 ASCII-Erweiterungen Der Bereich ASCII 0 bis 127 bleibt unverändert.
Der Bereich ASCII 128 bis ASCII 255 wird für sprachspezifische Zeichen benutzt. ä = ASCII 132 ö = ASCII 148  "extended ASCII" ü = ASCII 129 BIT – Schaßan – WS 02/03

20 ASCII-Erweiterungen (2)
Die Zeichen der Erweiterung können mit Hilfe von Alt und der Eingabe der Ziffer auf der numerischen Tastatur erzeugt werden. Erweiterungen, die 8 Bit verwenden, wurden durch die International Organization for Standardization (ISO) normiert: ISO = Latin-1 Erweiterung für Westeuropa ISO = Latin-2 Erweiterung für Osteuropa BIT – Schaßan – WS 02/03

21 Unicode Unicode soll die Probleme um unterschiedliche Zeichensätze beheben: es verwendet eine 16 Bit Kodierung. Mit 16 Bit können Zeichen und damit (fast) alle landesspezifischen Zeichen dargestellt werden. Die Zeichen 32 bis 126 entsprechen der ASCII-Nummerierung, die nächsten 128 Zeichen der ISO-Latin 1 Kodierung. BIT – Schaßan – WS 02/03

22 UCS Unicode ist als Universal Character Set (UCS) bzw. ISO normiert. ISO hat allerdings neben der 16-Bit-Kodierung (UCS-2) auch die 31-Bit-Kodierung vorgesehen, was wiederum zu Kompatibilitätsproblemen führt BIT – Schaßan – WS 02/03

23 UTF-8 Als kompaktere Kodierung wurde UTF-8 als Anhang R zur ISO bzw. als RFC2279 standardisiert. UTF = UCS Transformation Format RFC = request for comment UTF-8 ist eine Mehr-Byte-Kodierung: 7 Bit ASCII Zeichen werden mit einem Byte kodiert, alle anderen mit 2 bis 6 Byte BIT – Schaßan – WS 02/03

24 UTF-8 (2) Jedes mit einer 0 beginnende Byte ist ein 7 Bit ASCII-Zeichen. Jedes mit einer 1 beginnende Byte ist ein aus mehreren Bytes bestehender UTF-8 Code. Besteht ein UTF-8 Code aus n ≤ 2 Bytes, dann beginnt das erste Byte mit n Einsen, und jedes n-1 folgende Byte mit der Bitfolge 10. BIT – Schaßan – WS 02/03

25 UTF-8 (3) 0xxx xxxx = 7 Bit ASCII Zeichen
110x xxxx 10xx xxxx = 2 Byte Code 1110 xxxx 10xx xxxx 10xx xxxx = ermöglicht die Kodierung aller 16 Bit UCS-2 Codes usw. x 10xx xxxx 10xx xxxx 10xx xxxx 10xx xxxx 10xx xxxx 10xx xxxx = ermöglicht die Kodierung aller 31 Bit UCS-4 Codes BIT – Schaßan – WS 02/03

26 Codepages Zeichentabelle, die im Computer Text-Zeichen für eine bestimmte Sprache bereitstellt. Codepages werden auf Betriebssystem-Ebene gebraucht. extended ASCII = Codepage 437 ISO Latin-1 = Codepage 850 ISO Latin-2 = Codepage 852 griech. Zeichen = Codepage 1253 BIT – Schaßan – WS 02/03

27 EBCDIC Extended Binary Coded Decimal Interchange Code
Von IBM entwickelt, vor allem für Großrechner (Mainframes) EBCDIC und ASCII sind inkompatibel! BIT – Schaßan – WS 02/03

28 Probleme der Erweiterungen
Wenn Rechner Daten austauschen und nicht dieselben ASCII-Erweiterungen einsetzen, werden die Zeichen der Erweiterungen nicht korrekt dargestellt. Im schlimmsten Fall geht das erste Bit jedes Bytes verloren. Problematische Anwendungen sind s oder Programme. BIT – Schaßan – WS 02/03

29 Sonderzeichen in HTML Für die Übertragung und Darstellung im Internet werden Sonderzeichen (auch: diakritische Z.) als sog. entities kodiert. ä = ä Ä = Ä ö = ö Ö = Ö ß = ß č = &ccaron; BIT – Schaßan – WS 02/03

30 UUencode Unix to Unix Encoding
Verfahren zur Kodierung von Binär-Dateien als ASCII-Text. Gegenstück: "uudecode" BIT – Schaßan – WS 02/03

31 MIME Multipurpose Internet Mail Extensions
Standard-Verfahren, das es erlaubt, beliebige Dateien zusammen mit einer als deren Anhang (Attachment) zu übertragen. Binäre Übertragung der Dateien, ohne Umwandlung in ASCII BIT – Schaßan – WS 02/03

32 Literatur Gleitpunktzahlen: lehre/SWT/etc/3.pdf Zeichenkodierung: BIT – Schaßan – WS 02/03

33 Logische Werte Logische Werte sind die Wahrheitswerte Wahr (true, T) und Falsch (false, F) Die Wahrheitswerte können zu booleschen Verknüpfungen verbunden werden: NOT (Negation oder Komplement) AND (Konjunktion) OR (Disjunktion) XOR (exklusives OR) BIT – Schaßan – WS 02/03

34 Verknüpfungstabellen
Durch Wertetabellen lassen sich die Wahrheitswerte feststellen: NOT: ¬F = T NOT F T BIT – Schaßan – WS 02/03

35 F wird mit 0 und T mit 1 repräsentiert.
AND, OR, XOR AND F T OR F T XOR F T F wird mit 0 und T mit 1 repräsentiert. Weil der Computer aber mit Byte als kleinster Einheit arbeitet, wird F = und T = BIT – Schaßan – WS 02/03


Herunterladen ppt "Basisinformationstechnologie HK-Medien"

Ähnliche Präsentationen


Google-Anzeigen