Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards
Nicht kodierte Charset Standards Existierten meistens schon lange bevor kodierte Charsets entstehen (oder sogar deren Konzept) Dienen der Beschränkung und Standardisierung der Zahl der sich in Gebrauch befindlichen chinesischen Zeichen Didaktische Intention
Hanzi in China Standardliste (7000) Darunter: Grundschule (2500) Mittelschule (1000) Zusätzlich: Liste vereinfachter Zeichen (2249)
Hanzi in Taiwan Grundliste (4808) Ergänzungsliste (6341) Liste seltener Hanzi (18480) Liste mit Hanzi-Varianten (18609)
Kanji in Japan Standardliste (1945) Darunter wichtig: Schulliste (1006) Zusätzlich: Liste für Namen (285)
Hanja in Korea Gesamtliste / enthält: Mittelschule (900) Oberschule (900) Zusätzlich Liste für Namen / (2964)
Kodierte Charset Standards Durch Computersysteme Notwendigkeit von kodierten Charset Standards Zuerst proprietäre Standards von Unternehmen später nationale Standards Erster CJKV Standard: JIS C Methoden zum Arrangieren und Enkodieren werden von China, Taiwan und Korea übernommen
Chinesische Charset Standards Nationaler Standard GB ( ) Grundstandard: GB Wesentliche Kennzeichen: Enthält verschiedene Zeichen anderer Sprachen (nicht nur ASCII-Zeichen) Level 1 Hanzi (Anordnung nach Lesung) Level 2 Hanzi (Anordnung nach Radikal und Strichzahl) Folgestandards mit Ergänzungen und Korrekturen
Taiwanesische Charset Standards Big Five ( ), CNS , CCCII CNS zwar offizieller Standard aber Big Five gebräuchlicher (de-facto Standard) Merkmale: Big Five anfangs stark an JIS angelehnt und kleiner als CNS Hanzi nach Strichzahl und Radikal geordnet CNS mit Abstand größtes CJKV-Charset Folgestandards bei beiden mit Ergänzungen
Japanische Charset Standards Fünf verbreitete Charsets in Japan: ASCII JIS-Roman JIS X (half-width Katakana) JIS X 0208:1997 (und seine Vorgänger) JIS X (zusätzliche Zeichen) Anmerkung: JIS X 0208:1997 und JIS X ergänzen sich
Koreanische Charset Standards Meistverbreiteter Standard: KS X 1001:1993 Wesentliche Merkmale: Enthält ebenfalls Zeichen anderer Sprachen Hangul und Hanja KS X 1001:1991 mit zusätzlichen Hangul-Zeichen KPS von Nordkorea verwendet GB in China verwendet
Internationale Charset Standards Versuch, die meisten geschriebenen Sprachen der Welt in einem Charset zusammenzufassen Unicode-Konsortium als bekanntester Vertreter Start mit Unicode 1.0: chin. Zeichen, 2350 Hangul 5049 andere Zeichen etc. In Folgeversionen Steigerung der Zeichenzahl (aber nicht der chin. Zeichen) Nationale Standards ordnen sich in den Unicode ein wie z.B. GB , JIS X , KS X :1995 bzw. Kooperation mit ISO (ISO :1993)