Teil I. Allgemeines
Zurück
Weiter
Allgemeines
Inhaltsverzeichnis
1. Die Zeit vor Unicode
1. Text im Speicher des Computers
2. ASCII
2.1. ASCII-Codeset
2.2. Von Bits und Bytes
2.3. Wieviel Bits werden für ASCII verwendet?
3. 8-Bit-Codesets
3.1. ISO 8859
3.1.1. ISO-8859-1 (Latin-1)
3.1.2. ISO-8859-2 (Latin-2)
3.1.3. ISO-8859-3
3.1.4. ISO-8859-4
3.1.5. ISO-8859-5
3.1.6. ISO-8859-6
3.1.7. ISO-8859-7
3.1.8. ISO-8859-8
3.1.9. ISO-8859-9 (Latin-5)
3.1.10. ISO-8859-10 (Latin-6)
3.1.11. ISO-8859-11
3.1.12. ISO-8859-13 (Latin-7)
3.1.13. ISO-8859-14 (Latin-8)
3.1.14. ISO-8859-15 (Latin-9)
3.1.15. ISO-8859-16 (Latin-10)
3.2. KOI
3.3. Microsoft
3.3.1. CP1252 (Windows-1252)
3.3.2. ISO-8859-15 Revisited
3.3.3. Andere Sprachen, andere Windows-Codepages
3.4. Weitere Hersteller
3.5. Weitere Sprachen
3.5.1. Georgisch
3.5.2. Vietnamesisch
4. Multibyte-Codesets
4.1. CJK-Sprachen
4.1.1. Chinesisch
4.1.2. Japanisch
4.1.3. Koreanisch
4.2. Escaping
4.3. Multi-Byte-Encodings
4.4. Bekannte Multi-Byte-Encodings
5. Zusammenfassung
2. Die schöne Welt von Unicode
1. Was ist Unicode?
2. Der Wertebereich von Unicode
3. Unicode-Properties
4. Technische Repräsentation von Unicode
4.1. Wide Characters
4.1.1. Probleme mit Wide Characters
4.1.1.1. Auf- und Abwärtskompatibilität
4.1.1.2. Speicherverbrauch
4.1.1.3. Synchronisation
4.1.1.4. File-System-Safety
4.1.1.5. Was haben Eier mit Bytes zu tun?
4.1.2. UTF-16
4.1.3. UCS-2
4.1.4. UCS-4
4.2. Multi-Byte-Encodings
4.2.1. UTF-7
4.2.2. UTF-8
4.2.2.1. ASCII-Transparenz
4.2.2.2. Selbstsynchronisierung
4.2.2.3. Speicherverbrauch
4.2.2.4. Nachteile von UTF-8
5. Zusammenfassung
Guido Flohr
Imperia AG
Impressum