5. Zusammenfassung

Computer speichern Texte als Zahlenfolgen ab. Die Zuordnung von Zahlen zu Schriftzeichen wird als Codeset oder auch Charset bezeichnet, und normalerweise (8-Bit-Raum) liegen diese Zahlen im Bereich 0-255. Der allgemein anerkannte Standard ASCII legt die Zuordnung der Zeichen 0-127 fest und definiert Schriftzeichen, die zur Darstellung englischer Texte ausreichend ist. Für den Bereich der Zeichen 128-255 existiert eine Vielzahl von Standards, von den ISO-8859-1, das als Superset von ASCII zusätzlich die zur Darstellung von Texten in vielen westeuropäischen Sprachen erforderlichen Zeichen definiert, der wichtigste ist. Daneben existieren aber weitere Standards für spezielle Sprachen und spezielle Betriebssysteme.

Für Sprachen, die mehr als 256 Schriftzeichen benötigen, werden Nicht-ASCII-Schriftzeichen normalerweise in Multi-Byte-Sequenzen gespeichert. Ein konkretes Schriftzeichen wird also als Kombination von zwei oder mehr Bytes definiert.