5. Zusammenfassung

Unicode erlaubt die Definition von mehr als einer Million Schriftzeichen. Intern können diese Zeichen entweder als wide characters mit einer mehr oder weniger konstanten Größe von zwei oder vier Bytes oder mit UTF-8 ([RFC2279], einer Multi-Byte-Kodierung repräsentiert werden. Wide Characters werfen beim Datenaustausch etliche Probleme auf, sind aber auf Kosten eines stark erhöhten Speicherverbrauchs in geschlossenen Systemen sehr performant zu verarbeiten. UTF-8 zeichnet sich durch einen nur mäßig erhöhten Speicherverbrauch und maximale Abwärtskompatibilität zu ASCII und ISO-8859-1 aus, stellt aber höhere Anforderungen an die Rechenleistung.