HZ (Zeichenkodierung)

HZ ist eine Zeichenkodierung der chinesischen Schrift und ist in RFC 1843[1] beschrieben. Sie entspricht vom Zeichenumfang her GB2312, benutzt aber zum Kodieren nur die druckbaren 7-Bit-Zeichen des ASCII-Zeichensatzes und ist für Mails und das Usenet bestimmt, wo zum Zeitpunkt der Einführung 1989 nur 7-Bit-Postings erlaubt waren.

HZ ist standardmäßig im 7-bittigen ASCII-Modus, in HZ kodierte Texte, die nur ASCII-Zeichen verwenden, sind damit gültige und lesbare ASCII-Texte. Die Tilde ~ startet eine Escape-Sequenz: ~ und danach das Steuerzeichen für „neue Zeile“ beginnt eine neue Zeile, ~~ stellt die Tilde selbst dar, und ~{ schaltet in den GB-Modus um. Der GB-Modus ist 16-bittig, wobei das erste Byte ein Zeichen im Bereich 0x21-0x77 ist, das zweite Byte kann dann ein beliebiges druckbares ASCII-Zeichen sein. Die Escapesequenz ~} (eine ungültige GB-Sequenz) schaltet wieder zurück in den ASCII-Modus.

Der erste HZ-Dekodierer wurde vom Erfinder der Kodierung 1989 für Unix geschrieben, erst später wurden auch andere Betriebssysteme unterstützt.

Da jetzt meist auch 8-Bit-Zeichen in Mails erlaubt sind, wird HZ nicht mehr benutzt.

  • RFC 1843 – HZ – A Data Format for Exchanging Files of Arbitrarily Mixed Chinese and ASCII characters. 1995 (englisch).

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. RFC 1843 – HZ – A Data Format for Exchanging Files of Arbitrarily Mixed Chinese and ASCII characters. 1995 (englisch).