UTF-7 (UCS ou Unicode transformation format 7 bits) est un codage de caractères informatiques à longueur variable conçu pour coder l’ensemble des caractères internationaux d’Unicode dans le courrier électronique de manière plus efficace que l’UTF-8 à l’aide de quoted-printable. UTF-7 n’est pas une norme Unicode, le standard Unicode ne mentionne que UTF-8, UTF-16 et UTF-32.
UTF-7 est proposé pour la première fois comme protocole expérimental dans le RFC 1642, A Mail-Safe Transformation Format of Unicode (Un format de transformation d’Unicode sûr pour le courrier). Cet RFC est rendu obsolète par le RFC 2152, un RFC informel qui n’est jamais devenu une norme et qui spécifie clairement qu’il n’est pas une norme Internet. Malgré cela, le RFC 2152 est cité comme définition de l’UTF-7 dans la liste des codages de caractères de l’IANA. RFC 2060 définit une version modifiée parfois identifiée comme UTF-7, mUTF-7, et l’utilise dans le protocole IMAP.
|
Jeux de caractères de base |
|
|
Codification de fichiers et protocoles |
|
Adaptations de référence |
|
Équivalences standards |
- NFC (forme précomposée, recommandée)
- NFD (forme décomposée)
- NFKC (forme précomposée de compatibilité)
- NFKD (forme décomposée de compatibilité)
|
Propriétés et algorithmes |
|
Transformations |
|
Standards et normes liés |
- BCP 47 (étiquettes IETF d’identification de langues)
- ISO 639 (codes pour la représentation des noms de langues ou groupes de langues)
- ISO 15924 (codes pour la représentation des noms d’écritures)
- ISO 3166-1 (codes pour la représentation des noms de pays ou régions du monde)
- ISO 4217 (codes pour la représentation des noms de devises monétaires)
|
Mises en œuvre et applications |
|
Jeux de caractères codés |
Multi-octets |
|
|
8 bits |
ISO/CEI 8859 |
- -1 (Latin-1)
- -2 (Latin-2)
- -3 (Latin-3)
- -4 (Latin-4)
- -5 (Cyrillique)
- -6 (Arabe)
- -7 (Grec)
- -8 (Hébreu)
- -9 (Latin-5)
- -10 (Latin-6)
- -11 (Thaï)
- -12 (Devanagari)
- -13 (Latin-7)
- -14 (Latin-8)
- -15 (Latin-9)
- -16 (Latin-10)
|
Pages de code Windows |
|
Pages de code Mac OS |
MacRoman |
Pages de code DOS |
|
Pages de code diverses |
|
Non basés sur ISO/IEC 646 |
|
|
7 bits |
|
Moins de 7 bits |
|
|