UTF-7

Cet article est une ébauche concernant l’écriture et l’informatique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

UTF-7 (UCS ou Unicode transformation format 7 bits) est un codage de caractères informatiques à longueur variable conçu pour coder l’ensemble des caractères internationaux d’Unicode dans le courrier électronique de manière plus efficace que l’UTF-8 à l’aide de quoted-printable. UTF-7 n’est pas une norme Unicode, le standard Unicode ne mentionne que UTF-8, UTF-16 et UTF-32.

UTF-7 est proposé pour la première fois comme protocole expérimental dans le RFC 1642, A Mail-Safe Transformation Format of Unicode (Un format de transformation d’Unicode sûr pour le courrier). Cet RFC est rendu obsolète par le RFC 2152, un RFC informel qui n’est jamais devenu une norme et qui spécifie clairement qu’il n’est pas une norme Internet. Malgré cela, le RFC 2152 est cité comme définition de l’UTF-7 dans la liste des codages de caractères de l’IANA. RFC 2060 définit une version modifiée parfois identifiée comme UTF-7, mUTF-7, et l’utilise dans le protocole IMAP.

v · m
Unicode
Jeux de caractères de base
Logo d'Unicode
Codification de fichiers et protocoles
Adaptations de référence
Équivalences standards
  • NFC (forme précomposée, recommandée)
  • NFD (forme décomposée)
  • NFKC (forme précomposée de compatibilité)
  • NFKD (forme décomposée de compatibilité)
Propriétés et algorithmes
Transformations
Standards et normes liés
  • BCP 47 (étiquettes IETF d’identification de langues)
  • ISO 639 (codes pour la représentation des noms de langues ou groupes de langues)
  • ISO 15924 (codes pour la représentation des noms d’écritures)
  • ISO 3166-1 (codes pour la représentation des noms de pays ou régions du monde)
  • ISO 4217 (codes pour la représentation des noms de devises monétaires)
Mises en œuvre et applications
v · m
Jeux de caractères codés
Multi-octets
Unicode
Asiatiques
Ancienne encodeuse de texte sur ruban perforé
8 bits
ISO/CEI 8859
  • -1 (Latin-1)
  • -2 (Latin-2)
  • -3 (Latin-3)
  • -4 (Latin-4)
  • -5 (Cyrillique)
  • -6 (Arabe)
  • -7 (Grec)
  • -8 (Hébreu)
  • -9 (Latin-5)
  • -10 (Latin-6)
  • -11 (Thaï)
  • -12 (Devanagari)
  • -13 (Latin-7)
  • -14 (Latin-8)
  • -15 (Latin-9)
  • -16 (Latin-10)
Pages de code Windows
Pages de code Mac OS MacRoman
Pages de code DOS
  • 437
  • 720
  • 737
  • 775
  • 850
  • 852
  • 855
  • 857
  • 858
  • 860
  • 861
  • 862
  • 863
  • 864
  • 865
  • 866
  • 869
  • Kamenický
  • Mazovia
  • MIK
  • Iran System
Pages de code diverses
  • ANSEL
  • DEC-MCS
  • KOI8-R (russe)
  • KOI8-U (ukrainien)
  • StandardEncoding (PostScript)
  • Page de code vidéotex
  • Page de code ZX Spectrum
  • Page de code Amstrad CPC
  • Page de code Atari ST
  • Page de code Amiga
Non basés sur ISO/IEC 646
7 bits
Moins de 7 bits
  • icône décorative Portail de l’informatique
  • icône décorative Portail de l’écriture