doc-fr/reference/mbstring/encodings.xml

<?xml version="1.0" encoding="utf-8"?>
<!-- $Revision$ -->
<!-- EN-Revision: a9ada9d6f9b5504aca3815eed58aa5d499e03eab Maintainer: yannick Status: ready -->
<!-- Reviewed: yes -->

<chapter xml:id="mbstring.encodings" xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink">
  <title>Jeux de caractères supportés</title>
  <segmentedlist>
   <title>Jeux de caractères supportés</title>
   <segtitle>Nom dans le registre IANA</segtitle>
   <segtitle>Jeux de caractères</segtitle>
   <segtitle>Description</segtitle>
   <segtitle>Notes</segtitle>
   <seglistitem>
    <seg>ISO-10646-UCS-4</seg>
    <seg>ISO 10646</seg>
    <seg>
     Le jeu de caractères universel (<literal>Universal Character Set</literal>),
     avec 31 bits par caractère, au standard <literal>UCS-4</literal>
     par <literal>ISO/IEC 10646</literal>. Il est synchronisé avec
     la dernière version d'Unicode.
    </seg>
    <seg>
     Si ce nom est utilisé dans l'outil de conversion, le convertisseur
     essaie de reconnaître le texte à partir du dernier BOM
     (<literal>byte order mark</literal>), pour connaître l'ordre
     des bits.
    </seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-10646-UCS-4</seg>
    <seg>UCS-4</seg>
    <seg>
     Voir ci-dessus.
    </seg>
    <seg>
     Contrairement à <literal>UCS-4</literal>, les chaînes sont supposées
     être au format big endian.
    </seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-10646-UCS-4</seg>
    <seg>UCS-4</seg>
    <seg>
     Voir ci-dessus.
    </seg>
    <seg>
     Contrairement à <literal>UCS-2</literal>, les chaînes sont supposées
     être au format little endian.
    </seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-10646-UCS-2</seg>
    <seg>UCS-2</seg>
    <seg>
     Le jeu de caractères universel (<literal>Universal Character Set</literal>),
     avec 16 bits par caractère, au standard <literal>UCS-2</literal>
     par <literal>ISO/IEC 10646</literal>. Il est synchronisé avec
     la dernière version d'Unicode.
    </seg>
    <seg>
     Si ce nom est utilisé dans l'outil de conversion, le convertisseur
     essaie de reconnaître le texte à partir du dernier BOM
     (<literal>byte order mark</literal>), pour connaître l'ordre
     des bits.
    </seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-10646-UCS-2</seg>
    <seg>UCS-2</seg>
    <seg>
     Voir ci-dessus.
    </seg>
    <seg>
     Contrairement à <literal>UCS-4</literal>, les chaînes sont supposées
     être au format big endian.
    </seg>
   </seglistitem>
   <seglistitem>
    <seg>UTF-32</seg>
    <seg>Unicode</seg>
    <seg>
     Format de transformation d'Unicode, de 32 bits, dont les cartes
     correspondent au jeu stantder Unicode. Ce jeu n'est pas identique
     à <literal>UCS-4</literal> car les caractères Unicode étaient limités
     à des valeurs de 21 bits.
    </seg>
    <seg>
     Si ce nom est utilisé dans l'outil de conversion, le convertisseur
     essaie de reconnaître le texte à partir du dernier BOM
     (<literal>byte order mark</literal>), pour connaître l'ordre
     des bits.
    </seg>
   </seglistitem>
   <seglistitem>
    <seg>UTF-32BE</seg>
    <seg>Unicode</seg>
    <seg>
     Voir ci-dessus.
    </seg>
    <seg>
     Contrairement à <literal>UTF-32</literal>, les chaînes sont supposées
     être au format big endian.
    </seg>
   </seglistitem>
   <seglistitem>
    <seg>UTF-32LE</seg>
    <seg>Unicode</seg>
    <seg>
     Voir ci-dessus.
    </seg>
    <seg>
     Contrairement à <literal>UTF-32</literal>, les chaînes sont supposées
     être au format little endian.
    </seg>
   </seglistitem>
   <seglistitem>
    <seg>UTF-16</seg>
    <seg>Unicode</seg>
    <seg>
     Format de transformation d'Unicode sur 16 bits. Il faut noter
     que <literal>UTF-16</literal> n'est plus identique à  <literal>UCS-2</literal>
     car un mécanisme a été introduit en Unicode 2.0 et
     <literal>UTF-16</literal> fait maintenant référence à un
     codage de 21 bits.
    </seg>
    <seg>
     Si ce nom est utilisé dans l'outil de conversion, le convertisseur
     essaie de reconnaître le texte à partir du dernier BOM
     (<literal>byte order mark</literal>), pour connaître l'ordre
     des bits.
    </seg>
   </seglistitem>
   <seglistitem>
    <seg>UTF-16BE</seg>
    <seg>Unicode</seg>
    <seg>
     Voir ci-dessus.
    </seg>
    <seg>
     Contrairement à <literal>UTF-16</literal>, les chaînes sont supposées
     être au format big endian.
    </seg>
   </seglistitem>
   <seglistitem>
    <seg>UTF-16LE</seg>
    <seg>Unicode</seg>
    <seg>
     Voir ci-dessus.
    </seg>
    <seg>
     Contrairement à <literal>UTF-16</literal>, les chaînes sont supposées
     être au format little endian.
    </seg>
   </seglistitem>
   <seglistitem>
    <seg>UTF-8</seg>
    <seg>Unicode / UCS</seg>
    <seg>
     Format de transformation Unicode de 8 bits.
    </seg>
    <seg>none</seg>
   </seglistitem>
   <seglistitem>
    <seg>UTF-7</seg>
    <seg>Unicode</seg>
    <seg>
     Un format compatible avec le courrier électronique d'Unicode,
     spécifié dans <link xlink:href="&url.rfc;2152">RFC2152</link>.
    </seg>
    <seg>none</seg>
   </seglistitem>
   <seglistitem>
    <seg>aucun</seg>
    <seg>Unicode</seg>
    <seg>
     Une variante d'<literal>UTF-7</literal> qui est spécialement utilisée dans le
     <link xlink:href="&url.rfc;3501">protocole IMAP</link>.
    </seg>
    <seg>none</seg>
   </seglistitem>
   <seglistitem>
    <seg>
     US-ASCII (recommandé) / iso-ir-6 / ANSI_X3.4-1986 /
     ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII
    </seg>
    <seg>ASCII / ISO 646</seg>
    <seg>
     ASCII, <literal>American Standard Code for Information Interchange</literal>
     est un format classique de 7 bits. Il est aussi normalisé internationalement,
     sous le nom <literal>ISO 646</literal>.
    </seg>
    <seg>(none)</seg>
   </seglistitem>
   <seglistitem>
    <seg>
     EUC-JP (recommandé) /
     Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese
    </seg>
    <seg>
     Composé de US-ASCII / JIS X0201:1997 (hankaku kana) /
     JIS X0208:1990 / JIS X0212:1990
    </seg>
    <seg>
     Comme vous le voyez, le nom est dérivé de l'abréviation de
     <literal>Extended UNIX Code Packed Format for Japanese</literal>,
     ce jeu est essentiellement utilisé sur les plates-formes Unix.
     Le jeu original, <literal>Extended UNIX Code</literal>,
     est conçu sur la base de <literal>ISO 2022</literal>.
    </seg>
    <seg>
     Le jeu identifié par <literal>EUC-JP</literal> est différent
     de <literal>IBM932 / CP932</literal>, qui est utilisé par
     <literal>OS/2®</literal> et Microsoft® Windows®.
     Pour échanger des informations avec ces plates-formes,
     utilisez <literal>EUCJP-WIN</literal>.
    </seg>
   </seglistitem>
   <seglistitem>
    <seg>Shift_JIS (recommandé) / MS_Kanji / csShift_JIS</seg>
    <seg>Composé de JIS X0201:1997 / JIS X0208:1997</seg>
    <seg>
     <literal>Shift_JIS</literal> a été développé au début des années 80,
     et, au même moment, les premiers traitements de textes étaient
     mis sur le marché. Il a été fait pour conserver la compatibilité avec
     le jeu <literal>JIS X 0201:1976</literal>. Selon la définition de
     l'IANA, le jeu de caractères <literal>Shift_JIS</literal> est légèrement
     différent de <literal>IBM932 / CP932</literal>. Cependant, les noms
     <literal>"SJIS"</literal> et  <literal>"Shift_JIS"</literal> sont
     souvent utilisés à tort, pour ces jeux.
    </seg>
    <seg>Pour <literal>CP932</literal>, utilisez <literal>SJIS-WIN</literal>.</seg>
   </seglistitem>
   <seglistitem>
    <seg>(none)</seg>
    <seg>
     Composé de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
    </seg>
    <seg>
     Même si ce &quot;jeu de caractères&quot; utilise le même jeu que
     <literal>EUC-JP</literal>, il est en fait différent. Il a juste
     quelques caractères de différence.
    </seg>
    <seg>none</seg>
   </seglistitem>
   <seglistitem>
    <seg>Windows-31J / csWindows31J</seg>
    <seg>
     Composé de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
    </seg>
    <seg>
     Même si ce &quot;jeu de caractères&quot; utilise le même jeu que
     <literal>Shift_JIS</literal>, il est en fait différent. Il a juste
     quelques caractères de différence.
    </seg>
    <seg>(none)</seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-2022-JP (recommandé) / csISO2022JP</seg>
    <seg>
     US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983
    </seg>
    <seg><link xlink:href="&url.rfc;1468">RFC1468</link></seg>
    <seg>aucun</seg>
   </seglistitem>
   <seglistitem>
    <seg>JIS</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-8859-1</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-8859-2</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-8859-3</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-8859-4</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-8859-5</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-8859-6</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-8859-7</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-8859-8</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-8859-9</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-8859-10</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-8859-13</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-8859-14</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-8859-15</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-8859-16</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>byte2be</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>byte2le</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>byte4be</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>byte4le</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>BASE64</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>HTML-ENTITIES</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>7bit</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>8bit</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>EUC-CN</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>CP936</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>HZ</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>EUC-TW</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>CP950</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>BIG-5</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>EUC-KR</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>UHC (CP949)</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>ISO-2022-KR</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>Windows-1251 (CP1251)</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>Windows-1252 (CP1252)</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>CP866 (IBM866)</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>KOI8-R</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
   <seglistitem>
    <seg>KOI8-U</seg>
    <seg></seg>
    <seg></seg>
    <seg></seg>
   </seglistitem>
  </segmentedlist>
 </chapter>

<!-- Keep this comment at the end of the file
Local variables:
mode: sgml
sgml-omittag:t
sgml-shorttag:t
sgml-minimize-attributes:nil
sgml-always-quote-attributes:t
sgml-indent-step:1
sgml-indent-data:t
indent-tabs-mode:nil
sgml-parent-document:nil
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
sgml-exposed-tags:nil
sgml-local-catalogs:nil
sgml-local-ecat-files:nil
End:

vim600: syn=xml fen fdm=syntax fdl=2 si
vim: et tw=78 syn=sgml
vi: ts=1 sw=1
-->