mirror of
https://github.com/php/doc-es.git
synced 2026-03-23 23:12:09 +01:00
511 lines
13 KiB
XML
511 lines
13 KiB
XML
<?xml version="1.0" encoding="utf-8"?>
|
|
<!-- $Revision$ -->
|
|
<!-- EN-Revision: a9ada9d6f9b5504aca3815eed58aa5d499e03eab Maintainer: PhilDaiguille Status: ready -->
|
|
<!-- Reviewed: yes Maintainer: Marqitos -->
|
|
<chapter xml:id="mbstring.encodings" xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink">
|
|
<title>Juegos de caracteres soportados</title>
|
|
<segmentedlist>
|
|
<title>Juegos de caracteres soportados</title>
|
|
<segtitle>Nombre en el registro IANA</segtitle>
|
|
<segtitle>Juegos de caracteres</segtitle>
|
|
<segtitle>Descripción</segtitle>
|
|
<segtitle>Notas</segtitle>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-4</seg>
|
|
<seg>ISO 10646</seg>
|
|
<seg>
|
|
El juego de caracteres universal (<literal>Universal Character Set</literal>),
|
|
con 31 bits por caracter, al estándar <literal>UCS-4</literal>
|
|
por <literal>ISO/IEC 10646</literal>. Está sincronizado con
|
|
la última versión de Unicode.
|
|
</seg>
|
|
<seg>
|
|
Si este nombre es utilizado en la herramienta de conversión, el convertidor
|
|
intenta reconocer el texto a partir del último BOM
|
|
(<literal>byte order mark</literal>), para conocer el orden
|
|
de los bits.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-4</seg>
|
|
<seg>UCS-4</seg>
|
|
<seg>
|
|
Ver arriba.
|
|
</seg>
|
|
<seg>
|
|
A diferencia de <literal>UCS-4</literal>, las cadenas se suponen
|
|
estar en formato big endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-4</seg>
|
|
<seg>UCS-4</seg>
|
|
<seg>
|
|
Ver arriba.
|
|
</seg>
|
|
<seg>
|
|
A diferencia de <literal>UCS-2</literal>, las cadenas se suponen
|
|
estar en formato little endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-2</seg>
|
|
<seg>UCS-2</seg>
|
|
<seg>
|
|
El juego de caracteres universal (<literal>Universal Character Set</literal>),
|
|
con 16 bits por caracter, al estándar <literal>UCS-2</literal>
|
|
por <literal>ISO/IEC 10646</literal>. Está sincronizado con
|
|
la última versión de Unicode.
|
|
</seg>
|
|
<seg>
|
|
Si este nombre es utilizado en la herramienta de conversión, el convertidor
|
|
intenta reconocer el texto a partir del último BOM
|
|
(<literal>byte order mark</literal>), para conocer el orden
|
|
de los bits.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-2</seg>
|
|
<seg>UCS-2</seg>
|
|
<seg>
|
|
Ver arriba.
|
|
</seg>
|
|
<seg>
|
|
A diferencia de <literal>UCS-4</literal>, las cadenas se suponen
|
|
estar en formato big endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-32</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Formato de transformación de Unicode, de 32 bits, cuyas cartas
|
|
corresponden al juego estándar Unicode. Este juego no es idéntico
|
|
a <literal>UCS-4</literal> porque los caracteres Unicode estaban limitados
|
|
a valores de 21 bits.
|
|
</seg>
|
|
<seg>
|
|
Si este nombre es utilizado en la herramienta de conversión, el convertidor
|
|
intenta reconocer el texto a partir del último BOM
|
|
(<literal>byte order mark</literal>), para conocer el orden
|
|
de los bits.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-32BE</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Ver arriba.
|
|
</seg>
|
|
<seg>
|
|
A diferencia de <literal>UTF-32</literal>, las cadenas se suponen
|
|
estar en formato big endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-32LE</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Ver arriba.
|
|
</seg>
|
|
<seg>
|
|
A diferencia de <literal>UTF-32</literal>, las cadenas se suponen
|
|
estar en formato little endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-16</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Formato de transformación de Unicode sobre 16 bits. Se debe notar
|
|
que <literal>UTF-16</literal> ya no es idéntico a <literal>UCS-2</literal>
|
|
porque un mecanismo fue introducido en Unicode 2.0 y
|
|
<literal>UTF-16</literal> ahora hace referencia a un
|
|
codificación de 21 bits.
|
|
</seg>
|
|
<seg>
|
|
Si este nombre es utilizado en la herramienta de conversión, el convertidor
|
|
intenta reconocer el texto a partir del último BOM
|
|
(<literal>byte order mark</literal>), para conocer el orden
|
|
de los bits.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-16BE</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Ver arriba.
|
|
</seg>
|
|
<seg>
|
|
A diferencia de <literal>UTF-16</literal>, las cadenas se suponen
|
|
estar en formato big endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-16LE</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Ver arriba.
|
|
</seg>
|
|
<seg>
|
|
A diferencia de <literal>UTF-16</literal>, las cadenas se suponen
|
|
estar en formato little endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-8</seg>
|
|
<seg>Unicode / UCS</seg>
|
|
<seg>
|
|
Formato de transformación Unicode de 8 bits.
|
|
</seg>
|
|
<seg>ninguno</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-7</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Un formato compatible con el correo electrónico de Unicode,
|
|
especificado en <link xlink:href="&url.rfc;2152">RFC2152</link>.
|
|
</seg>
|
|
<seg>ninguno</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ninguno</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Una variante de <literal>UTF-7</literal> que es especialmente utilizada en el
|
|
<link xlink:href="&url.rfc;3501">protocolo IMAP</link>.
|
|
</seg>
|
|
<seg>ninguno</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>
|
|
US-ASCII (recomendado) / iso-ir-6 / ANSI_X3.4-1986 /
|
|
ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII
|
|
</seg>
|
|
<seg>ASCII / ISO 646</seg>
|
|
<seg>
|
|
ASCII, <literal>American Standard Code for Information Interchange</literal>
|
|
es un formato clásico de 7 bits. También está normalizado internacionalmente,
|
|
bajo el nombre <literal>ISO 646</literal>.
|
|
</seg>
|
|
<seg>(ninguno)</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>
|
|
EUC-JP (recomendado) /
|
|
Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese
|
|
</seg>
|
|
<seg>
|
|
Compuesto de US-ASCII / JIS X0201:1997 (hankaku kana) /
|
|
JIS X0208:1990 / JIS X0212:1990
|
|
</seg>
|
|
<seg>
|
|
Como se puede ver, el nombre deriva de la abreviatura de
|
|
<literal>Extended UNIX Code Packed Format for Japanese</literal>,
|
|
este juego es esencialmente utilizado en plataformas Unix.
|
|
El juego original, <literal>Extended UNIX Code</literal>,
|
|
está diseñado sobre la base de <literal>ISO 2022</literal>.
|
|
</seg>
|
|
<seg>
|
|
El juego identificado por <literal>EUC-JP</literal> es diferente
|
|
de <literal>IBM932 / CP932</literal>, que es utilizado por
|
|
<literal>OS/2®</literal> y Microsoft® Windows®.
|
|
Para intercambiar información con estas plataformas,
|
|
utilice <literal>EUCJP-WIN</literal>.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>Shift_JIS (recomendado) / MS_Kanji / csShift_JIS</seg>
|
|
<seg>Compuesto de JIS X0201:1997 / JIS X0208:1997</seg>
|
|
<seg>
|
|
<literal>Shift_JIS</literal> fue desarrollado a principios de los años 80,
|
|
y, al mismo tiempo, los primeros procesadores de texto estaban
|
|
en el mercado. Fue hecho para conservar la compatibilidad con
|
|
el juego <literal>JIS X 0201:1976</literal>. Según la definición de
|
|
IANA, el juego de caracteres <literal>Shift_JIS</literal> es ligeramente
|
|
diferente de <literal>IBM932 / CP932</literal>. Sin embargo, los nombres
|
|
<literal>"SJIS"</literal> y <literal>"Shift_JIS"</literal> son
|
|
a menudo utilizados erróneamente, para estos juegos.
|
|
</seg>
|
|
<seg>Para <literal>CP932</literal>, utilice <literal>SJIS-WIN</literal>.</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>(ninguno)</seg>
|
|
<seg>
|
|
Compuesto de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
|
|
</seg>
|
|
<seg>
|
|
Aunque este "juego de caracteres" utiliza el mismo juego que
|
|
<literal>EUC-JP</literal>, en realidad es diferente. Solo tiene
|
|
algunos caracteres de diferencia.
|
|
</seg>
|
|
<seg>ninguno</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>Windows-31J / csWindows31J</seg>
|
|
<seg>
|
|
Compuesto de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
|
|
</seg>
|
|
<seg>
|
|
Aunque este "juego de caracteres" utiliza el mismo juego que
|
|
<literal>Shift_JIS</literal>, en realidad es diferente. Solo tiene
|
|
algunos caracteres de diferencia.
|
|
</seg>
|
|
<seg>(ninguno)</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-2022-JP (recomendado) / csISO2022JP</seg>
|
|
<seg>
|
|
US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983
|
|
</seg>
|
|
<seg><link xlink:href="&url.rfc;1468">RFC1468</link></seg>
|
|
<seg>ninguno</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>JIS</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-1</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-2</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-3</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-4</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-5</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-6</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-7</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-8</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-9</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-10</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-13</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-14</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-15</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-16</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>byte2be</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>byte2le</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>byte4be</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>byte4le</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>BASE64</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>HTML-ENTITIES</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>7bit</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>8bit</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>EUC-CN</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>CP936</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>HZ</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>EUC-TW</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>CP950</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>BIG-5</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>EUC-KR</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UHC (CP949)</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-2022-KR</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>Windows-1251 (CP1251)</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>Windows-1252 (CP1252)</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>CP866 (IBM866)</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>KOI8-R</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>KOI8-U</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
</segmentedlist>
|
|
</chapter>
|
|
|
|
<!-- Keep this comment at the end of the file
|
|
Local variables:
|
|
mode: sgml
|
|
sgml-omittag:t
|
|
sgml-shorttag:t
|
|
sgml-minimize-attributes:nil
|
|
sgml-always-quote-attributes:t
|
|
sgml-indent-step:1
|
|
sgml-indent-data:t
|
|
indent-tabs-mode:nil
|
|
sgml-parent-document:nil
|
|
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
|
|
sgml-exposed-tags:nil
|
|
sgml-local-catalogs:nil
|
|
sgml-local-ecat-files:nil
|
|
End:
|
|
|
|
vim600: syn=xml fen fdm=syntax fdl=2 si
|
|
vim: et tw=78 syn=sgml
|
|
vi: ts=1 sw=1
|
|
-->
|