mirror of
https://github.com/php/doc-es.git
synced 2026-03-26 00:12:06 +01:00
git-svn-id: https://svn.php.net/repository/phpdoc/es/trunk@334774 c90b9560-bf6c-de11-be94-00142212c4b1
489 lines
13 KiB
XML
489 lines
13 KiB
XML
<?xml version="1.0" encoding="utf-8"?>
|
|
<!-- $Revision$ -->
|
|
<!-- EN-Revision: 14af302c9c0e561fa6f9cdd956268758ba9a89c5 Maintainer: yago Status: ready -->
|
|
<!-- Reviewed: no -->
|
|
<chapter xml:id="mbstring.encodings" xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink">
|
|
<title>Resumen de codificaciones soportadas</title>
|
|
<segmentedlist>
|
|
<title>Resumen de codificaciones soportadas</title>
|
|
<segtitle>Nombre en el registro de conjuntos de caracteres de la IANA</segtitle>
|
|
<segtitle>Conjunto de Caracteres</segtitle>
|
|
<segtitle>Descripción</segtitle>
|
|
<segtitle>Notas adicionales</segtitle>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-4</seg>
|
|
<seg>ISO 10646</seg>
|
|
<seg>
|
|
Conjunto Universal de Caracteres con 31 bits de codificación, estandarizado como UCS-4
|
|
por ISO/IEC 10646. Forma parte de la última versión de Unicode.
|
|
</seg>
|
|
<seg>
|
|
Si se utiliza este nombre con la utilidad de conversión de codificación,
|
|
el convertidor intentará identificar, mediante el byte de marca de orden (BOM),
|
|
en qué formato (little-endian o big-endian) están representados los siguientes bytes.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-4</seg>
|
|
<seg>UCS-4</seg>
|
|
<seg>
|
|
Ver más arriba.
|
|
</seg>
|
|
<seg>
|
|
En contraste con <literal>UCS-4</literal>, las cadenas de caracteres siempre
|
|
apareceran en formato big-endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-4</seg>
|
|
<seg>UCS-4</seg>
|
|
<seg>
|
|
Ver más arriba.
|
|
</seg>
|
|
<seg>
|
|
En contraste con <literal>UCS-4</literal>, las cadenas de caracteres siempre
|
|
apareceran en formato little-endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-2</seg>
|
|
<seg>UCS-2</seg>
|
|
<seg>
|
|
Conjunto Universal de Caracteres con 16 bits de codificación, estandarizado como UCS-2
|
|
por ISO/IEC 10646. Forma parte de la última versión de Unicode.
|
|
</seg>
|
|
<seg>
|
|
Si se utiliza este nombre con la utilidad de conversión de codificación,
|
|
el convertidor intentará identificar, mediante el byte de marca de orden (BOM),
|
|
en qué formato (little-endian o big-endian) están representados los siguientes bytes.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-2</seg>
|
|
<seg>UCS-2</seg>
|
|
<seg>
|
|
Ver más arriba.
|
|
</seg>
|
|
<seg>
|
|
En contraste con <literal>UCS-2</literal>, las cadenas de caracteres siempre
|
|
apareceran en formato big-endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-2</seg>
|
|
<seg>UCS-2</seg>
|
|
<seg>
|
|
Ver más arriba.
|
|
</seg>
|
|
<seg>
|
|
En contraste con <literal>UCS-2</literal>, las cadenas de caracteres siempre
|
|
apareceran en formato little-endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-32</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Formato de Transformación UCS de 32 bits de ancho, cuya espacio de codificación
|
|
está incluido en el estándar Unicode. Esta codificación no es igual a UCS-4, porque
|
|
el espacio de codificación de Unicode está limitado a 21 bits.
|
|
</seg>
|
|
<seg>
|
|
Si se utiliza este nombre con la utilidad de conversión de codificación,
|
|
el convertidor intentará identificar, mediante el byte de marca de orden (BOM),
|
|
en qué formato (little-endian o big-endian) están representados los siguientes bytes.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-32BE</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>Ver más arriba</seg>
|
|
<seg>
|
|
En contraste con <literal>UTF-32</literal>, las cadenas de caracteres siempre
|
|
apareceran en formato big-endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-32LE</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>Ver más arriba</seg>
|
|
<seg>
|
|
En contraste con <literal>UTF-32</literal>, las cadenas de caracteres siempre
|
|
apareceran en formato little-endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-16</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Formato de Transformación UCS de 16 bits de ancho. Hay que tener en cuenta
|
|
que es muy parecido a UCS-2, gracias al mecanismo de subrogación
|
|
introducido en Unicode 2.0 y UTF-16, por lo que se requiere un máximo de 21 bits para la
|
|
representación de cualquier carácter.
|
|
</seg>
|
|
<seg>
|
|
Si se utiliza este nombre con la utilidad de conversión de codificación,
|
|
el convertidor intentará identificar, mediante el byte de marca de orden (BOM),
|
|
en qué formato (little-endian o big-endian) están representados los siguientes bytes.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-16BE</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Ver más arriba.
|
|
</seg>
|
|
<seg>
|
|
En contraste con <literal>UTF-16</literal>, las cadenas de caracteres siempre
|
|
apareceran en formato big-endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-16LE</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Ver más arriba.
|
|
</seg>
|
|
<seg>
|
|
En contraste con <literal>UTF-16</literal>, las cadenas de caracteres siempre
|
|
apareceran en formato little-endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-8</seg>
|
|
<seg>Unicode / UCS</seg>
|
|
<seg>
|
|
Formato de Transformación UCS de 8 bits de ancho..
|
|
</seg>
|
|
<seg>Ninguna</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-7</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Formato de transformación UCS para el envío de correo electrónico seguro, especificado en
|
|
<link xlink:href="&url.rfc;2152">RFC2152</link>.
|
|
</seg>
|
|
<seg>Ninguno</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>(Ninguno)</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Variante de UTF-7 recomendado para usar con el
|
|
<link xlink:href="&url.rfc;3501">protocolo IMAP</link>.
|
|
</seg>
|
|
<seg>Ninguno</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>
|
|
US-ASCII (preferred MIME name) / iso-ir-6 / ANSI_X3.4-1986 /
|
|
ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII
|
|
</seg>
|
|
<seg>ASCII / ISO 646</seg>
|
|
<seg>
|
|
Código Estándar Americano para el Intercambio de Información, de utilización
|
|
muy extendida con una codifiación de 7 bits. Estandarizado a nivel Internacional, ISO 646.
|
|
</seg>
|
|
<seg>(Ninguno)</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>
|
|
EUC-JP (nombre preferido por MIME) /
|
|
Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese
|
|
</seg>
|
|
<seg>
|
|
Compuesto de US-ASCII / JIS X0201:1997 (hankaku kana part) /
|
|
JIS X0208:1990 / JIS X0212:1990
|
|
</seg>
|
|
<seg>
|
|
Derivado de la abreviación de Formato de Código UNIX Extendido para Japonés,
|
|
la codificación más utilizada en UNIX y plataformas afines. Esta original codifiación,
|
|
Código UNIX Extendido, se diseñó sobre la base de ISO 2022.
|
|
</seg>
|
|
<seg>
|
|
El conjunto de caracteres llamado EUC-JP es diferente a IBM932 / CP932,
|
|
que son utilizados por OS/2® y Microsoft® Windows®.
|
|
Para el intercambio de información con estas plataformas es mejor utilizar EUCJP-WIN.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>Shift_JIS (nombre preferido por MIME) / MS_Kanji / csShift_JIS</seg>
|
|
<seg>Compuesto de JIS X0201:1997 / JIS X0208:1997</seg>
|
|
<seg>
|
|
Shift_JIS fue desarrollado a principios de los 80, al mismo tiempo que
|
|
los procesadores de textos en Japonés llegaban al mercado para mantener
|
|
la compatibilidad con los antiguos esquemas de codifiación JIS X 0201:1976.
|
|
De acuerdo con la definición de la IANA, el conjunto de caracteres Shift_JIS es ligeramente
|
|
diferente a IBM932 / CP932. Sin embargo, los nombres "SJIS" / "Shift_JIS" son utilizados
|
|
de forma incorrecta para referirse a este conjunto de caracteres.
|
|
</seg>
|
|
<seg>Para la codificación CP932, es recomendable utilizar SJIS-WIN.</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>(Ninguno)</seg>
|
|
<seg>
|
|
Compuesto de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
|
|
</seg>
|
|
<seg>
|
|
Aunque esta "codificación" utiliza el mismo esquema de codificación que EUC-JP,
|
|
el conjunto de caracteres es diferente. Esto es así porque algunos códigos del mapa
|
|
apuntan a diferentes caracteres del conjunto de caracteres EUC-JP.
|
|
</seg>
|
|
<seg>none</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>Windows-31J / csWindows31J</seg>
|
|
<seg>
|
|
Compuesto de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
|
|
</seg>
|
|
<seg>
|
|
Aunque esta "codificación" utiliza el mismo esquema de codificación que Shift-JIS,
|
|
el conjunto de caracteres es diferente. Esto es así porque algunos códigos del mapa
|
|
apuntan a diferentes caracteres del conjunto de caracteres Shift-JIS.
|
|
</seg>
|
|
<seg>(none)</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-2022-JP (nombre preferido por MIME) / csISO2022JP</seg>
|
|
<seg>
|
|
US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983
|
|
</seg>
|
|
<seg><link xlink:href="&url.rfc;1468">RFC1468</link></seg>
|
|
<seg>(Ninguno)</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>JIS</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-1</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-2</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-3</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-4</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-5</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-6</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-7</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-8</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-9</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-10</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-13</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-14</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-15</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>byte2be</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>byte2le</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>byte4be</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>byte4le</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>BASE64</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>HTML-ENTITIES</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>7bit</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>8bit</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>EUC-CN</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>CP936</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>HZ</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>EUC-TW</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>CP950</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>BIG-5</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>EUC-KR</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UHC (CP949)</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-2022-KR</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>Windows-1251 (CP1251)</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>Windows-1252 (CP1252)</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>CP866 (IBM866)</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>KOI8-R</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
</segmentedlist>
|
|
</chapter>
|
|
|
|
<!-- Keep this comment at the end of the file
|
|
Local variables:
|
|
mode: sgml
|
|
sgml-omittag:t
|
|
sgml-shorttag:t
|
|
sgml-minimize-attributes:nil
|
|
sgml-always-quote-attributes:t
|
|
sgml-indent-step:1
|
|
sgml-indent-data:t
|
|
indent-tabs-mode:nil
|
|
sgml-parent-document:nil
|
|
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
|
|
sgml-exposed-tags:nil
|
|
sgml-local-catalogs:nil
|
|
sgml-local-ecat-files:nil
|
|
End:
|
|
|
|
vim600: syn=xml fen fdm=syntax fdl=2 si
|
|
vim: et tw=78 syn=sgml
|
|
vi: ts=1 sw=1
|
|
-->
|