mirror of
https://github.com/php/doc-pt_br.git
synced 2026-03-23 22:52:12 +01:00
507 lines
13 KiB
XML
507 lines
13 KiB
XML
<?xml version="1.0" encoding="utf-8"?>
|
|
<!-- EN-Revision: a9ada9d6f9b5504aca3815eed58aa5d499e03eab Maintainer: fernandowobeto Status: ready --><!-- CREDITS: fernandowobeto -->
|
|
<chapter xml:id="mbstring.encodings" xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink">
|
|
<title>Sumários de Codificações Suportadas</title>
|
|
<segmentedlist>
|
|
<title>Sumários de Codificações Suportadas</title>
|
|
<segtitle>Nome no registro de conjunto de caracteres da IANA</segtitle>
|
|
<segtitle>Conjunto de caracteres subjacente</segtitle>
|
|
<segtitle>Descrição</segtitle>
|
|
<segtitle>Nota Adicional</segtitle>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-4</seg>
|
|
<seg>ISO 10646</seg>
|
|
<seg>
|
|
O Conjunto de Caracteres Universal com espaço de código de 31 bits, padronizado como UCS-4
|
|
pela ISO/IEC 10646. Mantido sincronizado com a versão mais recente do
|
|
mapa de códigos Unicode.
|
|
</seg>
|
|
<seg>
|
|
Se este nome for usado na facilidade de conversão de codificação,
|
|
o conversor tenta identificar pelo BOM precedente
|
|
(marcador de ordem de byte) em qual endian os bytes subsequentes
|
|
estão representados.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-4</seg>
|
|
<seg>UCS-4</seg>
|
|
<seg>
|
|
Ver acima.
|
|
</seg>
|
|
<seg>
|
|
Ao contrário do <literal>UCS-4</literal>, as strings são sempre assumidas
|
|
estar na forma big endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-4</seg>
|
|
<seg>UCS-4</seg>
|
|
<seg>
|
|
Ver acima.
|
|
</seg>
|
|
<seg>
|
|
Ao contrário do <literal>UCS-4</literal>, as strings são sempre assumidas
|
|
estar na forma little endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-2</seg>
|
|
<seg>UCS-2</seg>
|
|
<seg>
|
|
O Conjunto de Caracteres Universal com espaço de código de 16 bits, padronizado como UCS-2
|
|
pela ISO/IEC 10646. Mantido sincronizado com a versão mais recente do
|
|
mapa de códigos Unicode.
|
|
</seg>
|
|
<seg>
|
|
Se este nome for usado na facilidade de conversão de codificação,
|
|
o conversor tenta identificar pelo BOM precedente
|
|
(marcador de ordem de byte) em qual endian os bytes subsequentes
|
|
estão representados.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-2</seg>
|
|
<seg>UCS-2</seg>
|
|
<seg>
|
|
Ver acima.
|
|
</seg>
|
|
<seg>
|
|
Ao contrário do <literal>UCS-2</literal>, as strings são sempre assumidas
|
|
estar na forma big endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-10646-UCS-2</seg>
|
|
<seg>UCS-2</seg>
|
|
<seg>
|
|
Ver acima.
|
|
</seg>
|
|
<seg>
|
|
Ao contrário do <literal>UCS-2</literal>, as strings são sempre assumidas
|
|
estar na forma big endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-32</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Formato de Transformação Unicode de largura de unidade de 32 bits, cujo espaço de codificação
|
|
refere-se ao padrão de conjunto de códigos Unicode. Este esquema de codificação não era
|
|
idêntico ao UCS-4 porque o espaço de código do Unicode era limitado a
|
|
um valor de 21 bits.
|
|
</seg>
|
|
<seg>
|
|
Se este nome for usado na facilidade de conversão de codificação,
|
|
o conversor tenta identificar pelo BOM precedente
|
|
(marcador de ordem de byte) em qual endian os bytes subsequentes
|
|
estão representados.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-32BE</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>Ver acima</seg>
|
|
<seg>
|
|
Ao contrário do <literal>UTF-32</literal>, as strings são sempre assumidas
|
|
estar na forma big endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-32LE</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>Ver acima</seg>
|
|
<seg>
|
|
Ao contrário do <literal>UTF-32</literal>, as strings são sempre assumidas
|
|
estar na forma little endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-16</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Formato de Transformação Unicode de largura de unidade de 16 bits. Vale a pena observar
|
|
que o UTF-16 não é mais a mesma especificação que UCS-2 porque o
|
|
mecanismo de substituição foi introduzido desde o Unicode 2.0 e
|
|
UTF-16 agora se refere a um espaço de código de 21 bits.
|
|
</seg>
|
|
<seg>
|
|
Se este nome for usado na facilidade de conversão de codificação,
|
|
o conversor tenta identificar pelo BOM precedente
|
|
(marcador de ordem de byte) em qual endian os bytes subsequentes
|
|
estão representados.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-16BE</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Ver acima.
|
|
</seg>
|
|
<seg>
|
|
Ao contrário do <literal>UTF-16</literal>, as strings são sempre assumidas
|
|
estar na forma big endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-16LE</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Ver acima.
|
|
</seg>
|
|
<seg>
|
|
Ao contrário do <literal>UTF-16</literal>, as strings são sempre assumidas
|
|
estar na forma little endian.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-8</seg>
|
|
<seg>Unicode / UCS</seg>
|
|
<seg>
|
|
Formato de Transformação Unicode de largura de unidade de 8 bits.
|
|
</seg>
|
|
<seg>none</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UTF-7</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Um formato de transformação seguro para e-mails do Unicode, especificado em
|
|
<link xlink:href="&url.rfc;2152">RFC2152</link>.
|
|
</seg>
|
|
<seg>none</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>(none)</seg>
|
|
<seg>Unicode</seg>
|
|
<seg>
|
|
Uma variante de UTF-7 especializada para uso no
|
|
<link xlink:href="&url.rfc;3501">protocolo IMAP</link>.
|
|
</seg>
|
|
<seg>none</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>
|
|
US-ASCII (preferred MIME name) / iso-ir-6 / ANSI_X3.4-1986 /
|
|
ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII
|
|
</seg>
|
|
<seg>ASCII / ISO 646</seg>
|
|
<seg>
|
|
Código Padrão Americano para Intercâmbio de Informações é uma codificação comumente usada de 7 bits.
|
|
Também padronizado como um padrão internacional, ISO 646.
|
|
</seg>
|
|
<seg>(none)</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>
|
|
EUC-JP (preferred MIME name) /
|
|
Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese
|
|
</seg>
|
|
<seg>
|
|
Compound of US-ASCII / JIS X0201:1997 (hankaku kana part) /
|
|
JIS X0208:1990 / JIS X0212:1990
|
|
</seg>
|
|
<seg>
|
|
Como pode ser visto, o nome é derivado de uma abreviação de Formato Padrão de Código UNIX
|
|
Packed para Japonês, esta codificação é principalmente usada em UNIX ou
|
|
plataformas semelhantes. O esquema de codificação original, Extended UNIX Code, é
|
|
projetado com base no ISO 2022.
|
|
</seg>
|
|
<seg>
|
|
O conjunto de caracteres referido pelo EUC-JP é diferente do IBM932 / CP932,
|
|
que são usados pelo OS/2® e Microsoft® Windows®.
|
|
Para a troca de informações com essas plataformas, use EUCJP-WIN em vez disso.
|
|
</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>Shift_JIS (preferred MIME name) / MS_Kanji / csShift_JIS</seg>
|
|
<seg>Compound of JIS X0201:1997 / JIS X0208:1997</seg>
|
|
<seg>
|
|
Shift_JIS foi desenvolvido no início dos anos 80, na época dos processadores de palavras japoneses pessoais
|
|
foram lançados no mercado, a fim de manter
|
|
compatibilidades com o esquema de codificação legado JIS X 0201:1976.
|
|
De acordo com a definição da IANA, o conjunto de códigos do Shift_JIS é ligeiramente
|
|
diferente de IBM932 / CP932. No entanto, os nomes "SJIS" / "Shift_JIS" são
|
|
frequentemente usados erroneamente para se referir a esses conjuntos de códigos.
|
|
</seg>
|
|
<seg>Para o mapa de código CP932, use SJIS-WIN em vez disso.</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>(nenhum)</seg>
|
|
<seg>
|
|
Composto de JIS X0201:1997 / JIS X0208:1997 / extensões IBM / extensões NEC
|
|
</seg>
|
|
<seg>
|
|
Embora esta "codificação" use o mesmo esquema de codificação que EUC-JP,
|
|
o conjunto de caracteres subjacente é diferente. Ou seja, alguns pontos de código mapeiam
|
|
para caracteres diferentes do EUC-JP.
|
|
</seg>
|
|
<seg>nenhum</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>Windows-31J / csWindows31J</seg>
|
|
<seg>
|
|
Composto de JIS X0201:1997 / JIS X0208:1997 / extensões IBM / extensões NEC
|
|
</seg>
|
|
<seg>
|
|
Embora esta "codificação" use o mesmo esquema de codificação que
|
|
Shift_JIS, o conjunto de caracteres subjacente é diferente. Isso significa que alguns códigos
|
|
pontos mapeiam para caracteres diferentes do Shift_JIS.
|
|
</seg>
|
|
<seg>(none)</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-2022-JP (preferred MIME name) / csISO2022JP</seg>
|
|
<seg>
|
|
US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983
|
|
</seg>
|
|
<seg><link xlink:href="&url.rfc;1468">RFC1468</link></seg>
|
|
<seg>(nenhum)</seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>JIS</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-1</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-2</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-3</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-4</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-5</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-6</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-7</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-8</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-9</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-10</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-13</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-14</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-15</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-8859-16</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>byte2be</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>byte2le</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>byte4be</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>byte4le</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>BASE64</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>HTML-ENTITIES</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>7bit</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>8bit</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>EUC-CN</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>CP936</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>HZ</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>EUC-TW</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>CP950</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>BIG-5</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>EUC-KR</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>UHC (CP949)</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>ISO-2022-KR</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>Windows-1251 (CP1251)</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>Windows-1252 (CP1252)</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>CP866 (IBM866)</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>KOI8-R</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
<seglistitem>
|
|
<seg>KOI8-U</seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
<seg></seg>
|
|
</seglistitem>
|
|
</segmentedlist>
|
|
</chapter>
|
|
|
|
<!-- Keep this comment at the end of the file
|
|
Local variables:
|
|
mode: sgml
|
|
sgml-omittag:t
|
|
sgml-shorttag:t
|
|
sgml-minimize-attributes:nil
|
|
sgml-always-quote-attributes:t
|
|
sgml-indent-step:1
|
|
sgml-indent-data:t
|
|
indent-tabs-mode:nil
|
|
sgml-parent-document:nil
|
|
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
|
|
sgml-exposed-tags:nil
|
|
sgml-local-catalogs:nil
|
|
sgml-local-ecat-files:nil
|
|
End:
|
|
|
|
vim600: syn=xml fen fdm=syntax fdl=2 si
|
|
vim: et tw=78 syn=sgml
|
|
vi: ts=1 sw=1
|
|
-->
|