Files
archived-doc-pt-br/reference/xml/encoding.xml
Leonardo Lara Rodrigues fd5cc77df0 Updates to outdated pages in reference/xml and xmlrpc (#383)
Co-authored-by: LEONARDO LARA RODRIGUES <leonardolara@github.com>
2023-12-05 10:28:45 -03:00

70 lines
2.9 KiB
XML

<?xml version="1.0" encoding="UTF-8"?>
<!-- EN-Revision: af4410a7e15898c3dbe83d6ea38246745ed9c6fb Maintainer: felipe Status: ready --><!-- CREDITS: surfmax,leonardolara -->
<article xml:id="xml.encoding" xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink">
<title>Codificação de caracteres</title>
<para>
A Extensão XML do PHP suporta o conjunto de caracteres <link
xlink:href="&url.unicode;">Unicode</link> definido por
diferentes <glossterm>codificações de caracteres</glossterm>
diferentes. Há dois tipos de codificação de caracteres, <glossterm>codificação
da fonte</glossterm> e <glossterm>codificação do destino</glossterm>.
A apresentação interna do PHP do documento é sempre codificada
com <literal>UTF-8</literal>.
</para>
<para>
Codificação na fonte é feita quando um documento XML é <link
linkend="function.xml-parse">analisado</link>. Ao <link
linkend="function.xml-parser-create">criar um analisador
XML</link>, uma codificação na fonte pode ser especificada (esta codificação
não poderá ser alterada mais tarde durante a atividade do analisador XML). As
codificações na fonte suportadas são <literal>ISO-8859-1</literal>,
<literal>US-ASCII</literal> e <literal>UTF-8</literal>. As duas
primeiras são codificações de um byte, o que significa que cada
caractere é representado por um único byte.
<literal>UTF-8</literal> pode codificar caracteres compostos por
um número variável de bits (até 21) em um a quatro bytes. A
codificação na fonte padrão usada pelo PHP é
<literal>ISO-8859-1</literal>.
</para>
<para>
Codificação no destino é feita quando o PHP passa dados para as funções
do analisador XML. Quando um analisador XML é criado, a codificação no destino
é definido como a mesma da fonte, mas isto pode ser
alterado a qualquer momento. A codificação no destino afetará dados de caracteres
e também nomes de etiquetas e alvos de instrução de processamento.
</para>
<para>
Se o analisador XML encontrar caracteres de fora da faixa na qual
sua codificação na fonte seja capaz de representar, ele retornará
um erro.
</para>
<para>
Se o PHP encontrar caracteres no documento XML analisado que não
possam ser representados na codificação de destino escolhida, os caracteres com
problema serão "rebaixados". Atualmente, isto significa que tais caracteres serão
substituídos por um sinal de interrogação.
</para>
</article>
<!-- Keep this comment at the end of the file
Local variables:
mode: sgml
sgml-omittag:t
sgml-shorttag:t
sgml-minimize-attributes:nil
sgml-always-quote-attributes:t
sgml-indent-step:1
sgml-indent-data:t
indent-tabs-mode:nil
sgml-parent-document:nil
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
sgml-exposed-tags:nil
sgml-local-catalogs:nil
sgml-local-ecat-files:nil
End:
vim600: syn=xml fen fdm=syntax fdl=2 si
vim: et tw=78 syn=sgml
vi: ts=1 sw=1
-->