mirror of
https://github.com/php/doc-pt_br.git
synced 2026-03-23 22:52:12 +01:00
70 lines
2.9 KiB
XML
70 lines
2.9 KiB
XML
<?xml version="1.0" encoding="UTF-8"?>
|
|
<!-- EN-Revision: af4410a7e15898c3dbe83d6ea38246745ed9c6fb Maintainer: felipe Status: ready --><!-- CREDITS: surfmax,leonardolara -->
|
|
<article xml:id="xml.encoding" xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink">
|
|
<title>Codificação de caracteres</title>
|
|
<para>
|
|
A Extensão XML do PHP suporta o conjunto de caracteres <link
|
|
xlink:href="&url.unicode;">Unicode</link> definido por
|
|
diferentes <glossterm>codificações de caracteres</glossterm>
|
|
diferentes. Há dois tipos de codificação de caracteres, <glossterm>codificação
|
|
da fonte</glossterm> e <glossterm>codificação do destino</glossterm>.
|
|
A apresentação interna do PHP do documento é sempre codificada
|
|
com <literal>UTF-8</literal>.
|
|
</para>
|
|
<para>
|
|
Codificação na fonte é feita quando um documento XML é <link
|
|
linkend="function.xml-parse">analisado</link>. Ao <link
|
|
linkend="function.xml-parser-create">criar um analisador
|
|
XML</link>, uma codificação na fonte pode ser especificada (esta codificação
|
|
não poderá ser alterada mais tarde durante a atividade do analisador XML). As
|
|
codificações na fonte suportadas são <literal>ISO-8859-1</literal>,
|
|
<literal>US-ASCII</literal> e <literal>UTF-8</literal>. As duas
|
|
primeiras são codificações de um byte, o que significa que cada
|
|
caractere é representado por um único byte.
|
|
<literal>UTF-8</literal> pode codificar caracteres compostos por
|
|
um número variável de bits (até 21) em um a quatro bytes. A
|
|
codificação na fonte padrão usada pelo PHP é
|
|
<literal>ISO-8859-1</literal>.
|
|
</para>
|
|
<para>
|
|
Codificação no destino é feita quando o PHP passa dados para as funções
|
|
do analisador XML. Quando um analisador XML é criado, a codificação no destino
|
|
é definido como a mesma da fonte, mas isto pode ser
|
|
alterado a qualquer momento. A codificação no destino afetará dados de caracteres
|
|
e também nomes de etiquetas e alvos de instrução de processamento.
|
|
</para>
|
|
<para>
|
|
Se o analisador XML encontrar caracteres de fora da faixa na qual
|
|
sua codificação na fonte seja capaz de representar, ele retornará
|
|
um erro.
|
|
</para>
|
|
<para>
|
|
Se o PHP encontrar caracteres no documento XML analisado que não
|
|
possam ser representados na codificação de destino escolhida, os caracteres com
|
|
problema serão "rebaixados". Atualmente, isto significa que tais caracteres serão
|
|
substituídos por um sinal de interrogação.
|
|
</para>
|
|
</article>
|
|
|
|
<!-- Keep this comment at the end of the file
|
|
Local variables:
|
|
mode: sgml
|
|
sgml-omittag:t
|
|
sgml-shorttag:t
|
|
sgml-minimize-attributes:nil
|
|
sgml-always-quote-attributes:t
|
|
sgml-indent-step:1
|
|
sgml-indent-data:t
|
|
indent-tabs-mode:nil
|
|
sgml-parent-document:nil
|
|
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
|
|
sgml-exposed-tags:nil
|
|
sgml-local-catalogs:nil
|
|
sgml-local-ecat-files:nil
|
|
End:
|
|
vim600: syn=xml fen fdm=syntax fdl=2 si
|
|
vim: et tw=78 syn=sgml
|
|
vi: ts=1 sw=1
|
|
-->
|
|
|