mirror of
https://github.com/macintoshplus/doc-fr.git
synced 2026-03-24 17:02:18 +01:00
274 lines
8.1 KiB
XML
274 lines
8.1 KiB
XML
<?xml version="1.0" encoding="utf-8"?>
|
|
<!-- $Revision$ -->
|
|
<!-- EN-Revision: b676d0b9c968ebb0b7429835f2f6bd364275eed1 Maintainer: yannick Status: ready -->
|
|
<!-- Reviewed: yes -->
|
|
<refentry xmlns="http://docbook.org/ns/docbook" xml:id="function.utf8-decode">
|
|
<refnamediv>
|
|
<refname>utf8_decode</refname>
|
|
<refpurpose>
|
|
Convertit une chaîne UTF-8 en ISO-8859-1, en remplaçant les caractères invalides ou non représentables.
|
|
</refpurpose>
|
|
</refnamediv>
|
|
|
|
<refsynopsisdiv>
|
|
&warn.deprecated.function-8-2-0;
|
|
</refsynopsisdiv>
|
|
|
|
<refsect1 role="description">
|
|
&reftitle.description;
|
|
<methodsynopsis>
|
|
<type>string</type><methodname>utf8_decode</methodname>
|
|
<methodparam><type>string</type><parameter>string</parameter></methodparam>
|
|
</methodsynopsis>
|
|
<para>
|
|
<function>utf8_decode</function> décode la chaîne
|
|
<parameter>string</parameter>, en supposant qu'elle est au format
|
|
<literal>UTF-8</literal>, et la convertit au format
|
|
<literal>ISO-8859-1</literal>. Les octets dans la chaîne qui ne sont pas
|
|
valides en <literal>UTF-8</literal> et les caractères <literal>UTF-8</literal>
|
|
qui n'existent pas en <literal>ISO-8859-1</literal> (qui sont, les caractères
|
|
au-dessus de <literal>U+00FF</literal>) sont remplacés par <literal>?</literal>.
|
|
</para>
|
|
|
|
<note>
|
|
<para>
|
|
De nombreuses pages Web marquées comme utilisant l'encodage de caratères
|
|
<literal>ISO-8859-1</literal> utilisent effectivement un encodage similaire
|
|
à <literal>Windows-1252</literal>, et les navigateurs Web interpréterons
|
|
les pages Web <literal>ISO-8859-1</literal> comme
|
|
<literal>Windows-1252</literal>. Les caractéristiques supplémentaires
|
|
de <literal>Windows-1252</literal> sont des caractères imprimables,
|
|
tels que le signe euro (<literal>€</literal>) et les guillemets bouclés
|
|
(<literal>“</literal> <literal>”</literal>), à la place de certains
|
|
caractères de contrôle de l'<literal>ISO-8859-1</literal>. Cette fonction
|
|
ne convertira pas ces caractères <literal>Windows-1252</literal>
|
|
correctement. Utilisez une fonction différente si une conversion
|
|
<literal>Windows-1252</literal> est nécessaire.
|
|
</para>
|
|
</note>
|
|
</refsect1>
|
|
|
|
<refsect1 role="parameters">
|
|
&reftitle.parameters;
|
|
<para>
|
|
<variablelist>
|
|
<varlistentry>
|
|
<term><parameter>string</parameter></term>
|
|
<listitem>
|
|
<para>
|
|
La chaîne encodée UTF-8.
|
|
</para>
|
|
</listitem>
|
|
</varlistentry>
|
|
</variablelist>
|
|
</para>
|
|
</refsect1>
|
|
|
|
<refsect1 role="returnvalues">
|
|
&reftitle.returnvalues;
|
|
<para>
|
|
Retourne la chaîne <parameter>string</parameter> convertie en ISO-8859-1.
|
|
</para>
|
|
</refsect1>
|
|
|
|
<refsect1 role="changelog">
|
|
&reftitle.changelog;
|
|
<para>
|
|
<informaltable>
|
|
<tgroup cols="2">
|
|
<thead>
|
|
<row>
|
|
<entry>&Version;</entry>
|
|
<entry>&Description;</entry>
|
|
</row>
|
|
</thead>
|
|
<tbody>
|
|
<row>
|
|
<entry>8.2.0</entry>
|
|
<entry>
|
|
Cette fonction a été rendue obsolète.
|
|
</entry>
|
|
</row>
|
|
<row>
|
|
<entry>7.2.0</entry>
|
|
<entry>
|
|
Cette fonction a été déplacée dans le cœur de PHP ; auparavant, il était
|
|
nécessaire d'installer l'extension XML pour l'utiliser.
|
|
</entry>
|
|
</row>
|
|
</tbody>
|
|
</tgroup>
|
|
</informaltable>
|
|
</para>
|
|
</refsect1>
|
|
|
|
<refsect1 role="examples">
|
|
&reftitle.examples;
|
|
<example>
|
|
<title>Exemple d'utilisation</title>
|
|
<programlisting role="php">
|
|
<![CDATA[
|
|
<?php
|
|
// Convertit la chaîne 'Zoë' de UTF-8 à ISO 8859-1
|
|
$utf8_string = "\x5A\x6F\xC3\xAB";
|
|
$iso8859_1_string = utf8_decode($utf8_string);
|
|
echo bin2hex($iso8859_1_string), "\n";
|
|
|
|
// Les séquences UTF-8 non valides sont remplacées par '?'
|
|
$invalid_utf8_string = "\xC3";
|
|
$iso8859_1_string = utf8_decode($invalid_utf8_string);
|
|
var_dump($iso8859_1_string);
|
|
|
|
// Les caractères qui n'existent pas dans la norme ISO 8859-1,
|
|
// tels que '€' (signe de l'euro) sont égalements remplacés par '?'
|
|
$utf8_string = "\xE2\x82\xAC";
|
|
$iso8859_1_string = utf8_decode($utf8_string);
|
|
var_dump($iso8859_1_string);
|
|
?>
|
|
]]>
|
|
</programlisting>
|
|
&example.outputs;
|
|
<screen>
|
|
<![CDATA[
|
|
5a6feb
|
|
string(1) "?"
|
|
string(1) "?"
|
|
]]>
|
|
</screen>
|
|
</example>
|
|
</refsect1>
|
|
|
|
<refsect1 role="notes">
|
|
<title>Notes</title>
|
|
<note>
|
|
<title>Dépréciation et alternatives</title>
|
|
<para>
|
|
Cette fonction est <emphasis>obsolète</emphasis> à partir de PHP 8.2.0
|
|
et sera supprimée dans une version future. Les utilisations existantes devraient être vérifiées
|
|
et remplacées par des alternatives appropriées.
|
|
</para>
|
|
<para>
|
|
Une fonctionnalité similaire peut être obtenue avec <function>mb_convert_encoding</function>,
|
|
qui prend en charge ISO-8859-1 et de nombreux autres encodages de caractères.
|
|
<informalexample>
|
|
<programlisting role="php">
|
|
<![CDATA[
|
|
<?php
|
|
$utf8_string = "\xC3\xAB"; // 'ë' (e with diaeresis) in UTF-8
|
|
$iso8859_1_string = mb_convert_encoding($utf8_string, 'ISO-8859-1', 'UTF-8');
|
|
echo bin2hex($iso8859_1_string), "\n";
|
|
|
|
$utf8_string = "\xCE\xBB"; // 'λ' (Greek lower-case lambda) in UTF-8
|
|
$iso8859_7_string = mb_convert_encoding($utf8_string, 'ISO-8859-7', 'UTF-8');
|
|
echo bin2hex($iso8859_7_string), "\n";
|
|
|
|
$utf8_string = "\xE2\x82\xAC"; // '€' (Euro sign) in UTF-8 (not present in ISO-8859-1)
|
|
$windows_1252_string = mb_convert_encoding($utf8_string, 'Windows-1252', 'UTF-8');
|
|
echo bin2hex($windows_1252_string), "\n";
|
|
?>
|
|
]]>
|
|
</programlisting>
|
|
&example.outputs;
|
|
<screen>
|
|
<![CDATA[
|
|
eb
|
|
eb
|
|
80
|
|
]]>
|
|
</screen>
|
|
</informalexample>
|
|
</para>
|
|
<para>
|
|
D'autres options peuvent être disponibles en fonction des extensions installées,
|
|
telles que <methodname>UConverter::transcode</methodname> et <function>iconv</function>.
|
|
</para>
|
|
<para>
|
|
Les exemples suivants donnent tous le même résultat :
|
|
<informalexample>
|
|
<programlisting role="php">
|
|
<![CDATA[
|
|
<?php
|
|
$utf8_string = "\x5A\x6F\xC3\xAB"; // 'Zoë' in UTF-8
|
|
$iso8859_1_string = utf8_decode($utf8_string);
|
|
echo bin2hex($iso8859_1_string), "\n";
|
|
|
|
$iso8859_1_string = mb_convert_encoding($utf8_string, 'ISO-8859-1', 'UTF-8');
|
|
echo bin2hex($iso8859_1_string), "\n";
|
|
|
|
$iso8859_1_string = iconv('UTF-8', 'ISO-8859-1', $utf8_string);
|
|
echo bin2hex($iso8859_1_string), "\n";
|
|
|
|
$iso8859_1_string = UConverter::transcode($utf8_string, 'ISO-8859-1', 'UTF8');
|
|
echo bin2hex($iso8859_1_string), "\n";
|
|
?>
|
|
]]>
|
|
</programlisting>
|
|
&example.outputs;
|
|
<screen>
|
|
<![CDATA[
|
|
5a6feb
|
|
5a6feb
|
|
5a6feb
|
|
5a6feb
|
|
]]>
|
|
</screen>
|
|
</informalexample>
|
|
En spécifiant <literal>'?'</literal> comme option <literal>'to_subst'</literal> pour <methodname>UConverter::transcode</methodname>,
|
|
on obtient le même résultat que <function>utf8_decode</function> pour les chaînes qui sont invalides ou qui ne peuvent pas être représentées en ISO 8859-1.
|
|
<informalexample>
|
|
<programlisting role="php">
|
|
<![CDATA[
|
|
<?php
|
|
$utf8_string = "\xE2\x82\xAC"; // € (Euro Sign) does not exist in ISO 8859-1
|
|
$iso8859_1_string = UConverter::transcode(
|
|
$utf8_string, 'ISO-8859-1', 'UTF-8', ['to_subst' => '?']
|
|
);
|
|
var_dump($iso8859_1_string);
|
|
?>
|
|
]]>
|
|
</programlisting>
|
|
&example.outputs;
|
|
<screen>
|
|
<![CDATA[
|
|
sring(1) "?"
|
|
]]>
|
|
</screen>
|
|
</informalexample>
|
|
</para>
|
|
</note>
|
|
</refsect1>
|
|
|
|
<refsect1 role="seealso">
|
|
&reftitle.seealso;
|
|
<para>
|
|
<simplelist>
|
|
<member><function>utf8_encode</function></member>
|
|
<member><function>mb_convert_encoding</function></member>
|
|
<member><methodname>UConverter::transcode</methodname></member>
|
|
<member><function>iconv</function></member>
|
|
</simplelist>
|
|
</para>
|
|
</refsect1>
|
|
|
|
</refentry>
|
|
<!-- Keep this comment at the end of the file
|
|
Local variables:
|
|
mode: sgml
|
|
sgml-omittag:t
|
|
sgml-shorttag:t
|
|
sgml-minimize-attributes:nil
|
|
sgml-always-quote-attributes:t
|
|
sgml-indent-step:1
|
|
sgml-indent-data:t
|
|
indent-tabs-mode:nil
|
|
sgml-parent-document:nil
|
|
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
|
|
sgml-exposed-tags:nil
|
|
sgml-local-catalogs:nil
|
|
sgml-local-ecat-files:nil
|
|
End:
|
|
vim600: syn=xml fen fdm=syntax fdl=2 si
|
|
vim: et tw=78 syn=sgml
|
|
vi: ts=1 sw=1
|
|
-->
|