1
0
mirror of https://github.com/php/doc-ja.git synced 2026-03-24 07:02:08 +01:00
Files
archived-doc-ja/reference/strings/functions/utf8-decode.xml
Yoshinari Takaoka 4773312462 [ext/strings] followed all updates made on or after November 1, 2024.
- WASM の example 修正
- number_format まわりの誤訳
- その他細かい修正全てに追随

https://github.com/php/doc-en/commits/master/reference/strings
2025-08-23 15:55:59 +09:00

274 lines
8.2 KiB
XML

<?xml version="1.0" encoding="utf-8"?>
<!-- $Revision$ -->
<!-- EN-Revision: 9b1673cf114a1e10c4563ab9223cb56aed552b89 Maintainer: hirokawa Status: ready -->
<!-- Credits: mumumu -->
<refentry xml:id="function.utf8-decode" xmlns="http://docbook.org/ns/docbook">
<refnamediv>
<refname>utf8_decode</refname>
<refpurpose>
UTF-8 エンコードされた文字列を、ISO-8859-1 に変換し、表現できない文字を置換する
</refpurpose>
</refnamediv>
<refsynopsisdiv>
&warn.deprecated.function-8-2-0;
</refsynopsisdiv>
<refsect1 role="description">
&reftitle.description;
<methodsynopsis>
<modifier role="attribute">#[\Deprecated]</modifier>
<type>string</type><methodname>utf8_decode</methodname>
<methodparam><type>string</type><parameter>string</parameter></methodparam>
</methodsynopsis>
<para>
この関数は、文字列 <parameter>string</parameter><literal>UTF-8</literal>
エンコードから <literal>ISO-8859-1</literal> へ変換します。
有効な <literal>UTF-8</literal> ではない文字列バイト、
および <literal>ISO-8859-1</literal> に存在しない <literal>UTF-8</literal> の文字
(つまり、<literal>U+00FF</literal> 以降のコードポイント) は、
<literal>?</literal> に置き換えられます。
</para>
<note>
<para>
<literal>ISO-8859-1</literal> 文字エンコーディングを使っているとマークされている
多くの Web ページが、実際にはそれと似た <literal>Windows-1252</literal> を使っており、
Web ブラウザは <literal>ISO-8859-1</literal> Web ページを <literal>Windows-1252</literal>
として解釈しています。<literal>Windows-1252</literal>
<literal>ISO-8859-1</literal> のある制御文字の代わりに、ユーロ記号
(<literal></literal>) や curly quote (<literal></literal>
<literal></literal>) を印字可能な文字として追加しています。
この関数はそうした <literal>Windows-1252</literal> 文字を正しく変換しません。
<literal>Windows-1252</literal> の変換が必要な場合は、別の関数を使ってください。
</para>
</note>
</refsect1>
<refsect1 role="parameters">
&reftitle.parameters;
<para>
<variablelist>
<varlistentry>
<term><parameter>string</parameter></term>
<listitem>
<para>
UTF-8 エンコードされた文字列。
</para>
</listitem>
</varlistentry>
</variablelist>
</para>
</refsect1>
<refsect1 role="returnvalues">
&reftitle.returnvalues;
<para>
<parameter>string</parameter> を ISO-8859-1 に変換した結果を返します。
</para>
</refsect1>
<refsect1 role="changelog">
&reftitle.changelog;
<para>
<informaltable>
<tgroup cols="2">
<thead>
<row>
<entry>&Version;</entry>
<entry>&Description;</entry>
</row>
</thead>
<tbody>
<row>
<entry>8.2.0</entry>
<entry>
この関数は、推奨されなくなりました。
</entry>
</row>
<row>
<entry>7.2.0</entry>
<entry>
この関数は、XML拡張モジュールから PHP のコアに移動しました。
これより前のバージョンでは、
この関数は XML拡張モジュール をインストールしていた場合にのみ利用可能でした。
</entry>
</row>
</tbody>
</tgroup>
</informaltable>
</para>
</refsect1>
<refsect1 role="examples">
&reftitle.examples;
<example>
<title>基本的な例</title>
<programlisting role="php">
<![CDATA[
<?php
// Convert the string 'Zoë' from UTF-8 to ISO 8859-1
$utf8_string = "\x5A\x6F\xC3\xAB";
$iso8859_1_string = utf8_decode($utf8_string);
echo bin2hex($iso8859_1_string), "\n";
// Invalid UTF-8 sequences are replaced with '?'
$invalid_utf8_string = "\xC3";
$iso8859_1_string = utf8_decode($invalid_utf8_string);
var_dump($iso8859_1_string);
// Characters which don't exist in ISO 8859-1, such as
// '€' (Euro Sign) are also replaced with '?'
$utf8_string = "\xE2\x82\xAC";
$iso8859_1_string = utf8_decode($utf8_string);
var_dump($iso8859_1_string);
?>
]]>
</programlisting>
&example.outputs;
<screen>
<![CDATA[
5a6feb
string(1) "?"
string(1) "?"
]]>
</screen>
</example>
</refsect1>
<refsect1 role="notes">
&reftitle.notes;
<note>
<title>この関数は推奨されません。代替については下記のとおりです。</title>
<para>
この関数は、PHP 8.2.0 以降は推奨されなくなり、
将来のバージョンで削除される予定です。
この関数を使っているコードをチェックし、適切な代替に置き換えるべきです。
</para>
<para>
この関数と似た機能は、
<function>mb_convert_encoding</function> で実現できます。
この関数は、ISO-8859-1 と、多くの他の文字エンコーディングをサポートしています。
<informalexample>
<programlisting role="php">
<![CDATA[
<?php
$utf8_string = "\xC3\xAB"; // 'ë' (e with diaeresis) in UTF-8
$iso8859_1_string = mb_convert_encoding($utf8_string, 'ISO-8859-1', 'UTF-8');
echo bin2hex($iso8859_1_string), "\n";
$utf8_string = "\xCE\xBB"; // 'λ' (Greek lower-case lambda) in UTF-8
$iso8859_7_string = mb_convert_encoding($utf8_string, 'ISO-8859-7', 'UTF-8');
echo bin2hex($iso8859_7_string), "\n";
$utf8_string = "\xE2\x82\xAC"; // '€' (Euro sign) in UTF-8 (not present in ISO-8859-1)
$windows_1252_string = mb_convert_encoding($utf8_string, 'Windows-1252', 'UTF-8');
echo bin2hex($windows_1252_string), "\n";
?>
]]>
</programlisting>
&example.outputs;
<screen>
<![CDATA[
eb
eb
80
]]>
</screen>
</informalexample>
</para>
<para>
他の代替として、インストールされている拡張機能に依存した関数ですが、
<methodname>UConverter::transcode</methodname><function>iconv</function>
が挙げられます。
</para>
<para>
次のコードは、いずれも同じ結果を返します:
<informalexample>
<programlisting role="php">
<![CDATA[
<?php
$utf8_string = "\x5A\x6F\xC3\xAB"; // 'Zoë' in UTF-8
$iso8859_1_string = utf8_decode($utf8_string);
echo bin2hex($iso8859_1_string), "\n";
$iso8859_1_string = mb_convert_encoding($utf8_string, 'ISO-8859-1', 'UTF-8');
echo bin2hex($iso8859_1_string), "\n";
$iso8859_1_string = iconv('UTF-8', 'ISO-8859-1', $utf8_string);
echo bin2hex($iso8859_1_string), "\n";
$iso8859_1_string = UConverter::transcode($utf8_string, 'ISO-8859-1', 'UTF8');
echo bin2hex($iso8859_1_string), "\n";
?>
]]>
</programlisting>
&example.outputs;
<screen>
<![CDATA[
5a6feb
5a6feb
5a6feb
5a6feb
]]>
</screen>
</informalexample>
<methodname>UConverter::transcode</methodname>
<literal>'to_subst'</literal> オプションとして
<literal>'?'</literal> を指定すると、
ISO-8859-1 で表現できないか、不正な文字列の場合の
<function>utf8_decode</function> 関数と同じ結果を返します。
<informalexample>
<programlisting role="php">
<![CDATA[
<?php
$utf8_string = "\xE2\x82\xAC"; // € (Euro Sign) does not exist in ISO 8859-1
$iso8859_1_string = UConverter::transcode(
$utf8_string, 'ISO-8859-1', 'UTF-8', ['to_subst' => '?']
);
var_dump($iso8859_1_string);
?>
]]>
</programlisting>
&example.outputs;
<screen>
<![CDATA[
sring(1) "?"
]]>
</screen>
</informalexample>
</para>
</note>
</refsect1>
<refsect1 role="seealso">
&reftitle.seealso;
<para>
<simplelist>
<member><function>utf8_encode</function></member>
<member><function>mb_convert_encoding</function></member>
<member><methodname>UConverter::transcode</methodname></member>
<member><function>iconv</function></member>
</simplelist>
</para>
</refsect1>
</refentry>
<!-- Keep this comment at the end of the file
Local variables:
mode: sgml
sgml-omittag:t
sgml-shorttag:t
sgml-minimize-attributes:nil
sgml-always-quote-attributes:t
sgml-indent-step:1
sgml-indent-data:t
indent-tabs-mode:nil
sgml-parent-document:nil
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
sgml-exposed-tags:nil
sgml-local-catalogs:nil
sgml-local-ecat-files:nil
End:
vim600: syn=xml fen fdm=syntax fdl=2 si
vim: et tw=78 syn=sgml
vi: ts=1 sw=1
-->