1
0
mirror of https://github.com/php/doc-ru.git synced 2026-03-24 07:42:22 +01:00
Files
archived-doc-ru/reference/mbstring/ja-basic.xml

83 lines
4.3 KiB
XML
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
<?xml version="1.0" encoding="utf-8"?>
<!-- EN-Revision: 8cdc6621f9826d04abc3e50438c010804d7e8683 Maintainer: tmn Status: ready -->
<!-- Reviewed: no -->
<chapter xml:id="mbstring.ja-basic" xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink">
<title>Основы японских многобайтовых кодировок</title>
<para>
Японские символы представляются только в многобайтовых кодировках,
и многие стандарты кодирования зависят от платформы и назначения текста.
Осложняет ситуацию то, что эти стандарты содержат незначительные отличия.
Чтобы создать веб-приложение, которое будет правильно работать в японском окружении,
разработчику потребуется учитывать эти сложности, чтобы гарантировать отображение
или передачу символов в правильных кодировках.
</para>
<para>
<itemizedlist>
<listitem>
<simpara>Один символ занимает в памяти до шести байтов.</simpara>
</listitem>
<listitem>
<simpara>
Бо́льшая часть японских многобайтовых символов выглядит в 2 раза шире,
чем однобайтовые символы. Такие символы по-японски
называются zen-kaku что означает «полноширинный».
Другие, более узкие символы называются han-kaku, что означает
«полуширинные». Конкретные графические свойства символов зависят
от шрифта, которым они отображаются.
</simpara>
</listitem>
<listitem>
<simpara>
В отдельных кодировках символов карту кодов конкретной области кодов —
в диапазоне от <literal>00</literal> до <literal>7f</literal> в шестнадцатеричной форме —
изменяют последовательностями сдвига — escape-последовательностями,
которые определяет стандарт ISO-2022.
</simpara>
</listitem>
<listitem>
<simpara>
При сетевом обмене по протоколам SMTP и NNTP японские символы передают в кодировке ISO-2022-JP;
заголовки HTTP-сообщения, а также заголовки и тело полезной нагрузки HTTP-сообщения перекодируют по правилам RFC-стандартов.
Даже если перекодировка не нужна, она всё же не помешает, поскольку отдельные
популярные пользовательские агенты не умеют распознавать другие методы кодирования.
</simpara>
</listitem>
<listitem>
<simpara>
Веб-страницам для служб мобильной связи наподобие
<link xlink:href="&url.imode;">i-mode</link>
и <link xlink:href="&url.ezweb;">EZweb</link>
требуется кодировка Shift_JIS.
</simpara>
</listitem>
<listitem>
<simpara>
Службы мобильной связи наподобие <link xlink:href="&url.imode;">i-mode</link>
и <link xlink:href="&url.ezweb;">EZweb</link> поддерживают
эмодзи.
</simpara>
</listitem>
</itemizedlist>
</para>
</chapter>
<!-- Keep this comment at the end of the file
Local variables:
mode: sgml
sgml-omittag:t
sgml-shorttag:t
sgml-minimize-attributes:nil
sgml-always-quote-attributes:t
sgml-indent-step:1
sgml-indent-data:t
indent-tabs-mode:nil
sgml-parent-document:nil
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
sgml-exposed-tags:nil
sgml-local-catalogs:nil
sgml-local-ecat-files:nil
End:
vim600: syn=xml fen fdm=syntax fdl=2 si
vim: et tw=78 syn=sgml
vi: ts=1 sw=1
-->