1
0
mirror of https://github.com/php/doc-ru.git synced 2026-03-25 16:22:18 +01:00
Files
archived-doc-ru/reference/mbstring/book.xml
2022-10-18 14:23:31 +03:00

74 lines
4.3 KiB
XML
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
<?xml version="1.0" encoding="utf-8"?>
<!-- Reviewed: no -->
<!-- EN-Revision: 740eb58e8c03cfc5ac98eda13943262775b73ff2 Maintainer: mch Status: ready -->
<book xml:id="book.mbstring" xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink">
<?phpdoc extension-membership="bundled" ?>
<title>Многобайтовые строки</title>
<!-- {{{ preface -->
<preface xml:id="intro.mbstring">
&reftitle.intro;
<para>
Хотя и существует множество языков, в которых все необходимые символы можно
закодировать одним восьмибитным значением, существуют также и языки, требующие
столько символов, что они не умещаются в один байт (Байт состоит из восьми бит.
Каждый бит может содержать одно из двух различных значений, единицу или ноль.
Поэтому, один байт может задавать только 256 уникальных значений (два в восьмой степени)).
Схемы кодирования, использующие многобайтовые строки, были разработаны для того,
чтобы можно было пользоваться более, чем 256 символами, при этом продолжая работать
со строками, как будто они закодированы в обычной побайтовой системе.
</para>
<para>
Когда вы работаете с многобайтовыми строками (удаляете пробельные символы с
помощью функции trim, разбиваете строку на массив по регулярному выражению с
помощью функции split, и т.д.), необходимо использовать специальные функции,
так как в таких кодировках два или более последовательных байта могут задавать
один символ. Иначе, если применить функцию, не умеющую работать с многобайтовыми
строками, она, вероятно, не сможет определить начало и конец многобайтовых
символов, и в итоге вы получите строку-мусор, которая, скорее
всего, потеряет исходное значение.
</para>
<para>
<literal>mbstring</literal> предоставляет функции для работы с многобайтовыми строками,
которые облегчают работу c многобайтовыми кодировками в PHP. Кроме того,
<literal>mbstring</literal> занимается конвертированием строк из одной кодировки в другую.
<literal>mbstring</literal> предназначен для работы с Unicode-кодировками, такими, как UTF-8 и UCS-2,
а также со многими однобайтовыми кодировками для удобства (перечисленными в списке
<link linkend="mbstring.supported-encodings">Поддерживаемых кодировок символов</link>).
</para>
</preface>
<!-- }}} -->
&reference.mbstring.setup;
&reference.mbstring.constants;
&reference.mbstring.encodings;
&reference.mbstring.ja-basic;
&reference.mbstring.http-inout;
&reference.mbstring.supported-encodings;
&reference.mbstring.overloading;
&reference.mbstring.encoding-requirements;
&reference.mbstring.reference;
</book>
<!-- Keep this comment at the end of the file
Local variables:
mode: sgml
sgml-omittag:t
sgml-shorttag:t
sgml-minimize-attributes:nil
sgml-always-quote-attributes:t
sgml-indent-step:1
sgml-indent-data:t
indent-tabs-mode:nil
sgml-parent-document:nil
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
sgml-exposed-tags:nil
sgml-local-catalogs:nil
sgml-local-ecat-files:nil
End:
vim600: syn=xml fen fdm=syntax fdl=2 si
vim: et tw=78 syn=sgml
vi: ts=1 sw=1
-->