mb_detect_encodingDétecte un encodage
&reftitle.description;
stringfalsemb_detect_encodingstringstringarraystringnullencodings&null;boolstrict&false;
Détecte l'encodage le plus probable pour la &string;
string depuis une liste ordonnée de candidats.
La détection automatique du jeu d'encodage prévu n'est jamais totalement
fiable ; sans information additionnelles, c'est similaire à décoder une
chaîne chiffré sans la clé. Il est toujours préférable d'utiliser une
indication du jeu d'encodage stocké ou transmis avec les données,
tel que l'en-tête HTTP "Content-Type".
Cette fonction est le plus utilise avec les encodages multioctets, où
pas toutes les séquences d'octets forment une chaîne valide. Si la chaîne
d'entrée contient un telle séquence, cet encodage sera rejeté, et le
prochain encodage sera vérifié.
&reftitle.parameters;
string
La string étant inspecté.
encodings
Une liste d'encodage de caractères à essayer, dans l'ordre.
Cette liste peut être spécifier comme un &array; de &string;,
en tant qu'une &string; unique séparé par des virgules.
Si encodings est omis ou &null;,
le detect_order actuel (défini avec l'option de configuration
mbstring.detect_order,
ou la fonction mb_detect_order) sera utilisé.
strict
Contrôle le comportement quand string n'est
valide dans aucun des encodings listé.
Si strict est défini à &false;, l'encodage qui
correspond le plus sera retourné ; si strict
est défini à &true;, &false; sera retourné.
La valeur par défaut de strict peut être définie
avec l'option de configuration
mbstring.strict_detection.
&reftitle.returnvalues;
L'encodage de caractère détecté, ou &false; si la chaîne n'est pas valide
dans un seul des encodages listé.
&reftitle.examples;
Exemple avec mb_detect_encoding
]]>
Effet du paramètre strict
]]>
&example.outputs;
Dans certain cas, la même séquences d'octet peut former une chaîne valide
dans différents encodages de caractères, et il est impossible de déterminer
quelle interprétation était prévu. Par example, parmi tant d'autres,
séquance d'octets "\xC4\xA2" pourrait être :
"Ä¢" (U+00C4 LATIN CAPITAL LETTER A WITH DIAERESIS suivi de U+00A2 CENT SIGN)
encodé dans un de ISO-8859-1, ISO-8859-15, ou Windows-1252
"ФЂ" (U+0424 CYRILLIC CAPITAL LETTER EF suivi de U+0402 CYRILLIC CAPITAL LETTER
DJE) encodé en ISO-8859-5
"Ģ" (U+0122 LATIN CAPITAL LETTER G WITH CEDILLA) encodé en UTF-8
Effet de l'ordre quand plusieurs encodages correspondent
]]>
&example.outputs;
&reftitle.seealso;
mb_detect_order