Files
doc-fr/reference/svm/examples.xml
2021-02-02 01:17:51 +00:00

121 lines
3.9 KiB
XML
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
<?xml version="1.0" encoding="utf-8"?>
<!-- $Revision$ -->
<!-- EN-Revision: 20e912791754a34fcdef58be5dfc40b87062b487 Maintainer: yannick Status: ready -->
<!-- Reviewed: no -->
<chapter xml:id="svm.examples" xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink">
&reftitle.examples;
<para>
Le processus basique consiste à définir des paramètres, soumettre des données
dentraînement pour la génération d'un modèle, puis, faire des prédictions basés
sur ce modèle. Il y a un jeu par défaut de paramètres qui doivent donner des
résultats avec la plupart des entrées, aussi, nous allons commencer par
regarder du côté de ces données.
</para>
<para>
Les données sont soumises via un fichier, un flux ou un tableau. Si elles
sont fournies via un fichier ou un flux, elles doivent contenir une ligne
par exemple dentraînement, ligne devant être formatée sous la forme d'une
classe entière (habituellement 1 et -1), suivi par une séries de paires
clés/fonctionnalités, dans un ordre croissant des fonctionnalités. Les
fonctionnalités sont des entiers, et les valeurs, des nombres à virgules
flottantes dans l'intervalle 0-1. Par exemple :
</para>
<para>
-1 1:0.43 3:0.12 9284:0.2
</para>
<para>
Dans un problème de classification de document, par exemple concernant le
spam, chaque ligne doit représenter un document. Il doit y avoir 2 classes,
-1 pour les spam, 1 pour les ham. Chaque fonctionnalité représente des mots,
et les valeurs représentent l'importance de ces mots dans le document (par
exemple le fréquence de rencontre de ces mots dans le document, avec le total
dans le bon intervalle). Les fonctionnalités présentant la valeur 0 (i.e.
le mot n'apparaît pas du tout dans le document) ne seront tout simplement
pas inclues.
</para>
<para>
Dans mode tableau, les données doivent être passées sous la forme de tableaux
de tableaux. Chaque sous-tableau doit avoir la classe comme premier élément,
plus, clés => jeux de valeurs pour les paires de fonctionnalité/valeur.
</para>
<para>
Ces donnée sont passées à la fonction dentraînement de la classe SVM,
qui retournera un modèle SVM en cas de succès.
</para>
<para>
Une fois le modèle généré, il peut être utilisé pour faire des prédictions
sur les données précédentes non vues. Elles peuvent être passées sous forme
de tableau à la fonction de prédiction du modèle, dans le même format que
précédemment, mais sans le libellé. La réponse sera la classe.
</para>
<para>
Les modèles peuvent être sauvegardés et restaurés à la demande, en utilisant
les fonctions de sauvegarde et de chargement, qui prennent toutes les 2 comme
argument le chemin vers le fichier correspondant.
</para>
<para>
<example>
<title>Entraînement depuis un tableau</title>
<programlisting role="php">
<![CDATA[
<?php
$data = array(
array(-1, 1 => 0.43, 3 => 0.12, 9284 => 0.2),
array(1, 1 => 0.22, 5 => 0.01, 94 => 0.11),
);
$svm = new SVM();
$model = $svm->train($data);
$data = array(1 => 0.43, 3 => 0.12, 9284 => 0.2);
$result = $model->predict($data);
var_dump($result);
$model->save('model.svm');
?>
]]>
</programlisting>
&example.outputs.similar;
<screen>
<![CDATA[
int(-1)
]]>
</screen>
</example>
<example>
<title>Entraînement depuis un fichier</title>
<programlisting role="php">
<![CDATA[
<?php
$svm = new SVM();
$model = $svm->train("traindata.txt");
?>
]]>
</programlisting>
</example>
</para>
</chapter>
<!-- Keep this comment at the end of the file
Local variables:
mode: sgml
sgml-omittag:t
sgml-shorttag:t
sgml-minimize-attributes:nil
sgml-always-quote-attributes:t
sgml-indent-step:1
sgml-indent-data:t
indent-tabs-mode:nil
sgml-parent-document:nil
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
sgml-exposed-tags:nil
sgml-local-catalogs:nil
sgml-local-ecat-files:nil
End:
vim600: syn=xml fen fdm=syntax fdl=2 si
vim: et tw=78 syn=sgml
vi: ts=1 sw=1
-->