mirror of
https://github.com/macintoshplus/doc-fr.git
synced 2026-03-24 08:52:09 +01:00
121 lines
3.9 KiB
XML
121 lines
3.9 KiB
XML
<?xml version="1.0" encoding="utf-8"?>
|
||
<!-- $Revision$ -->
|
||
<!-- EN-Revision: 20e912791754a34fcdef58be5dfc40b87062b487 Maintainer: yannick Status: ready -->
|
||
<!-- Reviewed: no -->
|
||
|
||
<chapter xml:id="svm.examples" xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink">
|
||
&reftitle.examples;
|
||
|
||
<para>
|
||
Le processus basique consiste à définir des paramètres, soumettre des données
|
||
d’entraînement pour la génération d'un modèle, puis, faire des prédictions basés
|
||
sur ce modèle. Il y a un jeu par défaut de paramètres qui doivent donner des
|
||
résultats avec la plupart des entrées, aussi, nous allons commencer par
|
||
regarder du côté de ces données.
|
||
</para>
|
||
<para>
|
||
Les données sont soumises via un fichier, un flux ou un tableau. Si elles
|
||
sont fournies via un fichier ou un flux, elles doivent contenir une ligne
|
||
par exemple d’entraînement, ligne devant être formatée sous la forme d'une
|
||
classe entière (habituellement 1 et -1), suivi par une séries de paires
|
||
clés/fonctionnalités, dans un ordre croissant des fonctionnalités. Les
|
||
fonctionnalités sont des entiers, et les valeurs, des nombres à virgules
|
||
flottantes dans l'intervalle 0-1. Par exemple :
|
||
</para>
|
||
<para>
|
||
-1 1:0.43 3:0.12 9284:0.2
|
||
</para>
|
||
<para>
|
||
Dans un problème de classification de document, par exemple concernant le
|
||
spam, chaque ligne doit représenter un document. Il doit y avoir 2 classes,
|
||
-1 pour les spam, 1 pour les ham. Chaque fonctionnalité représente des mots,
|
||
et les valeurs représentent l'importance de ces mots dans le document (par
|
||
exemple le fréquence de rencontre de ces mots dans le document, avec le total
|
||
dans le bon intervalle). Les fonctionnalités présentant la valeur 0 (i.e.
|
||
le mot n'apparaît pas du tout dans le document) ne seront tout simplement
|
||
pas inclues.
|
||
</para>
|
||
<para>
|
||
Dans mode tableau, les données doivent être passées sous la forme de tableaux
|
||
de tableaux. Chaque sous-tableau doit avoir la classe comme premier élément,
|
||
plus, clés => jeux de valeurs pour les paires de fonctionnalité/valeur.
|
||
</para>
|
||
<para>
|
||
Ces donnée sont passées à la fonction d’entraînement de la classe SVM,
|
||
qui retournera un modèle SVM en cas de succès.
|
||
</para>
|
||
<para>
|
||
Une fois le modèle généré, il peut être utilisé pour faire des prédictions
|
||
sur les données précédentes non vues. Elles peuvent être passées sous forme
|
||
de tableau à la fonction de prédiction du modèle, dans le même format que
|
||
précédemment, mais sans le libellé. La réponse sera la classe.
|
||
</para>
|
||
<para>
|
||
Les modèles peuvent être sauvegardés et restaurés à la demande, en utilisant
|
||
les fonctions de sauvegarde et de chargement, qui prennent toutes les 2 comme
|
||
argument le chemin vers le fichier correspondant.
|
||
</para>
|
||
<para>
|
||
<example>
|
||
<title>Entraînement depuis un tableau</title>
|
||
<programlisting role="php">
|
||
<![CDATA[
|
||
<?php
|
||
$data = array(
|
||
array(-1, 1 => 0.43, 3 => 0.12, 9284 => 0.2),
|
||
array(1, 1 => 0.22, 5 => 0.01, 94 => 0.11),
|
||
);
|
||
|
||
$svm = new SVM();
|
||
$model = $svm->train($data);
|
||
|
||
$data = array(1 => 0.43, 3 => 0.12, 9284 => 0.2);
|
||
$result = $model->predict($data);
|
||
var_dump($result);
|
||
$model->save('model.svm');
|
||
?>
|
||
]]>
|
||
</programlisting>
|
||
&example.outputs.similar;
|
||
<screen>
|
||
<![CDATA[
|
||
int(-1)
|
||
]]>
|
||
</screen>
|
||
</example>
|
||
<example>
|
||
<title>Entraînement depuis un fichier</title>
|
||
<programlisting role="php">
|
||
<![CDATA[
|
||
<?php
|
||
$svm = new SVM();
|
||
$model = $svm->train("traindata.txt");
|
||
?>
|
||
]]>
|
||
</programlisting>
|
||
</example>
|
||
</para>
|
||
</chapter>
|
||
|
||
<!-- Keep this comment at the end of the file
|
||
Local variables:
|
||
mode: sgml
|
||
sgml-omittag:t
|
||
sgml-shorttag:t
|
||
sgml-minimize-attributes:nil
|
||
sgml-always-quote-attributes:t
|
||
sgml-indent-step:1
|
||
sgml-indent-data:t
|
||
indent-tabs-mode:nil
|
||
sgml-parent-document:nil
|
||
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
|
||
sgml-exposed-tags:nil
|
||
sgml-local-catalogs:nil
|
||
sgml-local-ecat-files:nil
|
||
End:
|
||
vim600: syn=xml fen fdm=syntax fdl=2 si
|
||
vim: et tw=78 syn=sgml
|
||
vi: ts=1 sw=1
|
||
-->
|
||
|