1
0
mirror of https://github.com/php/doc-es.git synced 2026-03-24 07:22:16 +01:00
Files
archived-doc-es/reference/svm/examples.xml
2026-01-26 14:48:26 +00:00

106 lines
3.8 KiB
XML

<?xml version="1.0" encoding="utf-8"?>
<!-- $Revision$ -->
<!-- EN-Revision: 1ca2d4af9471f44743281e6949cb53b8afcaefb8 Maintainer: PhilDaiguille Status: ready -->
<!-- Reviewed: no -->
<chapter xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink" xml:id="svm.examples">
&reftitle.examples;
<simpara>
El proceso básico consiste en definir argumentos, someter datos de entrenamiento para la generación de un modelo y,
posteriormente, realizar predicciones basadas en este modelo. Existe un conjunto predeterminado de argumentos que
deberían proporcionar resultados con la mayoría de las entradas, por lo que se comenzará examinando estos datos.
</simpara>
<simpara>
Los datos se someten a través de un fichero, un flujo o un array. Si se proporcionan a través de un fichero o un
flujo, deben contener una línea por ejemplo de entrenamiento, la cual debe estar formateada como una clase entera
(generalmente 1 y -1), seguida de una serie de pares clave/característica en orden creciente de características. Las
características son enteros y los valores son números de punto flotante en el rango 0-1. Por ejemplo:
</simpara>
<simpara>
-1 1:0.43 3:0.12 9284:0.2
</simpara>
<simpara>
En un problema de clasificación de documentos, por ejemplo, relacionado con el spam, cada línea debe representar un
documento. Debe haber 2 clases, -1 para el spam y 1 para el ham. Cada característica representa palabras y los valores
representan la importancia de estas palabras en el documento (por ejemplo, la frecuencia de aparición de estas
palabras en el documento, con el total en el rango adecuado). Las características con valor 0 (es decir, la palabra no
aparece en absoluto en el documento) simplemente no se incluirán.
</simpara>
<simpara>
En el modo array, los datos deben pasarse en forma de arrays de arrays. Cada subarray debe tener la clase como primer
elemento, más pares clave =&gt; valor para las características/valor.
</simpara>
<simpara>
Estos datos se pasan a la función de entrenamiento de la clase SVM, que devolverá un modelo SVM en caso de éxito.
</simpara>
<simpara>
Una vez generado el modelo, puede utilizarse para realizar predicciones sobre datos no vistos previamente. Estos
pueden pasarse en forma de array a la función de predicción del modelo, en el mismo formato que antes, pero sin la
etiqueta. La respuesta será la clase.
</simpara>
<simpara>
Los modelos pueden guardarse y restaurarse según sea necesario, utilizando las funciones de guardado y carga, que
toman como argumento la ruta al fichero correspondiente.
</simpara>
<para>
<example>
<title>Entrenamiento desde un array</title>
<programlisting role="php">
<![CDATA[
<?php
$data = array(
array(-1, 1 => 0.43, 3 => 0.12, 9284 => 0.2),
array(1, 1 => 0.22, 5 => 0.01, 94 => 0.11),
);
$svm = new SVM();
$model = $svm->train($data);
$data = array(1 => 0.43, 3 => 0.12, 9284 => 0.2);
$result = $model->predict($data);
var_dump($result);
$model->save('model.svm');
?>
]]>
</programlisting>
&example.outputs.similar;
<screen>
<![CDATA[
int(-1)
]]>
</screen>
</example>
<example>
<title>Entrenamiento desde un fichero</title>
<programlisting role="php">
<![CDATA[
<?php
$svm = new SVM();
$model = $svm->train("traindata.txt");
?>
]]>
</programlisting>
</example>
</para>
</chapter>
<!-- Keep this comment at the end of the file
Local variables:
mode: sgml
sgml-omittag:t
sgml-shorttag:t
sgml-minimize-attributes:nil
sgml-always-quote-attributes:t
sgml-indent-step:1
sgml-indent-data:t
indent-tabs-mode:nil
sgml-parent-document:nil
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
sgml-exposed-tags:nil
sgml-local-catalogs:nil
sgml-local-ecat-files:nil
End:
vim600: syn=xml fen fdm=syntax fdl=2 si
vim: et tw=78 syn=sgml
vi: ts=1 sw=1
-->