Categorización de Textos mediante Máquinas de Soporte Vectorial

Augusto Cortez Vasquez, Luzmila Pró Concepción, Oswaldo Rojas Lazo, Robero Calmet Agnelli

Resumen


La categorización de textos es una aplicación que se enmarca dentro de la disciplina de lenguaje de procesamiento natural y está estrechamente relacionado con el concepto de clasificación. Debido a la abundante información existente se hace necesario organizar, mantener y procesar toda infor­ mación disponible a partir de un conocimiento más profundo del lenguaje. Las máquinas de soporte vectorial (MSV) pertenecen a la familia de clasificadores lineales, y puede utilizarse para resolver el problema de la categorización de textos(eT) que consiste en etiquetar un texto o documento con•una o varias categorías temáticas predefinidas. La razón por la cual se aborda el problema es su aplicación en diversos escenarios del área de recuperación de información (RI) tales como la organización automática de documentos, filtrado de documentos. El enfoque de las MSV considera fundamentalmente lo siguiente: El objetivo es crear un modelo que permita etiquetar un texto con una categoría predefinida dado un conjunto de documentos D y un conjunto de categorías e, se trata de encontrar una función que haga corresponder a un documento d tomado de D, una cate­ goría determinada e en C.

Palabras clave


Categorización de textos, clasificación de textos, máquinas de soporte vectorial, clasificadores lineales.

Texto completo:

PDF

Enlaces refback

  • No hay ningún enlace refback.




Copyright (c) 2014 Augusto Cortez Vasquez, Luzmila Pró Concepción, Oswaldo Rojas Lazo, Robero Calmet Agnelli

Licencia de Creative Commons
Este obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional.

 

 



Facultad de Ingeniería de Sistemas e Informática, Universidad Nacional Mayor de San Marcos, Lima, Perú Teléfono: (511) 619 7000 (anexo 3604) Correo electrónico: investigacion@sistemas.edu.pe.