« Back to publications

Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificaci�n de P�ginas Web

Arkaitz Zubiaga, Víctor Fresno, Raquel Martínez

Procesamiento del Lenguaje Natural. 2009.

Download PDF file
En este art�culo se realiza un estudio de diferentes aproximaciones a la clasificaci�n semisupervisada multiclase de p�ginas web mediante SVM. Ante la naturaleza binaria y supervisada de los algoritmos SVM cl�sicos, y tratando de evitar problemas de optimizaci�n complejos, se propone un enfoque basado en la combinaci�n de clasificadores, tanto binarios semisupervisados como clasificadores multiclase supervisados. Los resultados de los experimentos realizados sobre tres colecciones de referencia muestran un rendimiento notablemente superior para la combinaci�n de clasificadores multiclase supervisados. Por otro lado, en este trabajo tambi�n se realiza un estudio sobre la aportaci�n de los documentos no etiquetados en la fase de aprendizaje para este tipo de entornos. En nuestro caso, y a diferencia de los problemas binarios, se obtiene una mayor efectividad cuando se ignora este tipo de datos para problemas multiclase.