Automatic parameterization of Support Vector Machines for Short Texts Polarity Detection
DOI:
https://doi.org/10.19153/cleiej.20.1.6Keywords:
Support vector machines, Polarity detection, Grid search, Grey wolf optimizer, Máquinas de soporte vectorial, Detección de polaridad, Búsqueda en malla, Optimizador de lobo grisAbstract
Abstract:The information from social media is emerging as a valuable source in decision-making, unfortunately the tools to turn these data into useful information still need some work. Using Support Vector Machines for polarity detection in short texts are popular among researchers for their good results, but parameter optimization to train classification models is a complex and costly process. This article compares two algorithms for automated parameter optimization in the process of creating classification models for polarity detection: the recently created Grey Wolf Optimizer and the Grid Search, using accuracy and f-score metrics.
Los datos provenientes de las redes sociales están emergiendo como una fuente valiosa de información para los procesos de toma de decisiones, desafortunadamente las herramientas para convertir estos datos en información útil todavía tienen mucho camino por recorrer. Utilizar máquinas de soporte vectorial para la detección de polaridad en textos cortos goza de popularidad entre los investigadores debido a sus buenos resultados. Sin embargo, la optimización de los parámetros necesarios para entrenar modelos es un proceso complejo y costoso. Este artículo compara dos algoritmos para la optimización automatizada de parámetros en el proceso de crear modelos de clasificación para la detección de polaridad: Optimizador de lobo gris y las búsqueda en malla, utilizando las métricas de precisión y valor-f.
Downloads
Published
Issue
Section
License
CLEIej is supported by its home institution, CLEI, and by the contribution of the Latin American and international researchers community, and it does not apply any author charges whatsoever for submitting and publishing. Since its creation in 1998, all contents are made publicly accesibly. The current license being applied is a (CC)-BY license (effective October 2015; between 2011 and 2015 a (CC)-BY-NC license was used).