Clasificación de series temporales multivariable con boosted trees
- Toimil Martín, Daniel
- Alberto Gómez Gómez Director
Universidad de defensa: Universidad de Oviedo
Fecha de defensa: 05 de julio de 2019
- Enrique Lopez Gonzalez Presidente/a
- Paolo Priore Moreno Secretario
- Patxi Ruiz de Arbulo López Vocal
- David de la Fuente García Vocal
- Juan José de Benito Martín Vocal
Tipo: Tesis
Resumen
Los datos en forma de series temporales están presentes en múltiples campos, desde los datos generados por sensores en el sector manufacturero o la agricultura, hasta los registros obtenidos por servidores web. La diversidad de características en estos datos plantea diferentes retos que deben ser afrontados para extraer la información que contienen. Por ejemplo, algunos conjuntos de datos presentan series temporales de diferente longitud. Otros conjuntos tienen una proporción desigual entre sus clases, siendo alguna de ellas minoritaria frente a las demás. Estas y otras características presentes en los problemas de clasificación de series temporales multivariable son analizadas en este trabajo. Todas ellas suponen diferentes retos que deben ser resueltos por las técnicas de clasificación. Como aportación principal, este trabajo propone una nueva técnica de clasificación de series temporales multivariable denominada Boosted Multivariate Time Series (BMTS). Esta técnica cubre la mayoría de las características mencionadas, siendo por tanto robusta frente a ellas. Esto la convierte en una técnica aplicable a un amplio rango de problemas, sin importar sus características. Por otro lado, el aumento en el ratio de generación de datos esta siendo considerable en los últimos años. Esto provoca un aumento sustancial del tamaño de los conjuntos de datos hasta alcanzar volúmenes que no pueden ser procesados por tecnologías convencionales. Este hecho hace que muchas técnicas no puedan ser aplicadas a dichos problemas. En este trabajo se plantea combinar las tecnologías big data con el modelo de clasificación BMTS. De esta manera, se muestra por primera vez una técnica de clasificación de series temporales multivariables construida sobre estas tecnologías. Además, se demuestra experimentalmente la escalabilidad de la técnica propuesta. Finalmente, se demuestra experimentalmente que BMTS es competitivo con respecto a otras técnicas existentes en la literatura.