Clasificación de series temporales multivariable con boosted trees

  1. Toimil Martín, Daniel
Supervised by:
  1. Alberto Gómez Gómez Director

Defence university: Universidad de Oviedo

Fecha de defensa: 05 July 2019

Committee:
  1. Enrique Lopez Gonzalez Chair
  2. Paolo Priore Moreno Secretary
  3. Patxi Ruiz de Arbulo López Committee member
  4. David de la Fuente García Committee member
  5. Juan José de Benito Martín Committee member
Department:
  1. Administración de Empresas

Type: Thesis

Teseo: 597173 DIALNET

Abstract

Los datos en forma de series temporales están presentes en múltiples campos, desde los datos generados por sensores en el sector manufacturero o la agricultura, hasta los registros obtenidos por servidores web. La diversidad de características en estos datos plantea diferentes retos que deben ser afrontados para extraer la información que contienen. Por ejemplo, algunos conjuntos de datos presentan series temporales de diferente longitud. Otros conjuntos tienen una proporción desigual entre sus clases, siendo alguna de ellas minoritaria frente a las demás. Estas y otras características presentes en los problemas de clasificación de series temporales multivariable son analizadas en este trabajo. Todas ellas suponen diferentes retos que deben ser resueltos por las técnicas de clasificación. Como aportación principal, este trabajo propone una nueva técnica de clasificación de series temporales multivariable denominada Boosted Multivariate Time Series (BMTS). Esta técnica cubre la mayoría de las características mencionadas, siendo por tanto robusta frente a ellas. Esto la convierte en una técnica aplicable a un amplio rango de problemas, sin importar sus características. Por otro lado, el aumento en el ratio de generación de datos esta siendo considerable en los últimos años. Esto provoca un aumento sustancial del tamaño de los conjuntos de datos hasta alcanzar volúmenes que no pueden ser procesados por tecnologías convencionales. Este hecho hace que muchas técnicas no puedan ser aplicadas a dichos problemas. En este trabajo se plantea combinar las tecnologías big data con el modelo de clasificación BMTS. De esta manera, se muestra por primera vez una técnica de clasificación de series temporales multivariables construida sobre estas tecnologías. Además, se demuestra experimentalmente la escalabilidad de la técnica propuesta. Finalmente, se demuestra experimentalmente que BMTS es competitivo con respecto a otras técnicas existentes en la literatura.