Métodos que explotan información adjunta para predecir variables objetivo desconocidas.

  1. Fernández Díaz, Miriam
Dirigida por:
  1. Elena Montañés Roces Directora
  2. José Ramón Quevedo Pérez Director

Universidad de defensa: Universidad de Oviedo

Fecha de defensa: 02 de junio de 2023

Tribunal:
  1. Juan José del Coz Velasco Presidente
  2. Beatriz Remeseiro López Secretaria
  3. Óscar Fontenla Romero Vocal
  4. Noelia Sánchez-Maroño Vocal
  5. Alicia Troncoso Lora Vocal

Tipo: Tesis

Teseo: 813533 DIALNET

Resumen

Esta investigación surge de la necesidad de predecir la concentración de contaminantes atmosféricos en las estaciones meteorológicas. La contaminación atmosférica depende de la ubicación de las estaciones (condiciones meteorológicas y actividades en el entorno). Con frecuencia, la información circundante no se tiene en cuenta en el proceso de aprendizaje. Esta información es conocida de antemano en ausencia de condiciones meteorológicas no observadas y se mantiene constante para la misma estación. Tener en cuenta la información de los alrededores como información adjunta permite generalizar la predicción de la concentración de contaminantes a nuevas estaciones, lo que lleva a un escenario de regresión de aprendizaje de tiro cero. El aprendizaje de tiro cero proporciona modelos para variables objetivo para las que no se dispone de instancias, llamadas comúnmente variables objetivo no observadas o desconocidas. En la literatura hay muchas estrategias para hacer frente a este escenario, pero diseñadas específicamente sobre clasificación, sobre todo en visión por ordenador y en clasificación de imágenes, no siendo fácilmente extensibles a escenarios de regresión de aprendizaje de tiro cero. Por lo tanto, hay una falta considerable de métodos para la regresión de aprendizaje de tiro cero. En este trabajo se proponen diversos métodos englobados en el escenario de aprendizaje de tiro cero para regresión. El primer método es un enfoque basado en similitud. El método aprende modelos para las variables objetivo observadas o conocidas y los agrega utilizando información adjunta tanto de las variables objetivo observadas o conocidas como de las variables objetivo no observadas o desconocidas. Sin embargo, el proceso de agregación es tan simple que puede que no se explote toda la información contenida en la información adjunta. El segundo método mejora este inconveniente sustituyendo el procedimiento de agregación por un proceso de aprendizaje. Particularmente, se aprende la correspondencia entre la información adjunta y los modelos inducidos para las variables objetivo observadas o conocidas. A pesar de que este método incluye la información adjunta en un proceso de aprendizaje, lo hace en una etapa separada y diferente del proceso de aprendizaje de los modelos de las variables objetivo observadas o conocidas. Por lo tanto, el proceso de aprendizaje se optimiza localmente. Este trabajo ofrece una solución a este inconveniente proponiendo un tercer método que incluye directamente la información adjunta en el aprendizaje de los modelos para las variables objetivo observadas o conocidas, lo que lleva a un procedimiento de aprendizaje de fase única. Este tercer método muestra un mejor rendimiento que los métodos anteriores, confirmando la hipótesis sobre la ganancia de conocimiento cuando se realiza un único aprendizaje que integra convenientemente la información adjunta junto con los atributos comunes de las variables observadas o conocidas. Estas propuestas se comparan con un método de referencia que trata la información adjunta como atributos comunes adicionales.