Gestión y minería de datos de física de altas energías en el proyecto Grossgrid

  1. RODRÍGUEZ GONZÁLEZ, DAVID
Dirigida por:
  1. Jesús Marco de Lucas Director/a

Universidad de defensa: Universidad de Cantabria

Fecha de defensa: 17 de julio de 2007

Tribunal:
  1. Michal Turala Presidente/a
  2. Francisco Matorras Weinig Secretario/a
  3. Francisco Javier Cuevas Maestro Vocal
  4. José Salt Cairols Vocal
  5. Celso Martínez Rivero Vocal

Tipo: Tesis

Teseo: 136796 DIALNET

Resumen

Estudio sobre aplicaciones de diversas técnicas de gestión y minería de datos en física de altas energías. El gran volumen de datos que será generado en los experimentos del futuro acelerador LHC, y su procesado distribuido suponen un reto computacional. Se ha estudiado la influencia del desarrollo de las tecnologías Grid en el mismo. En el campo de la gestión de datos se han tocado varios temas como el estudio de diversas alternativas para el almacenamiento de la información de los sucesos recogida en dichos experimentos, incluyendo el almacenamiento en bases de datos orientadas a objeto, bases de datos objeto-relacionales y XML. Relacionado con esto se trabajó con diversas herramientas de "mapping" objeto-relacional. También se estudio la aplicación de la replicación de datos, y se elaboró un catálogo para el acceso futuro a los datos del anterior experimento DELPHI dentro de un proyecto de "Digital Curation". Dentro del proyecto GrossGrid se desarrollaron aplicaciones de filtrado y minería de datos para ser usados en el campo de la física de altas energías. Dichas aplicaciones son programas paralelos MPI integrados con el "middleware" de CrossGrid. El prototipo de filtrado de datos distribuido permite preprocesar los datos cerca de las fuentes distribuidas de los mismos de forma que el movimiento de datos se minimize. En el campo de la minería de datos se desarrollaron programas paralelos del entrenamiento de redes neuronales artificiales (incluyendo redes MLP y SOM). Estos programas fueron optimizados y adaptados para ser ejecutados en el "tesbed" de CrossGrid. Finalmente se colaboró en el esfuerzo de integración del proyecto desarrollando aplicaciones interactivas que fueron ejecutadas en dicho mismo "testbed" incluyendo una versión interactiva y con salida gráfica de la aplicación de entrenamiento de la red neuronal.