Utilización de técnicas de swarm intelligence para la gestión documental en el ámbito de la empresaminería de texto en entornos multilingües mediante técnicas bio-inspiradas

  1. Rocha Blanco, Rocío
Dirigida por:
  1. Ángel Cobo Ortega Director/a
  2. Margarita Alonso Martínez Director/a

Universidad de defensa: Universidad de Cantabria

Fecha de defensa: 24 de julio de 2009

Tribunal:
  1. Enrique Manuel Ambrosio Orizaola Presidente/a
  2. Jaime Puig-Pey Echebeste Secretario/a
  3. David de la Fuente García Vocal
  4. Ramón Salvador Vallès Vocal
  5. Francisco Ortega Fernández Vocal

Tipo: Tesis

Teseo: 276252 DIALNET lock_openTESEO editor

Resumen

El uso intensivo de las Tecnologías de la Información y las Comunicaciones (TIC) y la internacionalización de los mercados, son dos de las principales características del ambiente en el que las organizaciones realizan sus actividades, En este contexto es necesario contar con soluciones tecnológicas y metodologías adecuadas para la correcta gestión de los grandes volúmenes de información que se genera tanto internamente como a nivel externo. La mayor parte de esta información se plasma en documentos textuales que quedan almacenados en los sistemas informáticos de la organización. A diferencia de lo que ocurre con la información estructurada, que queda organizada en las bases de datos, la información textual requiere procesos más elaborados para la extracción de conocimiento a partir de ella o para la identificación de aquella información realmente relevante para la organización. El objetivo principal de esta tesis ha sido explorar las posibles aplicaciones de un área emergente dentro de la Inteligencia Artificial, como es el Swarm Intelligence, a los problemas de extracción de conocimiento a partir de colecciones documentales, integrando dichas técnicas con otra serie de metodologías desarrolladas en el contexto de la minería de texto. Además se ha buscado su integración dentro de un completo sistema de gestión documental que aporte una serie de funcionalidades importantes para la correcta gestión de dichas colecciones. Teniendo en cuenta además el carácter global del ambiente actual de los negocios, así como de las redes masivas de comunicación como Internet, el trabajo se ha orientado hacia la búsqueda de mecanismos que permitan la extracción de conocimiento en entornos multilingües, identificando de forma automática documentos relacionados con independencia del idioma en el que se encuentren escritos. La aplicación informática de gestión documental desarrollada está especialmente orientada hacia la gestión de documentos de carácter económico y empresarial. Se han integrado en ella recursos lingüísticos especialmente apropiados para el análisis de documentos en las áreas implicadas; en particular, es de destacar el uso del glosario de términos económicos del Fondo Monetario Internacional y el tesauro Eurovoc desarrollado por la Comisión Europea. Ambos recursos se caracterizan por su carácter multilingüe. En la aplicación se han implementado diferentes algoritmos de clasificación documental basados en técnicas computacionales de Swarm Intelligence que se inspiran en comportamientos observados en colectividades biológicas (colonias de hormigas o bandadas de pájaros), obteniéndose unos buenos resultados en comparación con otras técnicas más tradicionales. En definitiva, con este trabajo se ha conseguido probar la efectividad de una metodología novedosa para la gestión documental al mismo tiempo que se ha desarrollado una herramienta eficaz y de fácil uso que permitirá acercar a usuarios finales no técnicos esta nueva metodología.