Algoritmo de agrupamiento genético borroso basado en el algoritmo de las c-medias borroso

  1. Lopez Garcia, Sergio
Dirigida por:
  1. Juan Ramón Velasco Pérez Director/a
  2. Luis Magdalena Layos Director/a

Universidad de defensa: Universidad Politécnica de Madrid

Fecha de defensa: 30 de noviembre de 2001

Tribunal:
  1. Gregorio Fernández Fernández Presidente/a
  2. Pedro José Zufiria Zatarain Secretario/a
  3. Fernando Martín Rubio Vocal
  4. Francisco Herrera Triguero Vocal
  5. Luciano Sánchez Ramos Vocal

Tipo: Tesis

Resumen

El algoritmo de las c-medias borroso (FCM) es una herramienta matemática ampliamente utilizada en muchos problemas prácticos tales como el reconocimiento de patrones, el análisis de datos y el procesamiento de imágenes. Sin embargo, tiene varios inconvenientes en su aplicación para todo tipo de problemas de agrupamiento: * Depende de las condiciones iniciales del algoritmo. * El número de conjuntos debe conocerse por anticipado. * El algoritmo sólo detecta conjuntos hiperesféricos debido a la definición de la distancia, que es euclídea por defecto. Esta tesis incluye varios trabajos con respecto a la resolución de las carencias comentadas previamente. Los puntos clave son. * La dependencia de las condiciones iniciales se evita mediante el uso de algoritmos genéticos (AA.GG). Los AA.GG son un método de optimización muy conocido basado en la genética natural. Los algoritmos basados en el FCM con estructura genética se conocen normalmente como algoritmos FCM genéticos (GFCM). * Por otro lado, se propone una nueva estructura llamada "especie", basada también en la genética natural. Una especie de conjuntos se compone de las soluciones que tiene el mismo número de conjuntos. De esta forma, hay un esquema de dos niveles: un primer nivel donde se aplica el algoritmo FCM dentro de cada especie y un segundo nivel donde un funcional de "selección entre especies" es capaz de encontrar el número más adecuado de conjuntos. * En la bibliografía se pueden encontrar muchas referencias a los índices de validación, que son frecuentemente utilizados para comparar soluciones con distinto número de conjuntos. En esta tesis se estudia este problema, incluyendo el desarrollo de un funcional basado en índices de validación. * Finalmente, se presenta una norma diagonal en la definición de distancia de la estructura del GFCM, cuyos coeficientes también se calculan en el algortimo. De esta forma, se pueden detectar tanto conjuntos hiperesféricos como hiperelípticos. Como resultado de esta tesis, se han desarrollado y probado varios algoritmo. El algoritmo más avanzado (algoritmo de agrupamiento genético borroso no euclídeo) está disponible bajo Linux y GNU.