Algoritmo de agrupamiento genético borroso basado en el algoritmo de las c-medias borroso
- Lopez Garcia, Sergio
- Juan Ramón Velasco Pérez Zuzendaria
- Luis Magdalena Layos Zuzendaria
Defentsa unibertsitatea: Universidad Politécnica de Madrid
Fecha de defensa: 2001(e)ko azaroa-(a)k 30
- Gregorio Fernández Fernández Presidentea
- Pedro José Zufiria Zatarain Idazkaria
- Fernando Martín Rubio Kidea
- Francisco Herrera Triguero Kidea
- Luciano Sánchez Ramos Kidea
Mota: Tesia
Laburpena
El algoritmo de las c-medias borroso (FCM) es una herramienta matemática ampliamente utilizada en muchos problemas prácticos tales como el reconocimiento de patrones, el análisis de datos y el procesamiento de imágenes. Sin embargo, tiene varios inconvenientes en su aplicación para todo tipo de problemas de agrupamiento: * Depende de las condiciones iniciales del algoritmo. * El número de conjuntos debe conocerse por anticipado. * El algoritmo sólo detecta conjuntos hiperesféricos debido a la definición de la distancia, que es euclídea por defecto. Esta tesis incluye varios trabajos con respecto a la resolución de las carencias comentadas previamente. Los puntos clave son. * La dependencia de las condiciones iniciales se evita mediante el uso de algoritmos genéticos (AA.GG). Los AA.GG son un método de optimización muy conocido basado en la genética natural. Los algoritmos basados en el FCM con estructura genética se conocen normalmente como algoritmos FCM genéticos (GFCM). * Por otro lado, se propone una nueva estructura llamada "especie", basada también en la genética natural. Una especie de conjuntos se compone de las soluciones que tiene el mismo número de conjuntos. De esta forma, hay un esquema de dos niveles: un primer nivel donde se aplica el algoritmo FCM dentro de cada especie y un segundo nivel donde un funcional de "selección entre especies" es capaz de encontrar el número más adecuado de conjuntos. * En la bibliografía se pueden encontrar muchas referencias a los índices de validación, que son frecuentemente utilizados para comparar soluciones con distinto número de conjuntos. En esta tesis se estudia este problema, incluyendo el desarrollo de un funcional basado en índices de validación. * Finalmente, se presenta una norma diagonal en la definición de distancia de la estructura del GFCM, cuyos coeficientes también se calculan en el algortimo. De esta forma, se pueden detectar tanto conjuntos hiperesféricos como hiperelípticos. Como resultado de esta tesis, se han desarrollado y probado varios algoritmo. El algoritmo más avanzado (algoritmo de agrupamiento genético borroso no euclídeo) está disponible bajo Linux y GNU.