Академический Документы
Профессиональный Документы
Культура Документы
1
T omado de: https://www.jep.gov.co/Paginas/JEP/Sistema-Integral-de-
Verdad-Justicia-Reparacion-y-NoRepeticion.aspx
INTELIGENCIA COMPUTACIONAL I 2
1 𝑛
𝑅𝑀𝑆𝐸 = √ ∑ 𝑒𝑖2 (3) 𝑒 = (𝑣𝑜 − 𝑣𝑒 ) (4)
𝑛 𝑖 =1
Donde:
𝑒𝑅𝑀𝑆𝐸 : Error cuadrático medio
𝑒𝐶𝑃 : Error de clasificación masacres paramilitares
𝑀𝑐 : Número de registros mal clasificados
𝑇𝑑 : Número total de registros clasificados
𝑣𝑜 : Valor obtenido
𝑣𝑒 : Valor esperado
Para la implementación de este algoritmo se tuvieron en cuenta
algunos parámetros utilizados en el ANFIS como las reglas y el
tamaño de soluciones a explorar. Los parámetros se encuentran
en la Tabla 2. También se utilizó validación cruzada en este
algoritmo.
Figura.2 Curva ROC ajuste manual
Parametro Valor Positivo Negativo Total
Numero de reglas 5, 10, 32
Predictivo positivo 227 108 335
Numero de parametros a
optimizar 45, 90, 288
Numero Población 40 Predictivo negativo 128 132 260
Numero de generaciones 100, 150
Total 355 240 595
Numero de experimentos 50
Tabla.5 Matriz de confusión para la mejor solución obtenida por
Constante de cruce 0.9* medio del ANFIS.
Constante de mutación 0.5*
Variante best/1/bin
Criterio de parada Gmax
Tabla.3 Parámetros para el algoritmo de evolución diferencial
G. Matriz de confusión:
La matriz de confusión se configuro teniendo en cuenta:
- Verdaderos positivos: Masacres paramilitares
correctamente clasificadas.
- Falsos positivos: Masacres de otro grupo armado
clasificadas como paramilitares.
- Verdaderos negativos: Masacres de otros grupos
correctamente clasificadas
- Falsos Negativos: Masacres paramilitares clasificadas
como de otro grupo armado.
III. RESULTADOS
En esta sección se presenta el mejor resultado de cada método Figura.3 Curva ROC mejor solución ANFIS
de optimización con su respectivo análisis y la comparativa
entre resultados. B. Algoritmo de evolución diferencial con inicialización
A. Ajuste manual del sistema: aleatoria:
La matriz de confusión resultante en caso del ajuste manual del La mejor solución se dio en la configuración:
SID se puede observar en la Tabla 4. 10 𝑟𝑒𝑔𝑙𝑎𝑠 , 40 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 , 150 𝑔𝑒𝑛𝑒𝑟𝑎𝑐𝑖𝑜𝑛𝑒𝑠, Esta solución
se consiguió en el experimento 33. La matriz de confusión para
La curva ROC en la Figura 2 indica que el desempeño del esta solución se encuentra en la Tabla 6.
clasificador propuesto con respecto al azar, es el mismo o Positivo Negativo Total
incluso con algunos umbrales de clasificación el azar
clasificaría mejor. Predictivo positivo 291 52 343
Figura.4 Curva ROC En el caso del ANFIS se tenía que los parámetros como el número de
reglas eran cambiantes y que se ajustaban con respecto al error,
C. Comparación soluciones: permitiendo modelar mejor una solución, en efecto el desempeño de la
En la Tabla 7 se tienen los estadísticos más relevantes para las mejor solución encontrada fue mejor que en el caso del ajuste manual
mejores soluciones encontradas en cada uno de los métodos de pero se perdió la interpretabilidad en el SID, dado el numero nuevo de
reglas y funciones de pertenencia, y no se podía entender cuál era el
optimización. La mejor solución fue la encontrada por el
proceso de inferencia que estaba llevando a cabo en el sistema. A pesar
algoritmo de ED, esto se evidencia en su desempeño para
de que los antecedentes eran modelados de forma automática,
clasificar, a pesar que su coeficiente Kappa es menor que la nuevamente se tuvieron unos valores Kappa y AUC de la ROC bajos
obtenida por la solución ANFIS, que implica que tanto la y que no diferenciaban la solución en gran medida del azar.
solución es mejor que el azar, la diferencia fue mínima contrario
a otros estadísticos donde la solución de la ED tiene hasta un En el ajuste por ED, el antecedente al modelarse por parámetros
desempeño de hasta 5% mejor. Se resalta que los estadísticos obtenidos a partir de las medias y desviaciones estándar de las entradas
encontrados para la solución ajustada manualmente no son del del sistema, tuvo más interpretabilidad que en el caso del ANFIS, las
malos pero si se comporta prácticamente igual que el azar. funciones de pertenencia en este caso se solapaban entre ellas por lo
Tasa de que era necesario un numero amplio de reglas que pudieran dar
clasificación Sensibilidad Precisión Especificidad Kappa solución a la no linealidad que se tenía en los conjuntos. Aunque se
correcta utilizaron 32 reglas el mejor resultado se obtuvo con 10 y este en
Ajuste manual últimas fue también el mejor de los 3 métodos de optimización. En este
0.5923 0.7863 0.5923 0.3045 0.0968
del sistema caso los valores de Kappa y AUC de la ROC también indican que la
solución tiene un desempeño en la clasificación, que asciende hasta el
ANFIS 0.6336 0.6685 0.6336 0.5805 0.2455
68%, parecido al azar.
Evolución
0.6816 0.8484 0.7115 0.3822 0.2497
Diferencial
V. CONCLUSIONES
Tabla.7 Estadísticos relevantes para cada una de las soluciones
encontradas - En los tres métodos de ajuste de parámetros no se logró
D. Mejor Solución (Sistema Difuso): adaptarse al problema de una manera óptima, se consiguió una
tasa de clasificación no muy buena y el desempeño era similar
Los conjuntos en el antecedente se pueden observar en la Figura a una clasificación aleatoria. Esto puede deberse a que el
5, la interpretación de estos se puede dar más desde el punto de sistema no tenía registros de entrada diferenciables y se pueden
vista estadístico que desde el punto de vista de la problemática. requerir un número mayor de entradas para mejorar su
Los registros utilizados como entrada tienen una desviación desempeño.
estándar pequeña entre ellos, lo que hace que se solapen las
funciones de pertenencia. Desde el punto de vista del conflicto
- Tanto el algoritmo ED como el ANFIS lograron mejores
armado lo que indica es que las masacres se concentraron en
resultados con respecto al método de ajuste manual de
unos lugares muy específicos y las variaciones entre las
dinámicas de paramilitares y otros grupos no eran muy parámetros basado en conocimiento de expertos , esto debido a
que cada uno de ellos explora una gran cantidad de soluciones
variables lo que dificulta la diferenciación entre clases y por
que pueden llegar a un mínimo local en donde la tasa de
ende la clasificación. En el caso de las reglas de inferencia del
sistema estas no eran interpretables. clasificación correcta sea mayor.
REFERENCIAS
[1] González Morcillo, C. (2011). Lógica Difusa, una introducción práctica.
T écnicas de Softcomputing, 5.
[2] Jyh-Shing Roger Jang. “ANFIS: adaptive-network-based fuzzy inference
system”. In: IEEE T ransactions on Systems, Man, and Cybernetics 23
(1993), pp. 665–685. DOI: 10.1109/21.256541.
[3] Medina, L. A. R., Pinzón, A. F. B., Melgarejo, M. A., & Domínguez,S.V.
(2017). T uning up Fuzzy Inference Systems by using optimization
algorithms for the classification of solar flares. arXiv preprint
arXiv:1706.08163.