Transparencias de Hibridación Iterativa de DE con BL con reinicio para alta dimensionalidad del CAEPIA'2015. Este algoritmo supone una mejora respecto al algoritmo presentado en el CEC'2015.
Presupuesto por Resultados de Seguridad Ciudadana .pptx
Hibridación Iterativa de DE con BL con reinicio para alta dimensionalidad
1. Hibridación Iterativa de DE con BL con
reinicio para alta dimensionalidad
Daniel Molina1
Francisco Herrera2
1Universidad de Cádiz 2Universidad de Granada
11 de Noviembre, CAEPIA’2015
http://sci2s.ugr.es
2. Problema de optimización
Optimization problems
Optimización Global f (x∗
) ≤ f (x) ∀x ∈ Domain
Optimización continua Domain ⊆ D
, x∗
= [x1, x2, · · · , xD]
Optimización alta dimensionalidad , D ≥ 1000.
Espacio de búsqueda
Incrementa exponencialmente.
Requisito
Margen (tiempo, evaluaciones) bajo por dimensión.
Requiere mayor eficiencia.
3. Problema de optimización
Optimization problems
Optimización Global f (x∗
) ≤ f (x) ∀x ∈ Domain
Optimización continua Domain ⊆ D
, x∗
= [x1, x2, · · · , xD]
Optimización alta dimensionalidad , D ≥ 1000.
Espacio de búsqueda
Incrementa exponencialmente.
Requisito
Margen (tiempo, evaluaciones) bajo por dimensión.
Requiere mayor eficiencia.
4. Interés de estas funciones
Problemas reales
Optimización de muchos parámetros.
Estudiar separabilidad de variables
Estudiar comportamiento con funciones distinta separabilidad.
5. Distinta separabilidad de variables
Funciones Totalmente separables
f (x1, x2, ..., xn) =
n
j=1
gj (xj )
Parcialmente separables
f (x) =
|S|
i=1
wi · gi (xi ), S conjunto de variables dijunto.
Con solapamiento
f (x) =
|S|
i=1
wi · gi (xi ), S conjunto de variables con
solapamiento.
6. Estado del arte: MOS
Características
Combina varios evolutivos y Búsquedas Locales.
Aplica cada uno con probabilidad adaptativa.
Incluye específicos métodos de BL para alta
dimensionalidad.
Desventajas
Complejo de implementar: 9 componentes.
Algunos componentes sólo adecuado pocas funciones.
Muchos parámetros: requiere tuning.
Referencia
Antonio LaTorre, Santiago Muelas, José María Peña:A comprehensive comparison of large scale global
optimizers. Inf. Sci. 316: 517-549 (2015)
7. Propuesta del CEC’2015
Iterative Hybridation DE with LS: IHDELS.
Referencia
Daniel Molina, Francisco Herrera: Iterative hybridization of DE with Local Search for the CEC’2015
special session on large scale global optimization. Proceeding on IEEE CEC 2015: 1974-1978 (2015)
8. Sobre este trabajo
Problemas del algoritmo anterior
Elementos complejos Reinicio no adecuado
En este trabajo abordamos
Simplificar el código Mejorar resultados
9. Sobre este trabajo
Problemas del algoritmo anterior
Elementos complejos Reinicio no adecuado
En este trabajo abordamos
Simplificar el código Mejorar resultados
12. Algoritmo propuesto
Algoritmo Memético
Un Algoritmo Evolutivo (AE) para diversidad.
Una Búsqueda Local (BL) para exploración.
Requisitos del AE
Explore de forma eficiente.
No parámetros o
adaptativos.
Requisitos de la BL
Adecuado para alta
dimensionalidad.
Robusto.
13. Elección de los componentes
Diferencial Evolution
El DE explora muy bíen el espacio de búsqueda.
Usamos el Self-Adaptive DE (SaDE).
Método de Búsqueda local
Usamos el MTS-LS1, alta dimensionalidad.
Combinado con L-BFGS-B para mayor robustez.
15. Esquema general: IHDELS
Características
Ejecuta alternativamente el DE y la BL.
Mantiene la población entre iteraciones.
Aplica la BL al mejor.
• Si no mejoró, a una aleatoria.
Selección de la BL
Elige entre dos métodos de BL en cada caso cuál aplicar.
18. SaDE: Mutación
Estrategia de mutación
Varias operadores de mutación.
Aplica cada uno con una probabilidad de aplicación.
La probabilidad de cada uno se adapta a su ratio de éxito
(soluciones que sobreviven).
Dicho ratio de éxito se calcula cada LP generaciones.
19. SaDE: Mutación
Estrategias de mutación
DE/rand/1:
vi = xr1 + F · (xr2 - xr3)
DE/rand/2:
vi = xr1 + F · (xr2 - xr3) + F · (xr4 - xr5)
DE/rand-to-best/1:
vi = xi +F · (xbest - xi) + F · (xr1-xr2) + F · (xr3 - xr4)
DE/current-to-rand/1:
vi = xi + k· (xr2 - xr3) F · (xr4 - xr5)
F ← Normal(0.5, 0.3)
20. SaDE: Cruce
Cruce
ui =
xi + vi si rand[0,1] < CR
xi en caso contrario
Adaptación del parámetro CR
CR ← Normal(CRmin, 0.1).
CRmin se auto-adapta según las últimas soluciones
exitosas.
23. Métodos de BL
MTS-LS1
Define un grupo de variables aleatorio a mejorar C.
Define SR = 10% ratio de búsqueda local.
Actualiza solución x durante Istr evaluaciones, ∀i ∈ C.
1 xi’ ← xi + SR.
2 si fitness(x ) ≤ fitness(x) x ← x , ir al paso 1.
3 en caso contrario x’i ← xi - 0.5 · SR.
4 si fitness(x ) ≤ fitness(x) x ← x , ir al paso 1.
5 Disminuye SR (SR ← SR/2), si x no mejoró.
L-BFGS-B
Método matemático muy conocido.
Requiere derivada: se aproxima en cada punto.
27. Selección de la BL
El modelo anterior aplicaba probabilidad adaptativa.
Probabilidad inicial
PBLM
=
1
|BL|
∀M ∈ BL
Actualización (tras FreqBL evaluaciones)
PBLM
=
IBLM
m∈BL IBLm
IBLM
=
FreqBL
i=1
Mejora de la BLM
28. Selección de la Búsqueda Local
Problemas
Laborioso de calcular.
Rápidamente se polariza.
Nuevo modelo
1 Aplicar la primera vez cada BL de forma alternada, y
devuelve el mejor.
2 Guarda para cada BL el ratio de su última ejecución:
RatioBLM
=
Fitnessanterior − Fitnessnuevo
Fitnessanterior
3 En cada iteración aplica la BL con mayor Ratio.
29. Selección de la Búsqueda Local
Problemas
Laborioso de calcular.
Rápidamente se polariza.
Nuevo modelo
1 Aplicar la primera vez cada BL de forma alternada, y
devuelve el mejor.
2 Guarda para cada BL el ratio de su última ejecución:
RatioBLM
=
Fitnessanterior − Fitnessnuevo
Fitnessanterior
3 En cada iteración aplica la BL con mayor Ratio.
33. Reinicio del algoritmo
Modelo Anterior
Reiniciaba cuando no mejoraba nada en una iteración.
Se comprobó que no se aplicaba apenas, y nunca mejoró.
Nuevo modelo
Reinicia cuando en varias iteraciones (3) la mejora es
inferior al 1%.
Reinicios parciales tras cada iteración:
• Si la BL no mejora nada, reinicia sus parámetros (SR).
• Si el DE no mejora nada, reinicia la población.
35. Benchmark
Sobre el benchmarks
15 funciones de dimensión 1000.
Diferentes grupos de variables:
• Completamente separables: F1-F3.
• Parcialmente separables: F4-F11.
• Funciones con solapamiento: F12-F14.
• No-separables: F15.
Se ejecuta durante 3 · 106
evaluaciones.
Se miden los resultados con distinto número de
evaluaciones: 1.25 · 105
, 6 · 105
, 3 · 106
.
36. IHDELS Parameters
Parámetros
Tamaño de la población DE 100.
Evaluaciones de cada iteración del DE 50000.
Evaluaciones de cada iteración de la BL 50000.
Parámetros del original
Frecuencia de actualización de ProbBL 10.
Parámetros del nuevo
Mínimo mejora para reinicio 1%
Número de iteraciones consecutivas sin mejora 3.
37. Comparando con el original
Grupo de Funciones Función Original Propuesta
F1 4.80e-29 4.53e-24
Separables F2 1.27e+03 1.26e+03
F3 2.00e+01 2.01e+01
F4 3.09e+08 2.55e+08
Parcialmente F5 9.68e+06 1.18e+07
Separables F6 1.03e+06 1.03e+06
F7 3.18e+04 5.83e+02
F8 1.36e+12 2.19e+12
Parcialmente F9 7.12e+08 5.14e+08
Separables II F10 9.19e+07 9.16e+07
F11 9.87e+06 2.77e+06
F12 5.16e+02 1.32e+02
Con solapamiento F13 4.02e+06 6.29e+05
F14 1.48e+07 1.01e+07
No separable F15 3.13e+06 1.35e+06
Resultados
Mejora en 10 de las 15 funciones.
Mejora en los problemas más difíciles.
38. Visualmente
1 Se ordenan los algoritmos por función.
2 A cada algoritmo se asignan puntos por su posición.
• Criterio de la Fórmula 1.
3 Para cada algoritmo se suman sus puntos.
4 Se muestran la suma de puntos por categoría y totales.
42. Comparando con MOS
Grupo de Funciones Función Propuesta MOS
F1 4.53e-24 0.00e+00
Separables F2 1.26e+03 8.36e+02
F3 2.01e+01 9.10e-13
F4 2.55e+08 1.56e+08
Parcialmente F5 1.18e+07 6.79e+06
Separables F6 1.03e+06 1.39e+05
F7 5.83e+02 1.62e+04
F8 2.19e+12 8.08e+12
Parcialmente F9 5.14e+08 3.87e+08
Separables II F10 9.16e+07 1.18e+06
F11 2.77e+06 4.48e+07
F12 1.32e+02 2.46e+02
Con solapamiento F13 6.29e+05 3.30e+06
F14 1.01e+07 2.42e+07
No separable F15 1.35e+06 2.38e+06
Análisis
Mejora a MOS en las funciones más complejas, aunque no
globalmente.
47. Conclusiones
Hemos presentado un nuevo algoritmo para alta
dimensionalidad.
Se basa en un trabajo previo que modifica:
• Simplificando el mecanismo de elección de la BL.
• Mejorando el mecanismo de reinicio.
Resultados
Mejora claramente al algoritmo anterior.
Mejora al estado del arte (MOS) en los problemas más
complejos.