Manipulación de Distribuciones. Resultados Experimentales. Universidad de Málaga. Introducción de Sesgo Heurístico en Algoritmos Genéticos Mediante Operadores Basados en Distribuciones.
Introducción de Sesgo Heurístico en Algoritmos Genéticos Mediante Operadores Basados en Distribuciones
1. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
Introducción de Sesgo Heurístico en Algoritmos
Genéticos Mediante Operadores Basados en
Distribuciones
Departamento de Lenguajes y
Ciencias de la Computación
Universidad de Málaga
Rafael Nogueras, Carlos Cotta
2. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
Introducción
• Incluir conocimiento del problema en la
optimización es crucial para obtener el
mejor rendimiento.
• En particular, la reproducción debe hacerse
de forma “inteligente”.
• El conocimiento disponible a priori se
puede usar para diseñar operadores de
recombinación y/o mutación.
• ¿Qué sucede si el conocimiento es
imperfecto o limitado? ¿Cómo capturarlo
en tiempo real?
Introducción
3. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
n
i
2
1 ψ
,...,
ψ
,...,
ψ
,
ψ
=
S
Conjunto de Semejanza
Base de la Representación
Alelos
Genes
Representación
Potencial Dinástico
Reproducción
en EAs
( )
)
C(ψ
i
1
i
0
i
i
ψ
,...,
ψ
,
ψ
ψ
C =
4. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
Y0
H1
Z1
2
1
Y
1
1
Y
H2
Z2
4
2
Y
3
2
Y
Hn
1
+
Yk
n
k
n
Y
solución
por especificar
Los valores de los genes son especificados incrementalmente.
expansión
dinástica
unidades de
transmisión
Recombinación Genética
Reproducción
en EAs
Zn
5. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
)
en
solución
única
la
(
z
Devolver
.
3
).
,
,
,
(
c)
.
,
r
Selecciona
b)
.
y
que
gen tal
un
i.e.,
,
en
aleatorio
gen
un
r
Selecciona
a)
hacer
1
Ψ
mientras
2.
y)
(x,
.
1
Y
Y
Y
=
Y
Y
Y
Y
=
Y
y
x
K
y
x
y
x
Conjunto de Compatibilidad Genética
Un Modelo de Recombinación
En general, el funcionamiento de la
recombinación puede describirse como sigue:
Reproducción
en EAs
Existen genes aún sin
especificar
6. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
50
100
150
200
50
100
150
200
0
Expansión dinástica
Operador de recombinación
Distribución de
probabilidad sobre
tripletes de soluciones
Recombinación y Probabilidad
¿Cómo es esta distribución?
Reproducción
en EAs
7. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
¿Sencillo, pero bueno?
• Las distribuciones uniformes se utilizan a
menudo:
• Por ejemplo, cruce uniforme en cadenas de bits,
cruce cíclico uniforme en permutaciones, …
( )
( )
= caso
otro
en
,
1
,
si
0
)
,
,
(
y
x
y
x
z
z
y
x
RTR
Muestreo aleatorio del
potencial dinástico
Reproducción
en EAs
8. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
¡Hazlo de forma astuta!
• El sesgo heurístico se introduce en la
selección de fragmentos de información
durante la recombinación.
– Estrategias voraces
– Reparación heurística
– Backtracking
– Branch & Bound
– …
• Pero es necesario conocimiento explícito,
disponible a priori.
Reproducción
en EAs
9. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
Una Aproximación
Alternativa
• Intentar inferir el comportamiento del mejor
operador a partir de la información disponible en el
espacio de búsqueda.
• El comportamiento se modela como una
distribución de probabilidad, por lo que…
• … los algoritmos de estimación de distribuciones
(EDAs) se pueden usar para este propósito.
• Operadores Basados en Distribuciones: se
utiliza un EDA para controlar la manipulación de la
información.
Manipulación
de
Distribuciones
10. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
Algoritmos de Estimación de
Distribuciones
El modelo probabilístico refleja
suposiciones apriorísticas sobre el
problema.
Las Redes Bayesianas (BN) proporcionan
un marco de trabajo general.
Manipulación
de
Distribuciones
11. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
Redes Bayesianas
a
b
d
c
f
e
P(a=0);
P(a=1)
P(b=0|a=0) ; P(b=0|a=1);
P(b=1|a=0) ; P(b=1|a=1)
P(f=0|c=0,d=0); P(f=0|c=0,d=1);
P(f=0|c=1,d=0); P(f=0|c=1,d=1);
P(f=1|c=0,d=0); P(f=1|c=0,d=1);
P(f=1|c=1,d=0); P(f=1|c=1,d=1)
La BN también introduce un orden parcial en las variables:
a b c,d f
d e
Manipulación
de
Distribuciones
12. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
).
Π
BN,
Muestrear(
iii.
.
de
variables
las
para
en
valores
los
Π
Sean
ii.
BN.
la
en
variable
la
de
padres
los
Π
Sean
i.
caso
otro
en
(b)
entonces
si
(a)
hacer
1..
Para
3.
BN.
la
en
variables
las
de
lógico
orden topo
el
,...,
Sea
2.
.
recombinar
por
soluciones
las
y
Sean
1.
1
d
i
d
j
i
i
i
i
n
j
j
j
j
j
d
d
i
s
d
s'
s
n
j
i
i
s'
s
=
Recombinación Basada en
Distribuciones
Usando la distribución de probabilidades
Manipulación
de
Distribuciones
Respeto a las características comunes
13. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
).
(
min
arg
donde
,
Mutar
3.
).
Π
|
(
)
(
(c)
.
de
variables
las
para
en
valores
los
Π
Sean
(b)
BN.
la
en
variable
la
de
padres
los
Π
Sean
(a)
hacer
1..
Para
2.
mutar.
que
solución
la
Sea
1.
j
p
z
s
s
X
P
j
p
d
j
n
j
s
z
d
j
j
d
=
=
Mutación Basada en
Distribuciones
Modificar la variable con el valor
más inverosímil
Manipulación
de
Distribuciones
14. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
Aprendiendo el Modelo
• La información se captura a través del
muestreo…
• … pero un optimizador no consigue nueva
información (útil) durante su ejecución
(Lema de Conservación de T. English).
• Utilizamos una ejecución de un EA puro
manteniendo un registro de las mejores
soluciones.
• Se elige un orden heurístico de las
variables y se usa el algoritmo K2 para
aprender la BN.
Manipulación
de
Distribuciones
15. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
Aprendiendo el Modelo (y II)
• Mediante el Modelo Iterativo se obtienen
Redes Bayesianas mejor entrenadas.
• i-HPA=HPAn, donde n es el número de
iteraciones
Manipulación
de
Distribuciones
)
p
HPA,
-
run(i
3.
)
p
run(HPA,
p
hacer
1]
-
[1..n
j
para
2.
run(GA)
p
1.
n
j
1
j
1
+
16. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
Resultados Experimentales
• Se utiliza una generación elitista con
selección de tipo ranking, popsize = 100,
pX =.9, pm =.01, maxevals = 10,000.
• No se ha realizado un ajuste fino de los
parámetros.
• Problemas estudiados: OneMax, SAT,
MMDP, P-Peaks.
• 50 ejecuciones por problema.
• Comparación con EDAs y GAs.
Resultados
Experimentales
23. Plegado de
Proteínas
Modelos
Discretos
AE para
PSP
Comparativa
Universidad de Málaga
Extensiones
Conclusiones
Introducción
Reproducción
en EAs
Manipulación
de
Distribuciones
Resultados
Experimentales
Universidad de Málaga
Conclusiones
Conclusiones
• Si no se dispone de conocimiento futuro
explícito, las técnicas de aprendizaje
automático pueden ser de ayuda.
• Las técnicas bayesianas parecen ser útiles
para este propósito.
• Cuestiones abiertas: ¿Qué sucede con las
restricciones? ¿y con el incremento de la
dimensionalidad?
Conclusiones