Computabilidad y Complejidad de Algoritmos
Programación Dinámica
Preparado por:
Solineth Batista
Maycol Requenez
Existe una serie de problemas cuyas soluciones pueden ser
expresadas recursivamente en términos matemáticos, y
posiblement...
En el diseño Divide y Vencerás para resolver un problema lo
dividimos en subproblemas independientes, los cuales se
resuel...
En estos casos es cuando la Programación Dinámica nos
puede ofrecer una solución aceptable. La eficiencia de esta
técnica ...
Donde tiene mayor aplicación la Programación Dinámica es
en la resolución de problemas de optimización. En este tipo
de pr...
La solución de problemas mediante esta técnica se basa en el
llamado principio de óptimo enunciado por Bellman en 1957
y q...
 Knapsack Problem (Problema de la Mochila)
 Algoritmo de Needleman–Wunsch
 El problema de la mochila (knapsack problem) consiste encontrar un

subconjunto de productos que echar en una mochila de...
 Digamos que tenemos l objetos con pesos p1, …,pl y

beneficios b1, …,bl.
 Definimos A(i, j) como el valor máximo que pu...
 Expresado formalmente tenemos la siguiente

definición recursiva.
0
A i, j

si i

0oj

A i 1, j

si pi

j

si pi

j

max...
 Ejemplo:
 Tenemos una caja que soporta 15 libras en la cual vamos

a colocar objetos para vender. Hay disponibles tres
...
 Continuación ejemplo:
 La información recopilada del algoritmo se puede

resumir en la siguiente tabla:

0
p1 9 0
p2 6 ...
 Continuación ejemplo:
 La información recopilada del algoritmo se puede

resumir en la siguiente tabla:
0
p1 9 0
p2 6 0...
 Uno de los problemas de todos los días en Bioinformática

es la comparación o alineamiento de secuencias.
Necesitamos sa...
 Ejemplo
 Consideremos el conjunto {A, G, C, T} sobre el cual

definimos dos cadenas s1 = GAATTCAGTTA y s2 =
GGATCGA.
 ...
 El algoritmo de Needleman-Wunsch busca generar

el alineamiento para lo cual coloca todas las
posibles combinaciones de ...
 Luego procedemos a rellenar la matriz M para lo cual

primero definimos una matriz S de semejanza de
caracteres.
 Si definimos Si;j como una función tal que devuelve la

similitud de los caracteres de la posición i de s1 y j de s2 y a...
 El procedimiento siguiente es describir el patrón que

se dibuja desde el extremo inferior derecho de la
matriz M y se a...
Dando el alineamiento:

G A A T T C A G T T A
|

|

| |

|

|

G G A ― T C ― G ― ― A
Programacion dinamica
Programacion dinamica
Programacion dinamica
Programacion dinamica
Programacion dinamica
Programacion dinamica
Programacion dinamica
Programacion dinamica
Programacion dinamica
Programacion dinamica
Programacion dinamica
Programacion dinamica
Próxima SlideShare
Cargando en…5
×

Programacion dinamica

648 visualizaciones

Publicado el

Publicado en: Tecnología
0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
648
En SlideShare
0
De insertados
0
Número de insertados
3
Acciones
Compartido
0
Descargas
18
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.
  • Según el alineamiento realizado en la tabla el primer, el tercer, el quinto, el sexto, el octavo y el undécimo caracter están correctamente alineados mientrasque el segundo ha sufrido una sustitución y las restantes existieron gap o huecos.El algoritmo de Needleman-Wunsch busca generar el alineamiento para locual coloca todas las posibles combinaciones de las dos secuencias s1 y s2 más una fila y columna de ceros para la generación de la recursividad, en una matriz M.
  • En nuestro ejemplo n = 11 y m = 7
  • La matriz mostradas en la tabla es la más simple matriz de sustitución que puede construirse por considerar 1 a la coincidencia exacta y 0 a la no coincidencia y 0 cuando hay un hueco o gap, ya que los actuales programas como FASTA o BLAST usan matrices más complejas las cuales son construidas según criterios de semejanza química, física u otros entre las moléculas en cuestión.
  • Gráficamente podrá ser visto más fácilmente Inicializado con la primera fila y columna como se muestra la figura por ceros para usarlo en la primera iteración, seguido el valor de M2;2 se calcula:
  • he first step in the global alignment dynamic programming approach is to create a matrix with M + 1 columns and N + 1 rows where M and N correspond to the size of the sequences to be aligned.Since this example assumes there is no gap opening or gap extension penalty, the first row and first column of the matrix can be initially filled with 0.
  • Using this information, the score at position 1,1 in the matrix can be calculated. Since the first residue in both sequences is a G, S1,1 = 1, and by the assumptions stated at the beginning, w = 0. Thus, M1,1 = MAX[M0,0 + 1, M1, 0 + 0, M0,1 + 0] = MAX [1, 0, 0] = 1.A value of 1 is then placed in position 1,1 of the scoring matrix.
  • Since the gap penalty (w) is 0, the rest of row 1 and column 1 can be filled in with the value 1. Take the example of row 1. At column 2, the value is the max of 0 (for a mismatch), 0 (for a vertical gap) or 1 (horizontal gap). The rest of row 1 can be filled out similarly until we get to column 8. At this point, there is a G in both sequences (light blue). Thus, the value for the cell at row 1 column 8 is the maximum of 1 (for a match), 0 (for a vertical gap) or 1 (horizontal gap). The value will again be 1. The rest of row 1 and column 1 can be filled with 1 using the above reasoning.
  • Now let's look at column 2. The location at row 2 will be assigned the value of the maximum of 1(mismatch), 1(horizontal gap) or 1 (vertical gap). So its value is 1.At the position column 2 row 3, there is an A in both sequences. Thus, its value will be the maximum of 2(match), 1 (horizontal gap), 1 (vertical gap) so its value is 2.Moving along to position colum 2 row 4, its value will be the maximum of 1 (mismatch), 1 (horizontal gap), 2 (vertical gap) so its value is 2. Note that for all of the remaining positions except the last one in column 2, the choices for the value will be the exact same as in row 4 since there are no matches. The final row will contain the value 2 since it is the maximum of 2 (match), 1 (horizontal gap) and 2(vertical gap).
  • Using the same techniques as described for column 2, we can fill in column 3.
  • After filling in all of the values the score matrix is as follows:
  • After the matrix fill step, the maximum alignment score for the two test sequences is 6. The traceback step determines the actual alignment(s) that result in the maximum score. Note that with a simple scoring algorithm such as one that is used here, there are likely to be multiple maximal alignments.The traceback step begins in the M,J position in the matrix, i.e. the position that leads to the maximal score. In this case, there is a 6 in that location.
  • Traceback takes the current cell and looks to the neighbor cells that could be direct predacessors. This means it looks to the neighbor to the left (gap in sequence #2), the diagonal neighbor (match/mismatch), and the neighbor above it (gap in sequence #1). The algorithm for traceback chooses as the next cell in the sequence one of the possible predacessors. In this case, the neighbors are marked in red. They are all also equal to 5.
  • Since the current cell has a value of 6 and the scores are 1 for a match and 0 for anything else, the only possible predacessor is the diagonal match/mismatch neighbor. If more than one possible predacessor exists, any can be chosen. This gives us a current alignment of (Seq #1) A | (Seq #2) A So now we look at the current cell and determine which cell is its direct predacessor. In this case, it is the cell with the red 5.
  • The alignment as described in the above step adds a gap to sequence #2, so the current alignment is(Seq #1) T A | (Seq #2) _ A Once again, the direct predacessor produces a gap in sequence #2.
  • Continuing on with the traceback step, we eventually get to a position in column 0 row 0 which tells us that traceback is completed
  • There are more alternative solutions each resulting in a maximal global alignment score of 6. Since this is an exponential problem, most dynamic programming algorithms will only print out a single solution.
  • Programacion dinamica

    1. 1. Computabilidad y Complejidad de Algoritmos Programación Dinámica Preparado por: Solineth Batista Maycol Requenez
    2. 2. Existe una serie de problemas cuyas soluciones pueden ser expresadas recursivamente en términos matemáticos, y posiblemente la manera más natural de resolverlos es mediante un algoritmo recursivo. Sin embargo, el tiempo de ejecución de la solución recursiva, normalmente de orden exponencial y por tanto impracticable, puede mejorarse substancialmente mediante la Programación Dinámica.
    3. 3. En el diseño Divide y Vencerás para resolver un problema lo dividimos en subproblemas independientes, los cuales se resuelven de manera recursiva para combinar finalmente las soluciones y así resolver el problema original. El inconveniente se presenta cuando los subproblemas obtenidos no son independientes sino que existe solapamiento entre ellos; entonces es cuando una solución recursiva no resulta eficiente por la repetición de cálculos que conlleva.
    4. 4. En estos casos es cuando la Programación Dinámica nos puede ofrecer una solución aceptable. La eficiencia de esta técnica consiste en resolver los subproblemas una sola vez, guardando sus soluciones en una tabla para su futura utilización. La Programación Dinámica no sólo tiene sentido aplicarla por razones de eficiencia, sino porque además presenta un método capaz de resolver de manera eficiente problemas cuya solución ha sido abordada por otras técnicas y ha fracasado.
    5. 5. Donde tiene mayor aplicación la Programación Dinámica es en la resolución de problemas de optimización. En este tipo de problemas se pueden presentar distintas soluciones, cada una con un valor, y lo que se desea es encontrar la solución de valor óptimo (máximo o mínimo).
    6. 6. La solución de problemas mediante esta técnica se basa en el llamado principio de óptimo enunciado por Bellman en 1957 y que dice: “En una secuencia de decisiones óptima toda subsecuencia ha de ser también óptima”.
    7. 7.  Knapsack Problem (Problema de la Mochila)  Algoritmo de Needleman–Wunsch
    8. 8.  El problema de la mochila (knapsack problem) consiste encontrar un subconjunto de productos que echar en una mochila de modo de maximizar el beneficio y no sobrepasar la capacidad de la mochila.  Se puede resumir el problema de la siguiente forma: maximizar sujeto a con xi l i k l bi xi i k pi xi {0,1} , k P i l  Donde l es la cantidad de objetos disponibles, bi es el beneficio que ofrece el objeto i, pi es el peso del objeto i, xi nos indica si colocamos o no el objeto i dentro de la mochila y P es el peso máximo que soporta la mochila.
    9. 9.  Digamos que tenemos l objetos con pesos p1, …,pl y beneficios b1, …,bl.  Definimos A(i, j) como el valor máximo que puede ser obtenido con los primeros i objetos pesando a lo más j.  Note que:  A(0, j) = 0 y A(i, 0) = 0 para cualquier i ≤ l y j ≤ P.  Si pi > j entonces A(i, j) = A(i – 1, j).  Si pi ≤ j entonces A(i, j) tiene dos opciones incluir o no incluir el objeto i.  Si no lo incluimos entonces tendrá un valor de A(i – 1, j).  Si lo incluimos entonces tendrá un valor de A(i – 1, j – pi) + bi.
    10. 10.  Expresado formalmente tenemos la siguiente definición recursiva. 0 A i, j si i 0oj A i 1, j si pi j si pi j max A i 1, j , A i j, j p1 bi 0
    11. 11.  Ejemplo:  Tenemos una caja que soporta 15 libras en la cual vamos a colocar objetos para vender. Hay disponibles tres objetos:  Objeto #1 pesa 9 libras y se vende a $38  Objeto #2 pesa 6 libras y se vende a $40  Objeto #3 pesa 5 libras y se vende a $24  ¿Cuál es la ganancia máxima que podemos obtener?
    12. 12.  Continuación ejemplo:  La información recopilada del algoritmo se puede resumir en la siguiente tabla: 0 p1 9 0 p2 6 0 p3 5 0 1 0 0 0 2 0 0 0 3 0 0 0 4 0 0 0 5 0 0 24 6 0 40 40 7 0 40 40 8 0 40 40 9 38 40 40 10 38 40 40 11 38 40 64 12 38 40 64 13 38 40 64 14 38 40 64 15 38 78 78
    13. 13.  Continuación ejemplo:  La información recopilada del algoritmo se puede resumir en la siguiente tabla: 0 p1 9 0 p2 6 0 p3 5 0 1 0 0 0 2 0 0 0 3 0 0 0 4 0 0 0 5 0 0 24 6 0 40 40 7 0 40 40 8 0 40 40 9 38 40 40 10 38 40 40 11 38 40 64 12 38 40 64 13 38 40 64 14 38 40 64 15 38 78 78
    14. 14.  Uno de los problemas de todos los días en Bioinformática es la comparación o alineamiento de secuencias. Necesitamos saber que tan similares son dos secuencias, permitiendo que haya pequeñas diferencias ya sea de reemplazo o de borrado entre una y otra.  El algoritmo de Needleman-Wunsch sirve para realizar alineamientos globales de dos secuencias.  Fue propuesto por primera vez en 1970, por Saul Needleman y Christian Wunsch.  El algoritmo calcula puntajes de similitud global entre dos secuencias.
    15. 15.  Ejemplo  Consideremos el conjunto {A, G, C, T} sobre el cual definimos dos cadenas s1 = GAATTCAGTTA y s2 = GGATCGA.  El objetivo del algoritmo es alinearlas de tal forma que puedan identificarse huecos, inserciones o cambios en los caracteres de las secuencias.  Para el ejemplo un alineamiento es el siguiente: s
    16. 16.  El algoritmo de Needleman-Wunsch busca generar el alineamiento para lo cual coloca todas las posibles combinaciones de las dos secuencias s1 y s2 más una fila y columna de ceros para la generación de la recursividad, en una matriz M.  Definiendo a n = |s1| y a m = |s2| entonces la matriz M será de tamaño (m +1) (n + 1).
    17. 17.  Luego procedemos a rellenar la matriz M para lo cual primero definimos una matriz S de semejanza de caracteres.
    18. 18.  Si definimos Si;j como una función tal que devuelve la similitud de los caracteres de la posición i de s1 y j de s2 y a W como la penalización por hueco que en este caso es simplemente 0, tendremos listo las funciones necesarias para llenar la matriz M.  Para proceder a rellenar M tendrán la siguiente ley de formación: Mi, j  Donde:  Mi 1, j 1  Mi  M i, j 1, j 1 max M i 1, j 1 Si , j , M i , j 1 W , Mi 1, j Si , j Indica la coincidencia o no coincidencia de los caracteres de las secuencias. W Indica la suma en horizontal más la penalización por hueco. W Indica la suma en vertical más la penalización por hueco. W
    19. 19.  El procedimiento siguiente es describir el patrón que se dibuja desde el extremo inferior derecho de la matriz M y se avanza a la izquierda o a la izquierda y arriba tomando siempre el valor que le precedió al construir M.
    20. 20. Dando el alineamiento: G A A T T C A G T T A | | | | | | G G A ― T C ― G ― ― A

    ×