SlideShare una empresa de Scribd logo
1 de 63
Descargar para leer sin conexión
Сравнение
                   Последовательностей
                              Николай Вяххи
                           vyahhi@bioinf.spbau.ru

                           Computer Science клуб
                            Екатеринбург, 2012


суббота, 6 октября 12 г.
Центральная Догма




суббота, 6 октября 12 г.
Омики




суббота, 6 октября 12 г.
Домашнее задание
                                       http://rosalind.info
                                        • DNA
                                        • RNA
                                        • REVC
                                        • PROT
                                        • HAMM
                     http://rosalind.info/classes/enroll/
              171da3d314a0b07e00883287cd2b6ddeeeba225b/
суббота, 6 октября 12 г.
Подстроки

                             Строка == Последовательность


                                          НО


                           Подстрока != Подпоследовательность


суббота, 6 октября 12 г.
Расстояние Хэмминга
                                        Число замен,
                           необходимых для преобразования первой
                                     строки во вторую.


                                        CCAGAGAC
                                        CCAAGGCT


суббота, 6 октября 12 г.
Редакционное
                                расстояние
                               Число замен, вставок и удалений,
                           необходимых для преобразования первой
                                      строки во вторую.


                                       CCAGAGAC-
                                       CCA-AGGCT
                                      (выравнивание)

суббота, 6 октября 12 г.
Динамика
                                C   C   A   G   A   G   A   C

                           C
                           C
                           A
                           A
                           G
                           G
                           C
                           T




суббота, 6 октября 12 г.
Динамика
                                C   C   A   G   A   G   A   C

                           C
                           C
                           A
                           A
                           G
                           G
                           C
                           T                                ?




суббота, 6 октября 12 г.
Динамика
                                   C   C   A   G   A   G   A   C
                               0
                           C
                           C
                           A
                           A
                           G
                           G
                           C
                           T                                   ?




суббота, 6 октября 12 г.
Динамика
                                   C   C   A   G   A   G   A   C
                               0   1   2   3   4   5   6   7   8
                           C   1
                           C   2
                           A   3
                           A   4
                           G   5
                           G   6
                           C   7
                           T   8                               ?




суббота, 6 октября 12 г.
Динамика
                                   C   C   A   G   A   G   A   C
                               0   1   2   3   4   5   6   7   8
                           C   1   ?
                           C   2
                           A   3
                           A   4
                           G   5
                           G   6
                           C   7
                           T   8                               ?




суббота, 6 октября 12 г.
Динамика
                                   C   C   A   G   A   G   A   C
                               0   1   2   3   4   5   6   7   8
                           C   1   0
                           C   2   ?
                           A   3
                           A   4
                           G   5
                           G   6
                           C   7
                           T   8                               ?




суббота, 6 октября 12 г.
Динамика
                                   C   C   A   G   A   G   A   C
                               0   1   2   3   4   5   6   7   8
                           C   1   0
                           C   2   1
                           A   3   ?
                           A   4
                           G   5
                           G   6
                           C   7
                           T   8                               ?




суббота, 6 октября 12 г.
Динамика
                                            C   C   A   G   A   G     A   C
                                        0   1   2   3   4   5   6     7   8
                                    C   1   0
                                    C   2   1
                                    A   3   ?
                                    A   4
                                    G   5
                                    G   6
                                    C   7
                                    T   8                                 ?


                                            d[i-1][j]           + 1

                           d[i][j] = MIN    d[i][j-1]           + 1

                                            d[i-1][j-1] + (s1[i] != s2[j])
суббота, 6 октября 12 г.
Динамика
                                            C   C   A   G   A   G     A   C
                                        0   1   2   3   4   5   6     7   8
                                    C   1   0   1   2   3   4   5     6   7
                                    C   2   1   0   1   2   3   4     5   6
                                    A   3   2   1   0   1   2   3     4   5
                                    A   4   3   2   1   1   1   2     3   4
                                    G   5   4   3   2   1   2   1     2   3
                                    G   6   5   4   3   2   2   2     2   3
                                    C   7   6   5   4   3   3   3     3   2
                                    T   8   7   6   5   4   4   4     4   3


                                            d[i-1][j]           + 1

                           d[i][j] = MIN    d[i][j-1]           + 1

                                            d[i-1][j-1] + (s1[i] != s2[j])
суббота, 6 октября 12 г.
Динамика
                                            C   C   A   G   A   G     A   C
                                        0   1   2   3   4   5   6     7   8
                                    C   1   0   1   2   3   4   5     6   7
                                    C   2   1   0   1   2   3   4     5   6
                                    A   3   2   1   0   1   2   3     4   5
                                    A   4   3   2   1   1   1   2     3   4
                                    G   5   4   3   2   1   2   1     2   3
                                    G   6   5   4   3   2   2   2     2   3
                                    C   7   6   5   4   3   3   3     3   2
                                    T   8   7   6   5   4   4   4     4   3


                                            d[i-1][j]           + 1

                           d[i][j] = MIN    d[i][j-1]           + 1

                                            d[i-1][j-1] + (s1[i] != s2[j])
суббота, 6 октября 12 г.
Динамика
                                   C   C   A   G   A   G   A   C
                               0   1   2   3   4   5   6   7   8
                           C   1   0   1   2   3   4   5   6   7
                           C   2   1   0   1   2   3   4   5   6
                           A   3   2   1   0   1   2   3   4   5
                           A   4   3   2   1   1   1   2   3   4
                           G   5   4   3   2   1   2   1   2   3
                           G   6   5   4   3   2   2   2   2   3
                           C   7   6   5   4   3   3   3   3   2
                           T   8   7   6   5   4   4   4   4   3



                                       CCAGAGAC-
                                       CCA-AGGCT
суббота, 6 октября 12 г.
Динамика
                               A   B   R   A   C

                           A
                           D
                           A
                           B
                           R
                           A




суббота, 6 октября 12 г.
Динамика
                               A   B   R   A   C

                           A
                           D
                           A
                           B
                           R
                           A




                               -ABRACA
                               DABR--A
суббота, 6 октября 12 г.
Редакционное
                                  расстояние

                           Память: O( ? )


                           Время: O( ? )




суббота, 6 октября 12 г.
Редакционное
                                 расстояние

                           Память: O(N2)


                           Время: O(N2)




суббота, 6 октября 12 г.
Редакционное
                                 расстояние
                           Если нам нужно только расстояние, но не
                           выравнивание, можно ли использовать
                           меньше памяти?
                                           C   C   A   G   A   G   A   C
                                       0   1   2   3   4   5   6   7   8
                                   C   1   0   1   2   3   4   5   6   7
                                   C   2   1   0   1   2   3   4   5   6
                                   A   3   2   1   0   1   2   3   4   5
                                   A   4   3   2   1   1   1   2   3   4
                                   G   5   4   3   2   1   2   1   2   3
                                   G   6   5   4   3   2   2   2   2   3
                                   C   7   6   5   4   3   3   3   3   2
                                   T   8   7   6   5   4   4   4   4   3
суббота, 6 октября 12 г.
Редакционное
                                 расстояние
                           Если нам нужно только расстояние, но не
                           выравнивание, можно ли использовать
                           меньше памяти?
                                           C   C   A   G   A   G   A   C
                                       0   1   2   3   4   5   6   7   8
                                   C
                                   C
                                       1
                                       2
                                           0
                                           1
                                               1
                                               0
                                                   2
                                                   1
                                                       3
                                                       2
                                                           4
                                                           3
                                                               5
                                                               4
                                                                   6
                                                                   5
                                                                       7
                                                                       6
                                                                           Да.
                                   A   3   2   1   0   1   2   3   4   5   Храним
                                   A
                                   G
                                       4
                                       5
                                           3
                                           4
                                               2
                                               3
                                                   1
                                                   2
                                                       1
                                                       1
                                                           1
                                                           2
                                                               2
                                                               1
                                                                   3
                                                                   2
                                                                       4
                                                                       3
                                                                           только 2
                                   G   6   5   4   3   2   2   2   2   3   колонки.
                                   C   7   6   5   4   3   3   3   3   2
                                   T   8   7   6   5   4   4   4   4   3
суббота, 6 октября 12 г.
Оценка
                           Минимизируем расстояние →
                           максимизируем оценку (score)




суббота, 6 октября 12 г.
Оценка
                                   Минимизируем расстояние →
                                   максимизируем оценку (score)

                               T    C   A    G         T    C    A    G

                           T   1    0   0    0     T   3    -2   -1   -2

                           C   0    1   0    0     C   -2   3    -2   -1

                           A   0    0   1    0     A   -1   -2   3    -2

                           G   0    0   0    1     G   -2   -1   -2   3




суббота, 6 октября 12 г.
Оценка
                                    Минимизируем расстояние →
                                    максимизируем оценку (score)

                               T     C   A    G         T     C    A    G

                           T   1     0   0    0     T   3     -2   -1   -2

                           C   0     1   0    0     C   -2    3    -2   -1

                           A   0     0   1    0     A   -1    -2   3    -2

                           G   0     0   0    1     G   -2    -1   -2   3


                                   GAP = 0                  GAP = -3
суббота, 6 октября 12 г.
Оценка
                                  Минимизируем расстояние →
                                  максимизируем оценку (score)


                                           d[i-1][j]   + GAP

                           d[i][j] = MAX   d[i][j-1]   + GAP

                                           d[i-1][j-1] + SCORE[s1[i]][s2[j]]




суббота, 6 октября 12 г.
BLOSUM, PAM




суббота, 6 октября 12 г.
Локальное
                           выравнивание




суббота, 6 октября 12 г.
Локальное
                           выравнивание




суббота, 6 октября 12 г.
Локальное
                           выравнивание




суббота, 6 октября 12 г.
Локальное
                           выравнивание




суббота, 6 октября 12 г.
Локальное
                           выравнивание




суббота, 6 октября 12 г.
Локальное
                           выравнивание




суббота, 6 октября 12 г.
Локальное
                           выравнивание




суббота, 6 октября 12 г.
Локальное
                                   выравнивание
                           O(N6)




суббота, 6 октября 12 г.
Локальное
                                   выравнивание
                           O(N6)
                           O(N4)




суббота, 6 октября 12 г.
Локальное
                                   выравнивание
                           O(N6)
                           O(N4)


                           Как быстрее?




суббота, 6 октября 12 г.
Локальное
                                   выравнивание
                           O(N6)
                           O(N4)


                           Как быстрее?




суббота, 6 октября 12 г.
Локальное
                                  выравнивание



                                           0 ← изменилось тут

                                           d[i-1][j]   + GAP

                           d[i][j] = MAX   d[i][j-1]   + GAP

                                           d[i-1][j-1] + SCORE[s1[i]][s2[j]]
суббота, 6 октября 12 г.
Локальное
                                   выравнивание
                           O(N6)
                           O(N4)


                           Как быстрее?
                           O(N2)
                                           0 ← изменилось тут

                                           d[i-1][j]   + GAP

                           d[i][j] = MAX   d[i][j-1]   + GAP

                                           d[i-1][j-1] + SCORE[s1[i]][s2[j]]
суббота, 6 октября 12 г.
Локальное
                                   выравнивание
                               A   B   R   A   C                    A    B    C    D    R     -
                                                              A     3    -2   -2   -2   -1   -3
                    A                                         B     -2   3    -2   -2   -2   -3
                    D                                         C     -2   -2   4    -1   -2   -3
                    A                                         D     -2   -2   -1   4    -2   -3
                    B                                         R     -1   -2   -2   -2   3    -3
                    R                                         -     -3   -3   -3   -3   -3   -3
                    A


                                               0 ← изменилось тут

                                               d[i-1][j]   + GAP

                           d[i][j] = MAX       d[i][j-1]   + GAP

                                               d[i-1][j-1] + SCORE[s1[i]][s2[j]]
суббота, 6 октября 12 г.
Множественное
                            выравнивание
                            Число замен, вставок и удалений,
                           необходимых для преобразования
                                   K строк к одной.




суббота, 6 октября 12 г.
Множественное
                            выравнивание




суббота, 6 октября 12 г.
Множественное
                            выравнивание




суббота, 6 октября 12 г.
Профиль




суббота, 6 октября 12 г.
Множественное
                            выравнивание
                            Число замен, вставок и удалений,
                           необходимых для преобразования
                                   K строк к одной.


                                        O(NK)



суббота, 6 октября 12 г.
Множественное
                            выравнивание
                            Число замен, вставок и удалений,
                           необходимых для преобразования
                                   K строк к одной.


                                       O(2KNK)



суббота, 6 октября 12 г.
ClustalW

                                      O(K2N2)




суббота, 6 октября 12 г.
Аффинная модель
                           Удаление X букв подряд вероятнее, чем
                              удаление X букв по отдельности.




суббота, 6 октября 12 г.
Аффинная модель
                           Удаление X букв подряд вероятнее, чем
                              удаление X букв по отдельности.




суббота, 6 октября 12 г.
Аффинная модель
                            Удаление X букв подряд вероятнее, чем
                               удаление X букв по отдельности.


                           GAP(X) =
                           GAP_OPENING +
                           X * GAP_EXTENSION


суббота, 6 октября 12 г.
Аффинная модель




суббота, 6 октября 12 г.
Аффинная модель

                                        O(N3)




суббота, 6 октября 12 г.
Аффинная модель

                                        O(N3)


                                        Быстрее?




суббота, 6 октября 12 г.
Аффинная модель




суббота, 6 октября 12 г.
Аффинная модель




                                        O(N2)
суббота, 6 октября 12 г.
Геномные
                                 перестройки
                           Крупные мутации:
                             реверсии
                             транслокации
                             слияния
                             расщепления



суббота, 6 октября 12 г.
Геномные
                           перестройки




суббота, 6 октября 12 г.
Геномные
                           перестройки




суббота, 6 октября 12 г.
Что мы узнали
                     • Редакционное расстояние
                     • Глобальное и локальное выравнивание
                     • Аффинная модель вставки
                     • Всё за O(N )
                                 2


                     • Множественное выравнивание
                     • Геномные перестройки
суббота, 6 октября 12 г.
Домашнее задание
                                       http://rosalind.info
                                        • EDIT
                                        • EDTA
                                        • GLOB
                                        • LOCA
                                        • MULT
                     http://rosalind.info/classes/enroll/
              171da3d314a0b07e00883287cd2b6ddeeeba225b/
суббота, 6 октября 12 г.

Más contenido relacionado

Más de Computer Science Club

20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugsComputer Science Club
 
20140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture1220140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture12Computer Science Club
 
20140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture1120140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture11Computer Science Club
 
20140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture1020140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture10Computer Science Club
 
20140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture0920140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture09Computer Science Club
 
20140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture0220140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture02Computer Science Club
 
20140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture0120140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture01Computer Science Club
 
20140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-0420140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-04Computer Science Club
 
20140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture0120140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture01Computer Science Club
 
20130928 automated theorem_proving_harrison
20130928 automated theorem_proving_harrison20130928 automated theorem_proving_harrison
20130928 automated theorem_proving_harrisonComputer Science Club
 

Más de Computer Science Club (20)

20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs
 
20140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture1220140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture12
 
20140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture1120140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture11
 
20140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture1020140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture10
 
20140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture0920140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture09
 
20140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture0220140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture02
 
20140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture0120140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture01
 
20140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-0420140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-04
 
20140223-SuffixTrees-lecture01-03
20140223-SuffixTrees-lecture01-0320140223-SuffixTrees-lecture01-03
20140223-SuffixTrees-lecture01-03
 
20140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture0120140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture01
 
20131106 h10 lecture6_matiyasevich
20131106 h10 lecture6_matiyasevich20131106 h10 lecture6_matiyasevich
20131106 h10 lecture6_matiyasevich
 
20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich
 
20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich
 
20131013 h10 lecture4_matiyasevich
20131013 h10 lecture4_matiyasevich20131013 h10 lecture4_matiyasevich
20131013 h10 lecture4_matiyasevich
 
20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich
 
20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich
 
20131006 h10 lecture2_matiyasevich
20131006 h10 lecture2_matiyasevich20131006 h10 lecture2_matiyasevich
20131006 h10 lecture2_matiyasevich
 
20130922 h10 lecture1_matiyasevich
20130922 h10 lecture1_matiyasevich20130922 h10 lecture1_matiyasevich
20130922 h10 lecture1_matiyasevich
 
20130928 automated theorem_proving_harrison
20130928 automated theorem_proving_harrison20130928 automated theorem_proving_harrison
20130928 automated theorem_proving_harrison
 
20130922 lecture3 matiyasevich
20130922 lecture3 matiyasevich20130922 lecture3 matiyasevich
20130922 lecture3 matiyasevich
 

20121006 algorithmsinbioinformatics vyahhi_lecture02

  • 1. Сравнение Последовательностей Николай Вяххи vyahhi@bioinf.spbau.ru Computer Science клуб Екатеринбург, 2012 суббота, 6 октября 12 г.
  • 4. Домашнее задание http://rosalind.info • DNA • RNA • REVC • PROT • HAMM http://rosalind.info/classes/enroll/ 171da3d314a0b07e00883287cd2b6ddeeeba225b/ суббота, 6 октября 12 г.
  • 5. Подстроки Строка == Последовательность НО Подстрока != Подпоследовательность суббота, 6 октября 12 г.
  • 6. Расстояние Хэмминга Число замен, необходимых для преобразования первой строки во вторую. CCAGAGAC CCAAGGCT суббота, 6 октября 12 г.
  • 7. Редакционное расстояние Число замен, вставок и удалений, необходимых для преобразования первой строки во вторую. CCAGAGAC- CCA-AGGCT (выравнивание) суббота, 6 октября 12 г.
  • 8. Динамика C C A G A G A C C C A A G G C T суббота, 6 октября 12 г.
  • 9. Динамика C C A G A G A C C C A A G G C T ? суббота, 6 октября 12 г.
  • 10. Динамика C C A G A G A C 0 C C A A G G C T ? суббота, 6 октября 12 г.
  • 11. Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 C 2 A 3 A 4 G 5 G 6 C 7 T 8 ? суббота, 6 октября 12 г.
  • 12. Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 ? C 2 A 3 A 4 G 5 G 6 C 7 T 8 ? суббота, 6 октября 12 г.
  • 13. Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 0 C 2 ? A 3 A 4 G 5 G 6 C 7 T 8 ? суббота, 6 октября 12 г.
  • 14. Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 0 C 2 1 A 3 ? A 4 G 5 G 6 C 7 T 8 ? суббота, 6 октября 12 г.
  • 15. Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 0 C 2 1 A 3 ? A 4 G 5 G 6 C 7 T 8 ? d[i-1][j] + 1 d[i][j] = MIN d[i][j-1] + 1 d[i-1][j-1] + (s1[i] != s2[j]) суббота, 6 октября 12 г.
  • 16. Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 0 1 2 3 4 5 6 7 C 2 1 0 1 2 3 4 5 6 A 3 2 1 0 1 2 3 4 5 A 4 3 2 1 1 1 2 3 4 G 5 4 3 2 1 2 1 2 3 G 6 5 4 3 2 2 2 2 3 C 7 6 5 4 3 3 3 3 2 T 8 7 6 5 4 4 4 4 3 d[i-1][j] + 1 d[i][j] = MIN d[i][j-1] + 1 d[i-1][j-1] + (s1[i] != s2[j]) суббота, 6 октября 12 г.
  • 17. Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 0 1 2 3 4 5 6 7 C 2 1 0 1 2 3 4 5 6 A 3 2 1 0 1 2 3 4 5 A 4 3 2 1 1 1 2 3 4 G 5 4 3 2 1 2 1 2 3 G 6 5 4 3 2 2 2 2 3 C 7 6 5 4 3 3 3 3 2 T 8 7 6 5 4 4 4 4 3 d[i-1][j] + 1 d[i][j] = MIN d[i][j-1] + 1 d[i-1][j-1] + (s1[i] != s2[j]) суббота, 6 октября 12 г.
  • 18. Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 0 1 2 3 4 5 6 7 C 2 1 0 1 2 3 4 5 6 A 3 2 1 0 1 2 3 4 5 A 4 3 2 1 1 1 2 3 4 G 5 4 3 2 1 2 1 2 3 G 6 5 4 3 2 2 2 2 3 C 7 6 5 4 3 3 3 3 2 T 8 7 6 5 4 4 4 4 3 CCAGAGAC- CCA-AGGCT суббота, 6 октября 12 г.
  • 19. Динамика A B R A C A D A B R A суббота, 6 октября 12 г.
  • 20. Динамика A B R A C A D A B R A -ABRACA DABR--A суббота, 6 октября 12 г.
  • 21. Редакционное расстояние Память: O( ? ) Время: O( ? ) суббота, 6 октября 12 г.
  • 22. Редакционное расстояние Память: O(N2) Время: O(N2) суббота, 6 октября 12 г.
  • 23. Редакционное расстояние Если нам нужно только расстояние, но не выравнивание, можно ли использовать меньше памяти? C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 0 1 2 3 4 5 6 7 C 2 1 0 1 2 3 4 5 6 A 3 2 1 0 1 2 3 4 5 A 4 3 2 1 1 1 2 3 4 G 5 4 3 2 1 2 1 2 3 G 6 5 4 3 2 2 2 2 3 C 7 6 5 4 3 3 3 3 2 T 8 7 6 5 4 4 4 4 3 суббота, 6 октября 12 г.
  • 24. Редакционное расстояние Если нам нужно только расстояние, но не выравнивание, можно ли использовать меньше памяти? C C A G A G A C 0 1 2 3 4 5 6 7 8 C C 1 2 0 1 1 0 2 1 3 2 4 3 5 4 6 5 7 6 Да. A 3 2 1 0 1 2 3 4 5 Храним A G 4 5 3 4 2 3 1 2 1 1 1 2 2 1 3 2 4 3 только 2 G 6 5 4 3 2 2 2 2 3 колонки. C 7 6 5 4 3 3 3 3 2 T 8 7 6 5 4 4 4 4 3 суббота, 6 октября 12 г.
  • 25. Оценка Минимизируем расстояние → максимизируем оценку (score) суббота, 6 октября 12 г.
  • 26. Оценка Минимизируем расстояние → максимизируем оценку (score) T C A G T C A G T 1 0 0 0 T 3 -2 -1 -2 C 0 1 0 0 C -2 3 -2 -1 A 0 0 1 0 A -1 -2 3 -2 G 0 0 0 1 G -2 -1 -2 3 суббота, 6 октября 12 г.
  • 27. Оценка Минимизируем расстояние → максимизируем оценку (score) T C A G T C A G T 1 0 0 0 T 3 -2 -1 -2 C 0 1 0 0 C -2 3 -2 -1 A 0 0 1 0 A -1 -2 3 -2 G 0 0 0 1 G -2 -1 -2 3 GAP = 0 GAP = -3 суббота, 6 октября 12 г.
  • 28. Оценка Минимизируем расстояние → максимизируем оценку (score) d[i-1][j] + GAP d[i][j] = MAX d[i][j-1] + GAP d[i-1][j-1] + SCORE[s1[i]][s2[j]] суббота, 6 октября 12 г.
  • 29. BLOSUM, PAM суббота, 6 октября 12 г.
  • 30. Локальное выравнивание суббота, 6 октября 12 г.
  • 31. Локальное выравнивание суббота, 6 октября 12 г.
  • 32. Локальное выравнивание суббота, 6 октября 12 г.
  • 33. Локальное выравнивание суббота, 6 октября 12 г.
  • 34. Локальное выравнивание суббота, 6 октября 12 г.
  • 35. Локальное выравнивание суббота, 6 октября 12 г.
  • 36. Локальное выравнивание суббота, 6 октября 12 г.
  • 37. Локальное выравнивание O(N6) суббота, 6 октября 12 г.
  • 38. Локальное выравнивание O(N6) O(N4) суббота, 6 октября 12 г.
  • 39. Локальное выравнивание O(N6) O(N4) Как быстрее? суббота, 6 октября 12 г.
  • 40. Локальное выравнивание O(N6) O(N4) Как быстрее? суббота, 6 октября 12 г.
  • 41. Локальное выравнивание 0 ← изменилось тут d[i-1][j] + GAP d[i][j] = MAX d[i][j-1] + GAP d[i-1][j-1] + SCORE[s1[i]][s2[j]] суббота, 6 октября 12 г.
  • 42. Локальное выравнивание O(N6) O(N4) Как быстрее? O(N2) 0 ← изменилось тут d[i-1][j] + GAP d[i][j] = MAX d[i][j-1] + GAP d[i-1][j-1] + SCORE[s1[i]][s2[j]] суббота, 6 октября 12 г.
  • 43. Локальное выравнивание A B R A C A B C D R - A 3 -2 -2 -2 -1 -3 A B -2 3 -2 -2 -2 -3 D C -2 -2 4 -1 -2 -3 A D -2 -2 -1 4 -2 -3 B R -1 -2 -2 -2 3 -3 R - -3 -3 -3 -3 -3 -3 A 0 ← изменилось тут d[i-1][j] + GAP d[i][j] = MAX d[i][j-1] + GAP d[i-1][j-1] + SCORE[s1[i]][s2[j]] суббота, 6 октября 12 г.
  • 44. Множественное выравнивание Число замен, вставок и удалений, необходимых для преобразования K строк к одной. суббота, 6 октября 12 г.
  • 45. Множественное выравнивание суббота, 6 октября 12 г.
  • 46. Множественное выравнивание суббота, 6 октября 12 г.
  • 48. Множественное выравнивание Число замен, вставок и удалений, необходимых для преобразования K строк к одной. O(NK) суббота, 6 октября 12 г.
  • 49. Множественное выравнивание Число замен, вставок и удалений, необходимых для преобразования K строк к одной. O(2KNK) суббота, 6 октября 12 г.
  • 50. ClustalW O(K2N2) суббота, 6 октября 12 г.
  • 51. Аффинная модель Удаление X букв подряд вероятнее, чем удаление X букв по отдельности. суббота, 6 октября 12 г.
  • 52. Аффинная модель Удаление X букв подряд вероятнее, чем удаление X букв по отдельности. суббота, 6 октября 12 г.
  • 53. Аффинная модель Удаление X букв подряд вероятнее, чем удаление X букв по отдельности. GAP(X) = GAP_OPENING + X * GAP_EXTENSION суббота, 6 октября 12 г.
  • 55. Аффинная модель O(N3) суббота, 6 октября 12 г.
  • 56. Аффинная модель O(N3) Быстрее? суббота, 6 октября 12 г.
  • 58. Аффинная модель O(N2) суббота, 6 октября 12 г.
  • 59. Геномные перестройки Крупные мутации: реверсии транслокации слияния расщепления суббота, 6 октября 12 г.
  • 60. Геномные перестройки суббота, 6 октября 12 г.
  • 61. Геномные перестройки суббота, 6 октября 12 г.
  • 62. Что мы узнали • Редакционное расстояние • Глобальное и локальное выравнивание • Аффинная модель вставки • Всё за O(N ) 2 • Множественное выравнивание • Геномные перестройки суббота, 6 октября 12 г.
  • 63. Домашнее задание http://rosalind.info • EDIT • EDTA • GLOB • LOCA • MULT http://rosalind.info/classes/enroll/ 171da3d314a0b07e00883287cd2b6ddeeeba225b/ суббота, 6 октября 12 г.