4. Домашнее задание
http://rosalind.info
• DNA
• RNA
• REVC
• PROT
• HAMM
http://rosalind.info/classes/enroll/
171da3d314a0b07e00883287cd2b6ddeeeba225b/
суббота, 6 октября 12 г.
5. Подстроки
Строка == Последовательность
НО
Подстрока != Подпоследовательность
суббота, 6 октября 12 г.
6. Расстояние Хэмминга
Число замен,
необходимых для преобразования первой
строки во вторую.
CCAGAGAC
CCAAGGCT
суббота, 6 октября 12 г.
7. Редакционное
расстояние
Число замен, вставок и удалений,
необходимых для преобразования первой
строки во вторую.
CCAGAGAC-
CCA-AGGCT
(выравнивание)
суббота, 6 октября 12 г.
8. Динамика
C C A G A G A C
C
C
A
A
G
G
C
T
суббота, 6 октября 12 г.
9. Динамика
C C A G A G A C
C
C
A
A
G
G
C
T ?
суббота, 6 октября 12 г.
10. Динамика
C C A G A G A C
0
C
C
A
A
G
G
C
T ?
суббота, 6 октября 12 г.
11. Динамика
C C A G A G A C
0 1 2 3 4 5 6 7 8
C 1
C 2
A 3
A 4
G 5
G 6
C 7
T 8 ?
суббота, 6 октября 12 г.
12. Динамика
C C A G A G A C
0 1 2 3 4 5 6 7 8
C 1 ?
C 2
A 3
A 4
G 5
G 6
C 7
T 8 ?
суббота, 6 октября 12 г.
13. Динамика
C C A G A G A C
0 1 2 3 4 5 6 7 8
C 1 0
C 2 ?
A 3
A 4
G 5
G 6
C 7
T 8 ?
суббота, 6 октября 12 г.
14. Динамика
C C A G A G A C
0 1 2 3 4 5 6 7 8
C 1 0
C 2 1
A 3 ?
A 4
G 5
G 6
C 7
T 8 ?
суббота, 6 октября 12 г.
15. Динамика
C C A G A G A C
0 1 2 3 4 5 6 7 8
C 1 0
C 2 1
A 3 ?
A 4
G 5
G 6
C 7
T 8 ?
d[i-1][j] + 1
d[i][j] = MIN d[i][j-1] + 1
d[i-1][j-1] + (s1[i] != s2[j])
суббота, 6 октября 12 г.
16. Динамика
C C A G A G A C
0 1 2 3 4 5 6 7 8
C 1 0 1 2 3 4 5 6 7
C 2 1 0 1 2 3 4 5 6
A 3 2 1 0 1 2 3 4 5
A 4 3 2 1 1 1 2 3 4
G 5 4 3 2 1 2 1 2 3
G 6 5 4 3 2 2 2 2 3
C 7 6 5 4 3 3 3 3 2
T 8 7 6 5 4 4 4 4 3
d[i-1][j] + 1
d[i][j] = MIN d[i][j-1] + 1
d[i-1][j-1] + (s1[i] != s2[j])
суббота, 6 октября 12 г.
17. Динамика
C C A G A G A C
0 1 2 3 4 5 6 7 8
C 1 0 1 2 3 4 5 6 7
C 2 1 0 1 2 3 4 5 6
A 3 2 1 0 1 2 3 4 5
A 4 3 2 1 1 1 2 3 4
G 5 4 3 2 1 2 1 2 3
G 6 5 4 3 2 2 2 2 3
C 7 6 5 4 3 3 3 3 2
T 8 7 6 5 4 4 4 4 3
d[i-1][j] + 1
d[i][j] = MIN d[i][j-1] + 1
d[i-1][j-1] + (s1[i] != s2[j])
суббота, 6 октября 12 г.
18. Динамика
C C A G A G A C
0 1 2 3 4 5 6 7 8
C 1 0 1 2 3 4 5 6 7
C 2 1 0 1 2 3 4 5 6
A 3 2 1 0 1 2 3 4 5
A 4 3 2 1 1 1 2 3 4
G 5 4 3 2 1 2 1 2 3
G 6 5 4 3 2 2 2 2 3
C 7 6 5 4 3 3 3 3 2
T 8 7 6 5 4 4 4 4 3
CCAGAGAC-
CCA-AGGCT
суббота, 6 октября 12 г.
19. Динамика
A B R A C
A
D
A
B
R
A
суббота, 6 октября 12 г.
20. Динамика
A B R A C
A
D
A
B
R
A
-ABRACA
DABR--A
суббота, 6 октября 12 г.
21. Редакционное
расстояние
Память: O( ? )
Время: O( ? )
суббота, 6 октября 12 г.
22. Редакционное
расстояние
Память: O(N2)
Время: O(N2)
суббота, 6 октября 12 г.
23. Редакционное
расстояние
Если нам нужно только расстояние, но не
выравнивание, можно ли использовать
меньше памяти?
C C A G A G A C
0 1 2 3 4 5 6 7 8
C 1 0 1 2 3 4 5 6 7
C 2 1 0 1 2 3 4 5 6
A 3 2 1 0 1 2 3 4 5
A 4 3 2 1 1 1 2 3 4
G 5 4 3 2 1 2 1 2 3
G 6 5 4 3 2 2 2 2 3
C 7 6 5 4 3 3 3 3 2
T 8 7 6 5 4 4 4 4 3
суббота, 6 октября 12 г.
24. Редакционное
расстояние
Если нам нужно только расстояние, но не
выравнивание, можно ли использовать
меньше памяти?
C C A G A G A C
0 1 2 3 4 5 6 7 8
C
C
1
2
0
1
1
0
2
1
3
2
4
3
5
4
6
5
7
6
Да.
A 3 2 1 0 1 2 3 4 5 Храним
A
G
4
5
3
4
2
3
1
2
1
1
1
2
2
1
3
2
4
3
только 2
G 6 5 4 3 2 2 2 2 3 колонки.
C 7 6 5 4 3 3 3 3 2
T 8 7 6 5 4 4 4 4 3
суббота, 6 октября 12 г.
25. Оценка
Минимизируем расстояние →
максимизируем оценку (score)
суббота, 6 октября 12 г.
26. Оценка
Минимизируем расстояние →
максимизируем оценку (score)
T C A G T C A G
T 1 0 0 0 T 3 -2 -1 -2
C 0 1 0 0 C -2 3 -2 -1
A 0 0 1 0 A -1 -2 3 -2
G 0 0 0 1 G -2 -1 -2 3
суббота, 6 октября 12 г.
27. Оценка
Минимизируем расстояние →
максимизируем оценку (score)
T C A G T C A G
T 1 0 0 0 T 3 -2 -1 -2
C 0 1 0 0 C -2 3 -2 -1
A 0 0 1 0 A -1 -2 3 -2
G 0 0 0 1 G -2 -1 -2 3
GAP = 0 GAP = -3
суббота, 6 октября 12 г.
28. Оценка
Минимизируем расстояние →
максимизируем оценку (score)
d[i-1][j] + GAP
d[i][j] = MAX d[i][j-1] + GAP
d[i-1][j-1] + SCORE[s1[i]][s2[j]]
суббота, 6 октября 12 г.
30. Локальное
выравнивание
суббота, 6 октября 12 г.
31. Локальное
выравнивание
суббота, 6 октября 12 г.
32. Локальное
выравнивание
суббота, 6 октября 12 г.
33. Локальное
выравнивание
суббота, 6 октября 12 г.
34. Локальное
выравнивание
суббота, 6 октября 12 г.
35. Локальное
выравнивание
суббота, 6 октября 12 г.
36. Локальное
выравнивание
суббота, 6 октября 12 г.
37. Локальное
выравнивание
O(N6)
суббота, 6 октября 12 г.
38. Локальное
выравнивание
O(N6)
O(N4)
суббота, 6 октября 12 г.
39. Локальное
выравнивание
O(N6)
O(N4)
Как быстрее?
суббота, 6 октября 12 г.
40. Локальное
выравнивание
O(N6)
O(N4)
Как быстрее?
суббота, 6 октября 12 г.
41. Локальное
выравнивание
0 ← изменилось тут
d[i-1][j] + GAP
d[i][j] = MAX d[i][j-1] + GAP
d[i-1][j-1] + SCORE[s1[i]][s2[j]]
суббота, 6 октября 12 г.
42. Локальное
выравнивание
O(N6)
O(N4)
Как быстрее?
O(N2)
0 ← изменилось тут
d[i-1][j] + GAP
d[i][j] = MAX d[i][j-1] + GAP
d[i-1][j-1] + SCORE[s1[i]][s2[j]]
суббота, 6 октября 12 г.
43. Локальное
выравнивание
A B R A C A B C D R -
A 3 -2 -2 -2 -1 -3
A B -2 3 -2 -2 -2 -3
D C -2 -2 4 -1 -2 -3
A D -2 -2 -1 4 -2 -3
B R -1 -2 -2 -2 3 -3
R - -3 -3 -3 -3 -3 -3
A
0 ← изменилось тут
d[i-1][j] + GAP
d[i][j] = MAX d[i][j-1] + GAP
d[i-1][j-1] + SCORE[s1[i]][s2[j]]
суббота, 6 октября 12 г.
44. Множественное
выравнивание
Число замен, вставок и удалений,
необходимых для преобразования
K строк к одной.
суббота, 6 октября 12 г.
51. Аффинная модель
Удаление X букв подряд вероятнее, чем
удаление X букв по отдельности.
суббота, 6 октября 12 г.
52. Аффинная модель
Удаление X букв подряд вероятнее, чем
удаление X букв по отдельности.
суббота, 6 октября 12 г.
53. Аффинная модель
Удаление X букв подряд вероятнее, чем
удаление X букв по отдельности.
GAP(X) =
GAP_OPENING +
X * GAP_EXTENSION
суббота, 6 октября 12 г.
62. Что мы узнали
• Редакционное расстояние
• Глобальное и локальное выравнивание
• Аффинная модель вставки
• Всё за O(N )
2
• Множественное выравнивание
• Геномные перестройки
суббота, 6 октября 12 г.
63. Домашнее задание
http://rosalind.info
• EDIT
• EDTA
• GLOB
• LOCA
• MULT
http://rosalind.info/classes/enroll/
171da3d314a0b07e00883287cd2b6ddeeeba225b/
суббота, 6 октября 12 г.