Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~lelik/doc/distans.htm
Дата изменения: Fri Feb 24 12:32:28 2006 Дата индексирования: Tue Oct 2 06:41:04 2012 Кодировка: Windows-1251 |
Определение
эволюционного расстояния между нуклеотидными последовательностями.
Истинные расстояния в моей модели: число
точечных замен на 100 нуклеотидов
AB | BA | ABC | DBC | DBF | DBA | CB | BC | DA | DB | FBB | |
AB | 0 | 50 | 10 | 50 | 135 | 155 | 50 | 50 | 225 | 225 | 225 |
BA | 0 | 60 | 100 | 185 | 205 | 100 | 100 | 275 | 275 | 275 | |
ABC | 0 | 60 | 145 | 165 | 40 | 40 | 235 | 235 | 235 | ||
DBC | 0 | 85 | 105 | 100 | 100 | 175 | 175 | 175 | |||
DBF | 0 | 20 | 185 | 185 | 90 | 90 | 90 | ||||
DBA | 0 | 205 | 205 | 70 | 70 | 110 | |||||
CB | 0 | 80 | 275 | 275 | 275 | ||||||
BC | 0 | 275 | 275 | 275 | |||||||
DA | 0 | 140 | 110 | ||||||||
DB | 0 | 180 | |||||||||
FBB | 0 |
Матрица
попарного сходства: среднее число совпадающих
нуклеотидов на 100 позиций
AB | BA | ABC | DBC | DBF | DBA | CB | BC | DA | DB | FBB | |
AB | 0.00 | 44.33 | 31.09 | 27.66 | 32.74 | 37.71 | 43.14 | 44.92 | 51.54 | 51.18 | 54.61 |
BA | 0.00 | 34.28 | 28.96 | 33.69 | 37.12 | 44.68 | 46.10 | 50.12 | 51.89 | 54.96 | |
ABC | 0.00 | 7.21 | 14.30 | 20.09 | 28.84 | 32.98 | 40.90 | 41.13 | 45.39 | ||
DBC | 0.00 | 7.57 | 14.07 | 24.35 | 27.19 | 37.83 | 37.00 | 42.43 | |||
DBF | 0.00 | 19.86 | 29.31 | 31.91 | 41.25 | 39.60 | 45.39 | ||||
DBA | 0.00 | 33.69 | 36.64 | 44.92 | 44.21 | 48.23 | |||||
CB | 0.00 | 42.55 | 49.17 | 49.88 | 55.44 | ||||||
BC | 0.00 | 50.24 | 50.95 | 54.14 | |||||||
DA | 0.00 | 56.15 | 62.17 | ||||||||
DB | 0.00 | 56.03 | |||||||||
FBB | 0.00 |
Матрица
попарных расстояний, вычисленных по методу Джукса - Кантора
AB | BA | ABC | DBC | DBF | DBA | CB | BC | DA | DB | FBB | |
AB | 0.00 | 67.06 | 40.15 | 34.51 | 43.03 | 52.40 | 64.22 | 68.52 | 87.15 | 86.03 | 97.68 |
BA | 0.00 | 45.81 | 36.60 | 44.73 | 51.22 | 67.93 | 71.52 | 82.75 | 88.30 | 99.00 | |
ABC | 0.00 | 7.58 | 15.87 | 23.39 | 36.41 | 43.45 | 59.11 | 59.63 | 69.70 | ||
DBC | 0.00 | 7.97 | 15.58 | 29.44 | 33.76 | 52.64 | 50.99 | 62.57 | |||
DBF | 0.00 | 23.07 | 37.18 | 41.57 | 59.89 | 56.30 | 69.70 | ||||
DBA | 0.00 | 44.73 | 50.29 | 68.52 | 66.77 | 77.26 | |||||
CB | 0.00 | 62.84 | 79.95 | 82.04 | 100.79 | ||||||
BC | 0.00 | 83.11 | 85.29 | 95.96 | |||||||
DA | 0.00 | 103.56 | 132.46 | ||||||||
DB | 0.00 | 103.09 | |||||||||
FBB | 0.00 |
Для того, чтобы определить наиболее подходящий метод
для построения дерева было произведено сравнение данных таблиц(
для этого была построена точечная диаграмма, а также график зависимости 2-х
оценок расстояния от величины
'истинного' расстояния:
На данной диаграмме представлена зависимость
расстояния между последовательностями от заданной пары последовательностей.
Наибольший разброс значений расстояний получается при использовании метода
Джукса-Кантора. Небольшой разброс значений, полученных
методом попарного сходства объясняется тем, что в этом случае считается
среднее количество замен на 100 нуклеотидов. Максимальные значения для
отдельных точек соответствуют истинным расстояниям, однако в четырех
последовательностях эти значения соответствуют методу Джукса-Кантора. Это можно
объяснить тем, что расчет истинного расстояния основывается только на
количестве прямых замен.
Этот график отображает зависимость расстояний между
последовательностями, построенных различными методами, от истинного расстояния
между ними. У далеких последовательностей значения процента идентичности,
рассчитанные по методу Джукса-Кантора и подсчету
среднего числа замен отличаются сильнее, чему близких
последовательностей.
Выводы
Метод Джукса-Кантора больше
подходит к нашей модели эволюции, так как в нашей модели эволюции предполагались так
называемые обратные замены(существуют пары, в которых
процент мутаций по отношению к длине последовательности более 100%).