Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~lelik/doc/distans.htm
Дата изменения: Fri Feb 24 12:32:28 2006
Дата индексирования: Tue Oct 2 06:41:04 2012
Кодировка: Windows-1251
ОПРЕДЕЛЕНИЕ ЭВОЛЮЦИОННОГО РАССТОЯНИЯ МЕЖДУ НУКЛЕОТИДНЫМИ ПОСЛЕДОВАТЕЛЬНОСТЯМИ

Определение эволюционного расстояния между нуклеотидными последовательностями.

Истинные расстояния в моей модели: число точечных замен на 100 нуклеотидов

 

AB

BA

ABC

DBC

DBF

DBA

CB

BC

DA

DB

FBB

AB

0

50

10

50

135

155

50

50

225

225

225

BA

 

0

60

100

185

205

100

100

275

275

275

ABC

 

 

0

60

145

165

40

40

235

235

235

DBC

 

 

 

0

85

105

100

100

175

175

175

DBF

 

 

 

 

0

20

185

185

90

90

90

DBA

 

 

 

 

 

0

205

205

70

70

110

CB

 

 

 

 

 

 

0

80

275

275

275

BC

 

 

 

 

 

 

 

0

275

275

275

DA

 

 

 

 

 

 

 

 

0

140

110

DB

 

 

 

 

 

 

 

 

 

0

180

FBB

 

 

 

 

 

 

 

 

 

 

0

Матрица попарного сходства: среднее число совпадающих нуклеотидов на 100 позиций

 

AB

BA

ABC

DBC

DBF

DBA

CB

BC

DA

DB

FBB

AB

0.00

44.33

31.09

27.66

32.74

37.71

43.14

44.92

51.54

51.18

54.61

BA

 

0.00

34.28

28.96

33.69

37.12

44.68

46.10

50.12

51.89

54.96

ABC

 

 

0.00

7.21

14.30

20.09

28.84

32.98

40.90

41.13

45.39

DBC

 

 

 

0.00

7.57

14.07

24.35

27.19

37.83

37.00

42.43

DBF

 

 

 

 

0.00

19.86

29.31

31.91

41.25

39.60

45.39

DBA

 

 

 

 

 

0.00

33.69

36.64

44.92

44.21

48.23

CB

 

 

 

 

 

 

0.00

42.55

49.17

49.88

55.44

BC

 

 

 

 

 

 

 

0.00

50.24

50.95

54.14

DA

 

 

 

 

 

 

 

 

0.00

56.15

62.17

DB

 

 

 

 

 

 

 

 

 

0.00

56.03

FBB

 

 

 

 

 

 

 

 

 

 

0.00

Матрица попарных расстояний, вычисленных по методу Джукса - Кантора

 

AB

BA

ABC

DBC

DBF

DBA

CB

BC

DA

DB

FBB

AB

0.00

67.06

40.15

34.51

43.03

52.40

64.22

68.52

87.15

86.03

97.68

BA

 

0.00

45.81

36.60

44.73

51.22

67.93

71.52

82.75

88.30

99.00

ABC

 

 

0.00

7.58

15.87

23.39

36.41

43.45

59.11

59.63

69.70

DBC

 

 

 

0.00

7.97

15.58

29.44

33.76

52.64

50.99

62.57

DBF

 

 

 

 

0.00

23.07

37.18

41.57

59.89

56.30

69.70

DBA

 

 

 

 

 

0.00

44.73

50.29

68.52

66.77

77.26

CB

 

 

 

 

 

 

0.00

62.84

79.95

82.04

100.79

BC

 

 

 

 

 

 

 

0.00

83.11

85.29

95.96

DA

 

 

 

 

 

 

 

 

0.00

103.56

132.46

DB

 

 

 

 

 

 

 

 

 

0.00

103.09

FBB

 

 

 

 

 

 

 

 

 

 

0.00

 

Для того, чтобы определить наиболее подходящий метод для построения дерева было произведено сравнение данных таблиц( для этого была построена точечная диаграмма, а также график зависимости 2-х оценок расстояния от величины 'истинного' расстояния:

 

На данной диаграмме представлена зависимость расстояния между последовательностями от заданной пары последовательностей. Наибольший разброс значений расстояний получается при использовании метода Джукса-Кантора. Небольшой разброс значений, полученных методом попарного сходства объясняется тем, что в этом случае считается среднее количество замен на 100 нуклеотидов. Максимальные значения для отдельных точек соответствуют истинным расстояниям, однако в четырех последовательностях эти значения соответствуют методу Джукса-Кантора. Это можно объяснить тем, что расчет истинного расстояния основывается только на количестве прямых замен.

 

Этот график отображает зависимость расстояний между последовательностями, построенных различными методами, от истинного расстояния между ними. У далеких последовательностей значения процента идентичности, рассчитанные по методу Джукса-Кантора и подсчету среднего числа замен отличаются сильнее, чему близких последовательностей.

Выводы

Метод Джукса-Кантора больше подходит к нашей модели эволюции, так как в нашей модели эволюции предполагались так называемые обратные замены(существуют пары, в которых процент мутаций по отношению к длине последовательности более 100%).