Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~wave/files/analysis.doc
Дата изменения: Tue Nov 30 03:17:31 2004
Дата индексирования: Tue Oct 2 07:22:34 2012
Кодировка: koi8-r

Поисковые слова: п п п п

Анализ нуклеотидного выравнивания



I. Сравнение аминокислотного и нуклеотидного выравниваний.

Получены аминокислотные последовательности "исходного белка" P06611 из
Escherichia coli и его ортолога P63351 из генома бактерии Salmonella
typhimurium в банке данных UniProt, а также нуклеотидные последовательности
соответствующих генов из банка данных EMBL.


А.П. - аминокислотные последовательности
Н.П. - нуклеотидные последовательности



|Организм |AC А.П.|AC Н.П. |Start |End |
|Escherichia coli |P06611 |M14031 |1750 |2499 |
|Salmonella typhimurium |P63351 |AE008758 |11755 |12504 |


Построены глобальные выравнивания аминокислотных и нуклеотидных
последовательностей с помощью программы needle пакета программ EMBOSS:


Выравнивание аминокислотных последовательностей:

Matrix: EBLOSUM62
Length: 249
Identity: 200/249 (80.3%)
Similarity: 217/249 (87.1%)
Gaps: 0/249 ( 0.0%)
Score: 1029.0

1 MSIVMQLQDVAESTRLGPLSGEVRAGEILHLVGPNGAGKSTLLARMAGMT
50
||.:|||:|||||||||||||||.||||||||||||||||||||||||:|
1 MSQLMQLKDVAESTRLGPLSGEVSAGEILHLVGPNGAGKSTLLARMAGLT
50

51 SGKGSIQFAGQPLEAWSATKLALHRAYLSQQQTPPFATPVWHYLTLHQHD
100
||:|||:|.|.|||||:...||.|||||:|||.||||.||||||||||.|
51 SGEGSIRFGGAPLEAWATATLAQHRAYLAQQQNPPFAMPVWHYLTLHQPD
100

101 KTRTELLNDVAGALALDDKLGRSTNQLSGGEWQRVRLAAVVLQITPQANP
150
||||..||:||..|.|.||||||.||||||||||||||||||||.|.|||
101 KTRTGQLNEVADMLGLGDKLGRSVNQLSGGEWQRVRLAAVVLQIHPDANP
150

151 AGQLLLLDEPMNSLDVAQQSALDKILSALCQQGLAIVMSSHDLNHTLRHA
200
.||||||||||||||||||:|||::|..|||.|:||||||||||||||||
151 VGQLLLLDEPMNSLDVAQQNALDRVLHHLCQAGIAIVMSSHDLNHTLRHA
200

201 HRAWLLKGGKMLASGRREEVLTPPNLAQAYGMNFRRLDIEGHRMLISTI
249
|:|||||.||::|.|||||||||..||||||:.|||||:|||.||||..
201 HKAWLLKRGKLIACGRREEVLTPSYLAQAYGLRFRRLDVEGHPMLISAT
249



Выравнивание нуклеотидных последовательностей:

Matrix: EDNAFULL
Length: 774
Identity: 558/774 (72.1%)
Similarity: 558/774 (72.1%)
Gaps: 48/774 ( 6.2%)
Score: 1933.0

1 atgtct--attgtgatgcagttacaagatgttgcgga-atctacccgcct
47
|||||| || |||||||.|||.|.|||||.||.|| |.| ||||||||
1 atgtctcaat--tgatgcaattaaaggatgtcgccgagagc-acccgcct
47

48 ggggccgctttctggcgaggttcgggctggggagatcctgcacctggtgg
97
||||||||||||.|||||.||..|.||.||.||||||||.||.||.||.|
48 ggggccgctttccggcgaagtaagcgcaggagagatccttcatcttgtcg
97

98 ggccgaatggcgcgggtaagagtaccttactggcgcgaatggccggaatg
147
|||||||.||.||.||.||.||.||..||||||||||.|||||.||..|.
98 ggccgaacggtgccgggaaaagcacgctactggcgcgtatggcggggtta
147

148 accagcggtaagggaagcattcag--ttcgcggggcaaccactggaagca
195
|||..|||..||||.|||| |||| ||.||||.|| .||.|||||.|||
148 acctccggcgaggggagca-tcaggtttggcggagc-gccgctggaggca
195

196 tggtccgcaacaaaactcgcgctgcatcgcgcctatctttcacaacagca
245
|||.|..|..|||..||.||.|..||.|||||.||||||.|.||||||||
196 tgggcgacggcaacgcttgcccaacaccgcgcttatcttgcgcaacagca
245

246 gacgccgccgtttgcaacgccggtctggcactacctgacactgcatcagc
295
.|..||||||||.||.|.||||||||||||.|||||||||.|||||||.|
246 aaatccgccgttcgccatgccggtctggcattacctgacattgcatcaac
295

296 acgataaaacgcgtaccgaactactgaatgatgtcgcaggggcgct-ggc
344
..|||||||||||.||||..|..||.||.||.|| ||.||.| .||
296 ctgataaaacgcgaaccgggcagcttaacgaggt-----ggccgatatgc
340

345 tcttgat-----gacaaactcggacgtagcaccaatcaactttccggcgg
389
| |.||| ||||||||.||.||.|||...|||||.||||||||.||
341 t-tggattgggcgacaaactggggcgaagcgtgaatcagctttccggtgg
389

390 tgaatggcaacgcgtacgtcttgctgcggtggtgttgcaaa-tca-cacc
437
.||.|||||.||.||.||.||||||||.||.||..|.|||| ||| |.|.
390 cgagtggcagcgtgttcgccttgctgccgttgtactacaaattcatcccg
439

438 acaagccaatcccgcaggccaattgctgcttcttgatgagccgatgaaca
487
|| ||.|||||.|..||.|||||..||||.|||||||||||||||||||
440 ac--gctaatccggtcggtcaattattgctgcttgatgagccgatgaaca
487

488 gtcttgatgttgcgcaacaaagtgc----------gttagacaaaattct
527
||||.||||||||||||||||..|| ||...|||..|||
488 gtctcgatgttgcgcaacaaaacgctctggatcgggtattacatcatt--
535

528 gagcgcgctgtgtcagcaaggactggcgattgtgatgagcagtcacgatc
577
|.||||||..||||.|.||||||||||||||.||.|||||||
536 --------tatgtcaggcaggaattgcgattgtgatgagtagccacgatc
577

578 tcaaccacacattgcgtcatgcgcatcgggcgtggttgctaaaaggtgga
627
|.||||||||..||||.|||||||||...||.|||||.|||||..|.||.
578 tgaaccacacgctgcgccatgcgcataaagcctggttactaaagcgcggt
627

628 aaaatgctggccagtggacgcagggaagaggtgctcacgccgccaaatct
677
|||.|..|.|||.|.||.|||.||||||||||||||||.||..|..||||
628 aaactcattgcctgcggccgccgggaagaggtgctcaccccctcttatct
677

678 ggcgcaggcctatgggatgaattttcgccgtctggatatcgaaggtcaca
727
||||||.|||||.||..||...|||||.||.||.||..||||.||.||..
678 ggcgcaagcctacggtttgcgctttcgacgactcgacgtcgaggggcatc
727

728 gaatgctgatttcgaccatctga 750
.||||||.||||||.||| ||.|
728 caatgctcatttcggcca-cttaa 750



Идентичность А.П.: 80.3%
Идентичность Н.П.: 72.1%


Значение идентичности для выравнивания Н.П. меньше, чем для выравнивания
А.П. из-за того, что синонимичные замены в нуклеотидных последовательностях
(влияющие на величину идентичности Н.П.) не влияют на соответствующие
аминокислотные последовательности и, естественно, на их идентичность.




II. Расстояние между нуклеотидными последовательностями


Вычислено расстояние между нуклеотидными последовательностями. В качестве
меры расстояния использованы:

Частота замен

f = N/L = 1 - identity = 1 - 0.721 = 0.271 = 27.9%

f - частота замен,
N - число замен,
L - длина выравнивания,
Identity - значение идентичности выравнивания последовательностей.


Расстояние, вычисленное по формуле Джукса - Кантора

d = -0.75 * ln (1 - (4/3) * f) = -0.75 * ln (1 - (4/3) * 0.279) —
0.349 — 34,9%


d - расстояние между последовательностями,
f - частота замен.

Различия в значениях расстояния и частоты замен происходят из-за того, что
формула Джукса - Кантора учитывает возможность повторных замен в уже
мутировавших позициях, а относительно большие цифры означают, что белок не
подвергается жесткому давлению отбора, то есть его структура, видимо, не
является критичной для жизнедеятельности организма.




III. Анализ участка нуклеотидного выравнивания


Вычисление количества синонимичных и несинонимичных сайтов для Н.П.:

2200 (450) сgc agg cca att gct gct tct tga tga gcc (480) 2230
.|. .|| .|| ||| ..| ||| .|| ||| ||| |||
12205 (450) ggt cgg tca att att gct gct tga tga gcc (480) 12235


|сgc |agg |cca |att |gct |gct |tct |tga |tga |gcc | |f1 |0 |0 |0 |0 |0 |0
|0 |0 |0 |0 | |f2 |0 |1/3 |0 |0 |0 |0 |0 |1/3 |1/3 |0 | |f3 |1 |1/3 |1 |2/3
|1 |1 |1 |0 |0 |1 | |s |1 |2/3 |1 |2/3 |1 |1 |1 |1/3 |1/3 |1 | |n |2 |7/3
|2 |7/3 |2 |2 |2 |8/3 |8/3 |2 | |
? S1=8, N1=22
|ggt |cgg |tca |att |att |gct |gct |tga |tga |gcc | |f1 |0 |1/3 |0
|0 |0 |0 |0 |0 |0 |0 | |f2 |0 |0 |0 |0 |0 |0 |0 |1/3 |1/3 |0 | |f3 |1 |1 |1
|2/3 |2/3 |1 |1 |0 |0 |1 | |s |1 |4/3 |1 |2/3 |2/3 |1 |1 |1/3 |1/3 |1 | |n
|2 |5/3 |2 |7/3 |7/3 |2 |2 |8/3 |8/3 |2 | |? S2=25/3, N2=65/3

Усредненные значения по обеим последовательностям:

S = (S1 + S2)/2 = 49/6
N = (N1 + N2)/2 = 131/6


Вычисление количества синонимичных и несинонимичных нуклеотидных отличий
между парой последовательностей:

2200 (450) сgc agg cca att gct gct tct tga tga gcc (480) 2230
.|. .|| .|| ||| ..| ||| .|| ||| ||| |||
12205 (450) ggt cgg tca att att gct gct tga tga gcc (480) 12235





|1 |2 |3 |4 |5 |6 |7 |8 |9 |10 | |Sd |1 |1 |0 |0 |0 |0 |0 |0 |0 |0 | |Nd
|1 |0 |1 |0 |2 |0 |1 |0 |0 |0 | |Sd1 |1 | | | |0 | | | | | | |Nd1 |1 | | |
|2 | | | | | | |Sd2 |1 | | | |0 | | | | | | |Nd2 |1 | | | |2 | | | | | | |

Sd = Sd1 + Sd2 + . + Sd10 = 2
Nd = Nd1 + Nd2 + . + Nd10 = 5


Вычисление частот синонимичных (pS) и несинонимичных (pN) отличий:

Ps = Sd/S = 2/(49/6) = 0.245
Pn = Nd/N = 5/(131/6) = 0.229

Вычисление количества синонимичных (Ks) и несинонимичных (Ka) замен:

Ks = - ѕ * ln(1 - 4/3Ps) = 0.3
Ka = - ѕ * ln(1 - 4/3Pn) = 0.27


Выводы:
После анализа нуклеотидных последовательностей видно, что значение Ks
примерно равно значению Ka, причем оба значения достаточно велики. Это
свидетельствует как об относительно сильной вариабельности данного участка
Н.П., так и о мягком отрицательном отборе, которому подвергался белок в
ходе эволюции: в процессе отбора с одинаковыми вероятностями закреплялись
как синонимические, так и несинонимические мутации.