Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~kozyavka/doc/otchet.doc
Дата изменения: Mon Dec 27 17:40:03 2004
Дата индексирования: Tue Oct 2 07:22:56 2012
Кодировка: koi8-r

Поисковые слова: п п п п п п

Анализ нуклеотидного выравнивания



I. Сравнение аминокислотного и нуклеотидного выравниваний.

Получены аминокислотные последовательности "исходного белка" P09371 из
Escherichia coli и его ортолога Q8ZEL9 из генома бактерии Yersinia pestis в
банке данных UniProt, а также нуклеотидные последовательности
соответствующих генов из банка данных EMBL.


А.П. - аминокислотные последовательности
Н.П. - нуклеотидные последовательности



|Организм |AC А.П.|AC Н.П. |Start |End |
|Escherichia coli |P09371 |x08087 |168 |877 |
|Yersinia pestis |Q8ZEL9 |AE013821 |4904 |5623 |


Построены глобальные выравнивания аминокислотных и нуклеотидных
последовательностей с помощью программы needle пакета программ EMBOSS:


Выравнивание аминокислотных последовательностей:

Matrix: EBLOSUM62
Length: 239
Identity: 194/239 (81.2%)
Similarity: 212/239 (88.7%)
Gaps: 0/239 ( 0.0%)
Score: 1018.0

1 MVIKAQSPAGFAEEYIIESIWNNRFPPGTILPAERELSELIGVTRTTLRE 50
||||||||||||||||||||||||||||:|||||||||||||||||||||
1 MVIKAQSPAGFAEEYIIESIWNNRFPPGSILPAERELSELIGVTRTTLRE
50

51 VLQRLARDGWLTIQHGKPTKVNNFWETSGLNILETLARLDHESVPQLIDN
100
|||||||||||||||||||||||||||||||||||||||||:||||||||
51 VLQRLARDGWLTIQHGKPTKVNNFWETSGLNILETLARLDHDSVPQLIDN
100

101 LLSVRTNISTIFIRTAFRQHPDKAQEVLATANEVADHADAFAELDYNIFR
150
||:|||||:|||:|||.|.||:||||:||.|..|.|:|:||..|||.|||
101 LLAVRTNIATIFVRTAIRHHPEKAQEILARAKTVDDNAEAFTALDYGIFR
150

151 GLAFASGNPIYGLILNGMKGLYTRIGRHYFANPEARSLALGFYHKLSALC
200
|||||||||||||||||:||||||:||:||:|||||.|||.||:|||.||
151 GLAFASGNPIYGLILNGLKGLYTRVGRYYFSNPEARKLALTFYNKLSTLC
200

201 SEGAHDQVYETVRRYGHESGEIWHRMQKNLPGDLAIQGR 239
...::|||.|.:|.||.|||.|||.||..:|.|||...|
201 DTESYDQVLECLRTYGKESGAIWHSMQGTMPSDLAEARR 239



Выравнивание нуклеотидных последовательностей:

Matrix: EDNAFULL
Length: 728
Identity: 533/728 (73.2%)
Similarity: 533/728 (73.2%)
Gaps: 16/728 ( 2.2%)
Score: 1861.0



1 atggtcattaaggcgcaaagcccggcgggtttcgcggaagagtacattat
50
|||||.||.|||||||||||.||.||.|||||||||||||||||.|||||
1 atggttataaaggcgcaaagtcctgccggtttcgcggaagagtatattat
50

51 tgaaagtatctggaataaccgcttccctcccgggactattttgcccgcag
100
|||||||||.||||||||.|||||.|||||.||..|||||||||||||.|
51 tgaaagtatttggaataatcgctttcctccaggatctattttgcccgcgg
100

101 aacgtgaactttcagaattaattggcgtaacgcgtactacgttacgtgaa
150
|.|||||||||||.||..|.|||||.||.||.||.||.||.||.||.|||
101 agcgtgaactttctgagctgattggtgtgactcgcacaacattgcgcgaa
150

151 gtgttacagcgtctggcacgagatggctggttgaccattcaacatggcaa
200
||..||||.||.||.||.||.|||||||||.|.||.|||||.||.||.||
151 gtactacaacggctagcccgcgatggctggctcactattcagcacggtaa
200

201 gccgacgaaggtgaataatttctgggaaacttccggtttaaatatccttg
250
|||.|||||.||.||.|||||.|||||.||.||.|||.|||||||..|.|
201 gccaacgaaagtaaacaatttttgggagacatctggtctaaatattttgg
250

251 aaacactggcgcgactggatcacgaaagtgtgccgcagcttattgataat
300
|||||||||||||.||.||.||.||.||.||.||.||..|.||.|||||.
251 aaacactggcgcggcttgaccatgacagcgttccacaattgatagataac
300

301 ttgctgtcggtgcgtaccaatatttccactatttttattcgcaccgcgtt
350
||.|||.|.||.||.|||||||||.|||||||||||.|.||.||.||..|
301 ttactggctgttcgaaccaatattgccactatttttgtgcggacagctat
350

351 tcgtcagcatcccgataaagcgcaggaagtgctggctaccgctaatgaag
400
.|||||.|||||.||.||||||||.|||.|..||||....||.||...||
351 ccgtcatcatccagaaaaagcgcaagaaattttggcgcgagcgaaaacag
400

401 tggccgatcacgccgatgcctttgccgagctggattacaacatattccgc
450
|||..|||.||||.||.||||||.|.|..||.|||||....||.|||||.
401 tggatgataacgcagaagcctttactgctcttgattatggtattttccgt
450

451 ggcctggcgtttgcttccggcaacccgatttacggtctgattcttaacgg
500
||..||||.|||||.||.|||||.||||||||.|||.|||||||||||||
451 ggtttggcatttgcctcaggcaatccgatttatggtttgattcttaacgg
500

501 gatgaaagggctgtatacgcgtattggtcgtcactatttcgccaatccgg
550
..||||||||||.||.||.||..|.||.|||.|.||.||..|.|||||.|
501 tttgaaagggctttacacccgagtagggcgttattacttttctaatccag
550

551 aagcgcgcagtctggcgctgggcttctaccacaaactgtcggcgttgtgc
600
|||||||||..|||||.|||...||.|||.|.|||||||||.||||.|
551 aagcgcgcaagctggcactgactttttacaataaactgtcgacgttat--
598

601 agtga---aggcgcgcacgatcaggtgtacgaaacagtgcgt-cgc---t
643
|||| ||...|..|.|||||| |||| .|.|||||.| ||| |
599 -gtgatacagaatcttatgatcag--gtac--tagagtgcctgcgcacat
643

644 atgggcatgagagtggcgagatttggcaccggatgcagaaaaatctgccg
693
|.||..|.|||||.||.|..||.|||||..|.||||||...|...||||.
644 acggcaaagagagcggggctatctggcatagcatgcagggcaccatgcca
693

694 ggtgatttagcc-attcaggggcgataa 720
.|||||||.||| |..| |.|.||.||.
694 agtgatttggccgaagc-gcgtcgttag 720

Идентичность А.П.: 81.2%
Идентичность Н.П.: 73.2%


Значение идентичности для выравнивания Н.П. меньше, чем для выравнивания
А.П. из-за того, что синонимичные замены в нуклеотидных последовательностях
(влияющие на величину идентичности Н.П.) не влияют на соответствующие
аминокислотные последовательности и, естественно, на их идентичность.




II. Расстояние между нуклеотидными последовательностями


Вычислено расстояние между нуклеотидными последовательностями. В качестве
меры расстояния использованы:

Частота замен

f = N/L = 1 - identity = 1 - 0.732 = 0.268 = 26.8%

f - частота замен,
N - число замен,
L - длина выравнивания,
Identity - значение идентичности выравнивания последовательностей.


Расстояние, вычисленное по формуле Джукса - Кантора

d = -0.75 * ln (1 - (4/3) * f) = -0.75 * ln (1 - (4/3) * 0.268) —
0.332 — 33,2%


d - расстояние между последовательностями,
f - частота замен.

Различия в значениях расстояния и частоты замен происходят из-за того, что
формула Джукса - Кантора учитывает возможность повторных замен в уже
мутировавших позициях, а относительно большие цифры означают, что белок не
подвергается жесткому давлению отбора, то есть его структура, видимо, не
является критичной для жизнедеятельности организма.




III. Анализ участка нуклеотидного выравнивания


Вычисление количества синонимичных и несинонимичных сайтов для Н.П.:

812 (644) atg ggc atg aga gtg gcg aga ttt ggc acc (674) 842
|.| |.. |.| ||| |.| |.| ..| |.| ||| |..
5548 (644) acg gca aag aga gcg ggg cta tct ggc ata (674) 5578





|atg |ggc |atg |aga |gtg |gcg |aga |ttt |ggc |Acc | |f1 |0 |0 |0 |1 |0 |0
|1 |0 |0 |0 | |f2 |0 |0 |0 |0 |0 |0 |0 |0 |0 |0 | |f3 |0 |1/3 |0 |1/3 |1/3
|1/3 |1/3 |1 |1/3 |1/3 | |s |0 |1/3 |0 |4/3 |1/3 |1/3 |4/3 |1 |1/3 |1/3 |
|n |3 |8/3 |3 |5/3 |8/3 |8/3 |5/3 |2 |8/3 |8/3 | |
? S1=5,333, N1=24,667
|acg |gca |aag |aga |gcg |ggg |Cta |tct |ggc |ata | |f1 |0 |0 |0 |1 |0
|0 |0 |0 |0 |0 | |f2 |0 |0 |0 |0 |0 |0 |0 |0 |0 |0 | |f3 |1/3 |1/3 |1 |1/3
|1/3 |1/3 |1/3 |1/3 |1/3 |2/3 | |s |1/3 |1/3 |1 |4/3 |1/3 |1/3 |1/3 |1/3
|1/3 |2/3 | |n |8/3 |8/3 |2 |5/3 |8/3 |8/3 |8/3 |8/3 |8/3 |7/3 | |?
S2=5,333, N2=23,333

Усредненные значения по обеим последовательностям:

S = (S1 + S2)/2 = 5,333
N = (N1 + N2)/2 = 24


Вычисление количества синонимичных и несинонимичных нуклеотидных отличий
между парой последовательностей:

Sd = Sd1 + Sd2 + . + Sd10 = 2.5
Nd = Nd1 + Nd2 + . + Nd10 = 8.5


Вычисление частот синонимичных (pS) и несинонимичных (pN) отличий:

Ps = Sd/S = 2/(13,5) = 0.469
Pn = Nd/N = 5/(49,5) = 0.354

Вычисление количества синонимичных (Ks) и несинонимичных (Ka) замен:

Ks = - ѕ * ln(1 - 4/3Ps) = 0.736
Ka = - ѕ * ln(1 - 4/3Pn) = 0.479


Выводы:
Анализ нуклеотидной последовательности показал, что значения Ks и Ka
достаточно велики и близки к единице, что свидетельствует о том, что
последовательность является некадирующей, тоесть рамка считывания
исследуемого участка не совпадает с исходной рамкой считывания гена.