Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~kathrine/doc/ot4et_part2.doc
Дата изменения: Wed Dec 22 18:03:34 2004
Дата индексирования: Tue Oct 2 11:32:20 2012
Кодировка: koi8-r

Отчет студентки Мостовенко Екатерины, 202 группа, ФББ МГУ

Сравнение аминокислотного и нуклеотидного выравниваний
Были получены идентификационные номера всех четырех последовательностей -
это:
P11056 - последовательность белка BFR из ECOLI по БД SwissProt
O68926 - последовательность белка BFR из Salmonella typhimurium по БД
SwissProt
AF059449 - последовательность белка BFR из Salmonella typhimurium по БД
EMBL
ECBFR - последовательность белка BFR из ECOLI по EMBL
При анализе записей в БД EMBL были определены координаты генов, кодирующих
белок BFR
511..987 - для записи с AC ECBFR
534..1010 - для записи с AC AF058449
Были построены глобальные выравнивания аминокислотных и нуклеотидных
последовательностей с помощью программы needle пакета EMBOSS, параметры при
этом были заданы по умолчанию.

Глобальное выравнивание аминокислотных последовательностей:

BFR_ECOLI 1 MKGDTKVINYLNKLLGNELVAINQYFLHARMFKNWGLKRLNDVEYHESID
50
||||.|:||||||||||||||||||||||||||||||.||||||||||||
BFR_SALTY 1 MKGDVKIINYLNKLLGNELVAINQYFLHARMFKNWGLTRLNDVEYHESID
50

BFR_ECOLI 51 EMKHADRYIERILFLEGLPNLQDLGKLNIGEDVEEMLRSDLALELDGAKN
100
||||||:||||||||||:|||||||||.|||||||||||||.|||:|||:
BFR_SALTY 51 EMKHADKYIERILFLEGIPNLQDLGKLGIGEDVEEMLRSDLRLELEGAKD
100

BFR_ECOLI 101 LREAIGYADSVHDYVSRDMMIEILRDEEGHIDWLETELDLIQKMGLQNYL
150
|||||.||||||||||||||||||.||||||||||||||||.|:|:||||
BFR_SALTY 101 LREAIAYADSVHDYVSRDMMIEILADEEGHIDWLETELDLIAKLGMQNYL
150

BFR_ECOLI 151 QAQIREEG 158
|:||:...
BFR_SALTY 151 QSQIKVTD 158

Глобальное выравнивание нуклеотидных последовательностей:
AF058449 1 atgaaaggtgatgttaaaatcataaattatctcaataaactattgggaaa
50
||||||||||||..||||.|.||||||||||||||.|||||.||||||||
ECBFR 1 atgaaaggtgatactaaagttataaattatctcaacaaactgttgggaaa
50


AF058449 51 tgagcttgtcgcaattaatcagtattttcttcatgcccgtatgttcaaaa
100
|||||||||||||||.||||||||.|||||.||||||||.|||||.||||
ECBFR 51 tgagcttgtcgcaatcaatcagtactttctccatgcccgaatgtttaaaa
100


AF058449 101 actgggggctgacccggcttaatgatgttgagtaccatgaatccattgat
150
|||||||.||.|..||.||.||||||||.|||||.|||||||||||||||
ECBFR 101 actggggtctcaaacgtctcaatgatgtggagtatcatgaatccattgat
150


AF058449 151 gagatgaaacacgctgataagtatattgagcgtattttatttctggaagg
200
||||||||||||||.|||...|||||||||||.|||.|.|||||||||||
ECBFR 151 gagatgaaacacgccgatcgttatattgagcgcattctttttctggaagg
200


AF058449 201 cataccgaacctacaggatctgggcaagctgggcatcggtgaagatgtcg
250
..|.||.|||.|||||||.||||||||.|||..|||.|||||||||||.|
ECBFR 201 tcttccaaacttacaggacctgggcaaactgaacattggtgaagatgttg
250


AF058449 251 aagagatgctacgatcggatctccgg--ctcgaactggaaggcgcaaaag
298
|.||.|||||.||.||.||||| || ||.||.|||||.|||||.||..
ECBFR 251 aggaaatgctgcgttctgatct--ggcacttgagctggatggcgcgaaga
298


AF058449 299 atctacgtgaggcaatagcctatgccgatagcgttcatgattatgtcagc
348
||.|.|||||||||||.|..|||||||||||||||||||||||.||||||
ECBFR 299 atttgcgtgaggcaattggttatgccgatagcgttcatgattacgtcagc
348


AF058449 349 cgggatatgatgattgaaattcttgc-cgacgaggaaggccacatcgact
397
||.|||||||||||.|||||| |||| .||.||.||||||||.|||||||
ECBFR 349 cgcgatatgatgatagaaatt-ttgcgtgatgaagaaggccatatcgact
397


AF058449 398 ggctggaaactgagttggatttgattgccaaacttggtatgcaaaattat
447
||||||||||.||..|.|||.|||||...||..|.||..|||||||||||
ECBFR 398 ggctggaaacggaacttgatctgattcagaagatgggcctgcaaaattat
447


AF058449 448 ctgcaatcacaaat-------taaggttaccgattaa 477
||||||.||||.|| .|||||| ||
ECBFR 448 ctgcaagcacagatccgcgaagaaggtt---ga 477

При этом идентичность аминокислотных последовательностей 139/158 (88.0%), а
нуклеотидных - 391/487 (80.3%). Это можно объяснить тем, что каждая
аминокислота кодируется тремя нуклеотидами, при этом она кодируется не
одним вариантом сочетания нуклеотидов. Поэтому возможно такое, что при
замене одного, реже двух нуклеотидов в триплете, нуклеотидная
последовательность изменится, а аминокислотная последовательность - нет
(синонимическая замена), вследствие чего в нуклеотидной последовательности
замен может быть больше, а в аминокислотной, в свою очередь, идентичность
может сохраниться. В нуклеотидном выравнивании существуют блоки, в которых
последовательности очень идентичны, что вполне объективно, поскольку
аминокислотное выравнивание имеет высокоидентичные блоки. Единственно,
вызывают подозрение участки гэпов, не кратные трем, в нуклеотидной
последовательности, поскольку в гомологичность, следующих за ними
нуклеотиды трудно поверить.

Расстояние между нуклеотидными последовательностями

Для определения расстояния между последовательностями (без гэпов) были
посчитаны:
частота замен, равная 93/487=0,19
расстояние по формуле Джукса-Кантора, равная 0,216
Полученные значения отличаются друг от друга, т.к. при подсчете частоты
замен мы считаем сколько есть замен по отношению ко всей длине
последовательности, а при подсчете расстояния по формуле Джукса-Кантора мы
учитываем то, что возможны обратные замены в процессе эволюции, поэтому
расстояние по формуле Джукса-Кантора больше, чем значение частоты замен.

Анализ участка нуклеотидного выравнивания.
tta aaa tca taa att atc tca ata aac tat
.|| ||. |.| ||| ||| ||| ||| |.| ||| |.|
cta aag tta taa att atc tca aca aac tgt

Для участка 551..581 из последовательности с AC AF058449 и 524-554 из
последовательности с AC ECBFR были подсчитаны Ks и Ka:
Ks = 1,972
Ka = 0,138
О давлении отбора трудно сказать глядя на такой короткий участок, но на
данном участке прослеживается отрицательный отбор, поскольку Кs >>Ka, т.е в
процессе эволюции отфильтровывались, устранялись несинонимические замены.