Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~Fastum/embl6.doc
Дата изменения: Wed Dec 28 13:53:33 2005
Дата индексирования: Mon Oct 1 22:13:56 2012
Кодировка: koi8-r




Информация банка EMBL о гене белка FDHF_ECOLI.


Задания:
Найти все ссылки на записи EMBL с последовательностями, кодирующими белок
FDHF_ECOLI. Изучить документы. Извлечь кодирующие последовательности и
сравнить их.

Порядок выполнения задания:

Для получения записей из банка SwissProt использовалась программа entret (
entret sw:P07658 - auto).Были получены 3 ссылки на EMBL: M13563, U00006,
U00096.

По первым двум записям были получены соответствующие документы EMBL(entret
embl: M13563 -auto и entret embl: U0006 -auto). По ним была составлена
таблица:



| |I |II |
|ID |ECUW89 |ECFDHF |
|AC |U00006 |M13563 |
|Тип молекулы (ДНК/РНК) |ДНК |ДНК |
|Длина посл-ти в записи |176195 пар оснований |2971 пара оснований |
|Раздел банка |PRO |PRO |
|Начало гена в записи |162459 |749 |
|Конец гена в записи |164606 |2896 |
|Направление гена |Обратное |прямое |
|Дата последнего изменения |17 апреля 2005г. |17 июля 2001г. |
|документа | | |
|Примечания |Более длинная |Относительно короткая|
| |последовательность , |последовательность, |
| |содержит несколько |содержит только 1 |
| |генов. |ген. |


Из записей этих документов программой seqret с опцией -sask были получены
кодирующие белок последовательности, соответственно ecuw89_gene1.fasta и
ecfdhf_gene2.fasta.

Программой needle( needle ecuw89_gene1.fasta ecfdhf_gene2.fasta auto -auto)
было получено выравнивание двух данных последовательностей(параметр -auto
задает параметры по умолчанию) . Были получены следующие результаты:

Identity: 2146/2148 (99.9%)

Ниже приведены отличающиеся строки выравнивания и таблица описания замен:


ECUW89 51 caacctggtcgtcgataacggcaaaatcgtccgggcggaggcagcgcagg
100
||||.|||||||||||||||||||||||||||||||||||||||||||||
ECFDHF 51 caacgtggtcgtcgataacggcaaaatcgtccgggcggaggcagcgcagg
100



ECUW89 1101 caaagcctggggcgtggaaagcctgccagcgcataccggctatygcatca
1150
|||||||||||||||||||||||||||||||||||||||||||.||||||
ECFDHF 1101 caaagcctggggcgtggaaagcctgccagcgcataccggctatcgcatca
1150






|ECUW89 |ECFDHF | Синонимична |
| | |или нет |
|С 55 |G 55 |Нет (СTG - Leu, |
| | |GTG -Val) |
|Y 1144 |C 1144 | Если есть |
| | |замена,то нет. |
| | | |


В первом случае данный триплет кодирует 19-й аминокислотный остаток,
который в белке FDHF_ECOLI лейцином, значит,запись ECUW89 точнее отображает
кодируемую последовательность белка.
Рассмотрим вторую замену по записи ECFDHF.Данный нуклеотид кодирует 382
аминокислотный остаток и это аргинин(cgc).382 позиция в FDHF_ECOLI
представлена как раз аргинином.Значит,здесь ECFDHF выдает правильный
результат.

Высокий процент сходства последовательностей (особенно учитывая разные
направления их генов) говорит о достоверности полученных данных.