Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~kinta/Term3/protocol1.html
Дата изменения: Thu Sep 28 20:08:24 2006 Дата индексирования: Tue Oct 2 10:06:12 2012 Кодировка: Windows-1251 |
На kodomo-count.cmm.msu.ru с помощью команды entret sw:P0ABQ4 -auto , где P0ABQ4 - AC исследуемого белка DYR_ECOLI, был получен файл с записью SwissProt. В нем среди прочего содержится информация о соответствующих записях EMBL. Далее был произведен поиск по бд EMBL, запрос:
"((([embl-AccNumber:J01609*] | [embl-AccNumber:X05108*]) | [embl-AccNumber:D10483*]) | [embl-AccNumber:U00096*]) "
Полученаая информация - в таблице 1:
Идентификатор записи EMBL | Id | Тип молекулы | Класс данных | Раздел EMBL | Длина последовательности | Дата создания документа | Описание |
EMBL:AP009048 | AP009048 | genomic DNA (геномная ДНК) | STD (стандартный) | PRO (прокариоты) | 4646332 | 22 января 2006 | полный геном Escherichia coli W3110 DNA |
EMBL:U00096 | U00096 | genomic DNA (геномная ДНК) | STD (стандартный) | PRO (прокариоты) | 4639675 | 23 февраля 2006 | полный геном Escherichia coli K12 MG1655 |
EMBL:J01609 | J01609 | genomic DNA (геномная ДНК) | STD (стандартный) | PRO (прокариоты) | 1200 | 12 декабря 1992 | ген, кодирующий дигидрофолат редуктазу (folA) в Escherichia coli |
EMBL:X05108 | X05108 | genomic DNA (геномная ДНК) | STD (стандартный) | PRO (прокариоты) | 1200 | 07 июня 1987 | ген, кодирующий дигидрофолат редуктазу в E. coli strain 1810 |
Сравнивать данные записи логично по полю Описание (Description), т.к. класс данных, раздел EMBL и тип молекулы
одинаков для всех записей (кроме записи с ID D10483), а дата создания и длина последовательности, напротив, различаются,
но не имеют почти принципиального смысла.
Первые 2 записи, они же самые новые, охватывают весь геном, длина последовательностей в них практически не различается.
3яя запись была заменена на 1ую 20ого января 2006. 4ая и 5ая записи, на мой взгляд, наиболее интересны, т.к.
описывает именно тот ген, которые кодирует мой белок, даже длина последовательностей совпадает. Отличие состоит в том, что последняя запись
- для штамма 1810 Escherichia coli.
  | I | II |
ID записи | J01609 | X05108 |
Начало гена в записи | 558 | 559 |
Конец гена в записи | 1037 | 1038 |
Направление гена | прямое | прямое |
Примечания | Данная запись содержит в себе ссылки на 3 статьи. В поле комментариев указано, что 22 февраля 2002 данная запись заменила другую. Также там кратко написано, что содержится с каждой из 3 статей. В поле FT указано, что используется 11ая таблица генетического кода и стартовый кодон ?1. | Данная запись содержит ссылку только на 1 статью, в поле FT указано, что используется 11ая таблица генетического кода. Также есть ссылка на схожий источник: "taxon:562" (taxon - база данных, 562 - идентификатор). |
Далее из полученных записей были извлечены нуклеотидные последовательности, кодирующие белок DYR_ECOLI, в виде отдельных файлов: DYR_gene1.fasta и DYR_gene2.fasta. С помощью программы needle было произведено выравнивание, процент идентичности - 98,1%. Список различий приведен в иде таблицы:
позиция от нач. код. пос-ти | нуклеотид в J01609 | нуклеотид в X05108 | позиция в кодоне | синонимичность замены |
6 | c | t | 3 | да |
36 | c | t | 3 | да |
98 | t | g | 2 | нет |
147 | a | c | 3 | да |
228 | g | a | 3 | да |
303 | a | g | 3 | да |
310 | t | c | 1 | да |
324 | a | g | 3 | да |
460 | g | c | 1 | нет |
Из данных чисел видно, что большую часть в гене составляют нетранслируемые области
Рассчеты можно посмотреть в файле exons.xls