Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~kinta/Term3/protocol1.html
Дата изменения: Thu Sep 28 20:08:24 2006
Дата индексирования: Tue Oct 2 10:06:12 2012
Кодировка: Windows-1251
Банк EMBL назад к третьему семестру

Банк EMBL

1. Сравнение разных записей в EMBL

На kodomo-count.cmm.msu.ru с помощью команды entret sw:P0ABQ4 -auto , где P0ABQ4 - AC исследуемого белка DYR_ECOLI, был получен файл с записью SwissProt. В нем среди прочего содержится информация о соответствующих записях EMBL. Далее был произведен поиск по бд EMBL, запрос:

"((([embl-AccNumber:J01609*] | [embl-AccNumber:X05108*]) | [embl-AccNumber:D10483*]) | [embl-AccNumber:U00096*]) "

Полученаая информация - в таблице 1:

Идентификатор записи EMBL Id Тип молекулы Класс данных Раздел EMBL Длина последовательности Дата создания документа Описание
EMBL:AP009048 AP009048 genomic DNA (геномная ДНК) STD (стандартный) PRO (прокариоты) 4646332 22 января 2006 полный геном Escherichia coli W3110 DNA
EMBL:U00096 U00096 genomic DNA (геномная ДНК) STD (стандартный) PRO (прокариоты) 4639675 23 февраля 2006 полный геном Escherichia coli K12 MG1655
EMBL:J01609 J01609 genomic DNA (геномная ДНК) STD (стандартный) PRO (прокариоты) 1200 12 декабря 1992 ген, кодирующий дигидрофолат редуктазу (folA) в Escherichia coli
EMBL:X05108 X05108 genomic DNA (геномная ДНК) STD (стандартный) PRO (прокариоты) 1200 07 июня 1987 ген, кодирующий дигидрофолат редуктазу в E. coli strain 1810
Примечание:
Также была найдена запись с Id D10483, но в таблицу она не включена, т.к. 20ого января 2006 ее заменила запись с Id AP009048 (первая в таблице).

Сравнивать данные записи логично по полю Описание (Description), т.к. класс данных, раздел EMBL и тип молекулы одинаков для всех записей (кроме записи с ID D10483), а дата создания и длина последовательности, напротив, различаются, но не имеют почти принципиального смысла.
Первые 2 записи, они же самые новые, охватывают весь геном, длина последовательностей в них практически не различается. 3яя запись была заменена на 1ую 20ого января 2006. 4ая и 5ая записи, на мой взгляд, наиболее интересны, т.к. описывает именно тот ген, которые кодирует мой белок, даже длина последовательностей совпадает. Отличие состоит в том, что последняя запись - для штамма 1810 Escherichia coli.

2. Сравнение описаний гена Escherichia coli в двух разных записях EMBL

С помощью команд entret embl:J01609 -auto и entret embl:X05108 -auto были получены 2 записи EMBL, с соответсвенными ID. Данные об этих записях сведены в таблицу 2:

  I II
ID записи J01609 X05108
Начало гена в записи 558 559
Конец гена в записи 1037 1038
Направление гена прямое прямое
Примечания Данная запись содержит в себе ссылки на 3 статьи. В поле комментариев указано, что 22 февраля 2002 данная запись заменила другую. Также там кратко написано, что содержится с каждой из 3 статей. В поле FT указано, что используется 11ая таблица генетического кода и стартовый кодон ?1. Данная запись содержит ссылку только на 1 статью, в поле FT указано, что используется 11ая таблица генетического кода. Также есть ссылка на схожий источник: "taxon:562" (taxon - база данных, 562 - идентификатор).

Далее из полученных записей были извлечены нуклеотидные последовательности, кодирующие белок DYR_ECOLI, в виде отдельных файлов: DYR_gene1.fasta и DYR_gene2.fasta. С помощью программы needle было произведено выравнивание, процент идентичности - 98,1%. Список различий приведен в иде таблицы:

позиция от нач. код. пос-ти нуклеотид в J01609 нуклеотид в X05108 позиция в кодоне синонимичность замены
6 c t 3 да
36 c t 3 да
98 t g 2 нет
147 a c 3 да
228 g a 3 да
303 a g 3 да
310 t c 1 да
324 a g 3 да
460 g c 1 нет
Таким образом, несмотря на расхождение в 9 нуклеотидах,замены одного нуклеотида на другой несинонимичны только в 2 случаях. В первом случае глутамин заменен на пролин, в во втором случае глутаминовая кислота на глутамин.

3. Знакомство с записью гена из эукариотического генома

Для знакомства с записью гена из эукариотического генома было предложено изучить документ EMBL с идентификационным номером BA000025 , ген BAT3.

Из данных чисел видно, что большую часть в гене составляют нетранслируемые области
Рассчеты можно посмотреть в файле exons.xls


© Виноградова Светлана