Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~kut/term3/EMBL.html
Дата изменения: Wed Oct 4 17:21:22 2006
Дата индексирования: Tue Oct 2 06:17:49 2012
Кодировка: Windows-1251
EMBL

Отчет по работе с БД EMBL.



Сравнение разных записей в EMBL.


Зашел через Putty на kodomo-count и получил файл с записью SwissProt, описывающей мой белок, выполнив команду
entret sw:nikr_ecoli -auto.
В записи SwissProt нашел поле DR, в нем информацию о соответствующих записях EMBL. C помощью SRS получил информацию, необходимую для заполнения следующей таблицы:
Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания документа Описание Длина последовательности
EMBL:U00096 genomic DNA STD PRO 23-FEB-2006 Escherichia coli K12 MG1655, complete genome. 4639675
EMBL:D21140 genomic DNA STD PRO 11-NOV-1993 Escherichia coli gene, partial cds, clone:pYU2. 133
EMBL:L02370 genomic DNA STD PRO 24-SEP-1992 Escherichia coli Rhs core protein, RhsB accessory element-encoded protein (rhsB), and H repeat-associated protein genes, complete cds; and unknown genes. 7667
EMBL:U00039 genomic DNA STD PRO 02-JUN-1994 E. coli chromosomal region from 76.0 to 81.5 minutes. 225419
EMBL:Y08952 genomic DNA STD PRO 28-OCT-2000 E.coli nikR gene for nickel responsive regulator 764

PRO - код для прокариот в поле division.
STD - стандартный класс (все записи в котором не классифицированы так, как в других классах.)


Значения поля "Тип молекулы" для всех пяти записей совпадают - геномная ДНК. Значения поля "Класс данных" также идентичны для всех пяти записей - стандартный. "Раздел EMBL" у всех пяти записей представлен прокариотами. Длина последовательности первой записи настолько велика (4639675) потому что она предстовляет из себя весь геном Escherichia coli K12 MG1655. Длина последовательности второй записи тоже велика (225419), она предстовляет из себя участок хромосомы Escherichia coli от 76.0 до 81.5 минут. Длина последовательности пятой записи - 764, это ген, кодирующий мой белок (Nkr_ecoli).

Сравнение описаний гена Escherichia coli в двух разных записях EMBL.

На основании результатов упражнения 1 выбрал 2 записи для дальнейшего изучения (Y08952,L02370). Получил эти записи EMBL при помощи команд
entret embl:Y08952 -auto
entret embl:L02370 -auto

и убедился, что в этих документах действительно содержатся описания последовательности, кодирующей мой белок. Изучил документы и заполнил таблицу:
  I II
ID записи Y08952 L02370
Начало гена в записи 152 122
Конец гена в записи 553 523
Направление гена Прямое Прямое
Примечания В записи содержатся ссылки на 2 статьи. Указаны коды, с помощью которых можно найти белок, кодируемый геном, в БД PDB, Swiss-prot, Interpro. Используется таблица генетического кода 11. Указаны коды, с помощью которых можно найти белок, кодируемый геном, в БД PDB, Swiss-prot, Interpro. Используется таблица генетического кода 11.

Извлек из полученных записей нуклеотидные последовательности, кодирующие мой белок, в виде отдельных файлов при помощи команд
seqret y08952.entret -sask
seqret l02370.entret -sask
*
* Программа потребовала номера первого и последнего оснований извлекаемого участка и название выходного файла.

Сравнил последовательности, используя программу needle. Последовательности совпадают на 100 процентов.
Результаты сравнения в файле gene1-gene2.needle.

Знакомство с записью гена из эукариотического генома.

Для знакомства с записью гена из эукариотического генома было предложено изучить документ EMBL с идентификационным номером BA000025, ген BAT2.

Схематичное изображение структуры транслируемых участков (изображены только первый и последний транслируемые участки):
ген на комплиментарной цепи:

<---[327076..327171]--..--[306702..306792]---
Файл с расчетами - length.xls



На главную страницу третьего семестра

На главную страницу


©Белошистов Роман