Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~student08fbb/embl.html
Дата изменения: Wed Dec 23 03:06:11 2009
Дата индексирования: Tue Oct 2 01:49:50 2012
Кодировка: Windows-1251
EMBL

Учебный сайт Шиндяпиной А.В.

Банк нуклеотидных последовательностей EMBL


1. Работа с системой SRS.

а) Перейдя по ссылке http://srs.ebi.ac.uk/ , перешла по гиперссылке на страницу EMBL(release) . На данной странице указана информация о последнем проиндексированном в системе релизе EMBL. Дата последнего индексирования - 7 сентября 2009. Релиз содержит 52 записи.

b) Пройдя по ссылке Data class , можно посмотреть список классов банка EMBL. Он следующий: Снизу указано число записей каждого класса, проиндексированных SRS для последнего релиза EMBL.У тех классов, для которых не указано число записей, записи еще не пориндексированы. (ANN, EST, GRU, MGA, SET, WGS)

c) В банке EMBL представлены следующие разделы (указанные числа - количесвто проиндексированных записей):

d) Получив данные о количестве появившихся стандартных записях в разделах hum (человек), pln (растения), pro (поркариоты) за май 2009 и 2008 года, построила следующую диаграмму:

Видно, что показатели для всех разделов уменьшились по сравнению с 2008 годом, но особенно для раздела hum.

2. Работа с записью BA000025

Работала с геном ZNFB7 из хромосомы 6p21.3 геномной ДНК человека. Ген имеет обратное направление относительно записанного. У него 6 кодиующих участков (экзонов). Первый из них имеет длину 516 нуклеотидов, последний - 381. Первый интрон длиной 825, а последний 3112.

3. Работа с BLASTX

В указанномвыше гене самый длинный кодирующий участок 1778075..1778926. С помощью программы seqret c опцией -sask был вырезан этот фрагмет и записан в fasta-формате в файл BA000025.fasta . Далее на странице http://blast.ncbi.nlm.nih.gov/ выбрала программу BLASTX, т.к. она ищет белки по поседовательностям н.к. Для поиска ввела последовательность из файла BA000025.fasta, выбрала банк SwissProt и организм human. В итоге blast выдал много белков, выбрала конечно с самымлучшим e-value 1e-74. Это трехчленный мотиф-содержащий белок 15 (еще одно название - Zinc finger("цинковые пальцы") protein B7, откуда понятно название гена). Участок с 1 по 127 а.к. соответствует заданному экзону.
Query  381  MPATPSLKVVHELPACTLCAGPLEDAVTIPCGHTFCRLCLPALSQMGAQSSGKILLCPLC  202
            MPATPSLKVVHELPACTLCAGPLEDAVTIPCGHTFCRLCLPALSQMGAQSSGKILLCPLC
Sbjct  1    MPATPSLKVVHELPACTLCAGPLEDAVTIPCGHTFCRLCLPALSQMGAQSSGKILLCPLC  60

Query  201  QEEEQAETPMAPVPLGPLGETYCEEHGEKIYFFCENDAEFLCVFCREGPTHQAHTVGFLD  22
            QEEEQAETPMAPVPLGPLGETYCEEHGEKIYFFCENDAEFLCVFCREGPTHQAHTVGFLD
Sbjct  61   QEEEQAETPMAPVPLGPLGETYCEEHGEKIYFFCENDAEFLCVFCREGPTHQAHTVGFLD  120

Query  21   EAIQPYR  1
            EAIQPYR
Sbjct  121  EAIQPYR  127

4. Информация о белке PTHP_ECOLI в банке EMBL.

С помощью команды entret sw:P0AA04 получила файл pthp_ecoli.entret . В нем 6 ссылок на банк EMBL. Я взяла первые 5, с помощью SRS получиа необходимую информацию и заполнила таблицу:
Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
документа
Описание Длина последовательности
M10425 linear genomic DNA STD PRO 18-NOV-1986 E.coli ptsH gene coding for histidine-containing protein (Hpr), complete cds, and ptsI gene encoding enzyme I of the PTS system (phosphoenolpyruvate-dependent glycose phosphotransferase system). 888
J02796 linear genomic DNA STD PRO 16-JUL-1988 E.coli ptsH, ptsI and crr genes encoding cytoplasmic proteins of the phosphoenolpyruvate:glycose phosphotransferase system (HPr, enzymes I and Glc-III), complete cds. 2850
M21994 linear genomic DNA STD PRO 22-APR-1989 E.coli cysK gene, 3' end, ptsH, ptsI, and crr phototransferase system genes, complete cds. 3144
M21451 linear genomic DNA STD PRO 22-APR-1989 E.coli cysZ, cysK, ptsH, and ptsI genes, complete cds. 2597
U00096 linear genomic DNA STD PRO 23-FEB-2006 Escherichia coli str. K-12 substr. MG1655, complete genome. 4639675
Все записи содержат информацию о линейной геномной ДНК прокариот, причем во всех, кроме последней проаннотированны cds, в последней - весь геном E.coli штамма К-12 (Escherichia coli str. K-12 substr.).
©, "ООО Шиндяпина 2008"