Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~tregubova/projects/Term_3/Credit.html
Дата изменения: Tue Dec 29 14:14:09 2009
Дата индексирования: Thu Apr 8 13:45:17 2010
Кодировка: Windows-1251
Программы пакета BLAST

Зачетное задание

 
   Был получен неаннотированный фрагмент гемона Regiella insecticola (1-7000 записи AC192956) Далее из него был верзан кусок длиной 7000 нуклеотидов.
Потом были найдены все открытые рамки считывания длиной более 240 нуклеотидов в этом фрагменте.Для этого использовалась программа getorf с параметрами:

>getorf: -minsize 240 -find 1 -table 11

Эти параметры обеспечивают использование стандартного для бактерий (bacterial) генетического кода,открытой рамкой считается последовательность, начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном.,а также длину рамки не менее 240 нуклеотидов.
Нашлось 14 открытых рамок.Файл ac201621.orf
Трансляции всех открытых рамок считывания были запущены на поиск в предварительно отформатированном полном протеоме E.coli (программа blastp - поиск белковой последовательности в белковом банке). Было подсчитано число находок с E-value < 0.001 (программа grep,файл counter.txt)
В файле results2.xls приведены результаты поиска для всех рамок считывания, для которых нашлись гомологи из E.coli
В файл results_finish.xls были отобраны только те открытые рамки считывания, для которых число находок было больше 0.



Гипотетические гены во фрагменте 1-7000 записи AC192956

5'----[=> NUSA_ECOLI,21-896]------[=> LEPA_ECOLI, 899-3568]--------[=> RBFA_ECOLI,3747-4160]----[=>TRUB_ECOLI,4157-5092]--------------------------------3'

3'----------------------------------------------------------------------------------------------------------------------[<=PBPA_ECOLI,6995-5310]--------5'


Гены в геноме E.coli(координаты по записи u00096 EMBL)


Получим полный геном кишечной палочки
>entret embl:u00096
5'------------------------------------------------------------------------------------------------------------------------------------------[=>,PBPA_ECOLI,3523445..3520893]---3'



3'-[<=,LEPA_ECOLI,(2705344..2705823)-[<=,TRUB_ECOLI,(3309855..3310799)]-[<=,RBFA_ECOLI,(3310799..3311200)]-[<=,NUSA_ECOLI,(3314061..3315548)]---------------------------------5'


Консервативные гены-RBFA_ECOLI, TRUB_ECOLI, NUSA_ECOLI.Только в случае кишечной палочки между NUSA_ECOLI и RBFA_ECOLI нет ничего,а в гипотетическом геноме между ними вклинился LEPA_ECOLI.