Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~marina_g/Annotation/Annotation.htm
Дата изменения: Thu Dec 27 11:20:39 2007
Дата индексирования: Tue Oct 2 14:36:25 2012
Кодировка: Windows-1251
practice9 назад к третьему семестру

1. Зачетное задание ?1

Использовались команды

seqret AALF01000002.embl -sask

Для того чтобы проиндексировать протеом для поиска программами пакета BLAST использовалась следующая команда

formatdb -i salty_proteome.fasta -n salt -p T

Из программ пакета BLAST была выбрана программа BLASTX, т.к. она предназначается для анализа новых нуклеотидных последовательностей и для предсказания кодирующих участков.

Используемая команда:

blastall -p blastx -d salt -i aafl01000002.fasta -o result.fasta -F F

Рассматривались только очень похожие последовательности (E-value<0,001).

[=>ген Q8ZNV2 3271. . .1514]

[=>ген P67179 883. . .143]

[=>ген Q8ZNV3 1357 . . .917]

[=>ген Q7CQC7 3575 . . .3997]

[=>ген Q8ZK08 868. . .176]

[=>ген P28354 3220. . .2408]

[=>ген P58696 1912. . .1601]

[=>ген Q9ZJ12 2860. . .2369]

[=>ген Q8ZK28 1457 . . . 1341]

[=>ген Q8ZPV3 1339 . . . 1166]

из полученных результатов видно, что координаты некоторых генов перекрываются, в результате получилось следующее:-

Гипотетические гены во фрагменте 14001-18001

 3'--[<=ген P67179 143. . . 883]-- [<=ген Q8ZNV3 917 . . . 1357]--[<=ген Q8ZK28 1341 . . .1457 ]--- [<=ген P58696 1601. . .1912]-- [<=ген P28354 2408. . .3220] --------------------------------5'
 5'---------------------------------------------------------------------------------------------------------------------------------------------------------------[=>ген Q7CQC7 3575 . . .3997] 3'

С помощью одного запроса в SRS были найдены все соответствующие белки в UniProt Q8ZPV3|P28354|P58696 (([uniprot-AccNumber:Q8ZPV3*] | [uniprot-AccNumber:P28354*]) | [uniprot-AccNumber:P58696*])

Получили следующую информацию:

Было найдено 6 записей:

EMBL:AE008743 EMBL:AE008784 EMBL:AE008785 EMBL:AE008839 EMBL:AE008910 EMBL:M38590

 
AC находки в БД UniProt EMBL:AE008743 EMBL:AE008784 EMBL:AE008785EMBL:AE008839EMBL:AE008910
P67179 -gene complement(18989..19449)gene ntpA ---
Q8ZNV3 -gene complement(19544..21328)gene aspS ---
Q8ZK28 ----gene 7449..8549 gene yjgP-
P58696 gene STM1001 gene complement(8270..8737)----
P28354 ---gene complement(21329..22210) gene prfB -
Q7CQC7 --gene 738..1576 gene yecE --
3'- [<= gene ntpA(18989..19449) ] --[<= gene aspS(19544..21328) ]----------------------------------5'
5'------------------------------------------------------------------[=> gene yecE 738..1576]-------3'

Сравнивая полученные результаты с результатами гипотетических генов во фрагменте, видно, что трое из генов(gene ntpA,gene aspS,gene yecE ) расположены одинаково, также как и при гипотетических генах, а остальнын гены расположенные в случае гипотетических генов рядом,в последнем случае находятся в абсолютно разных местах.Длина записи EMBL:AE008784 составляет 21506, поэтому гены на схеме следует распологать именно в такой последовательности, хоть и по координатам кажется иначе.