Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~Loukian/report9'term3.doc
Дата изменения: Mon Nov 21 17:45:23 2005
Дата индексирования: Tue Oct 2 03:46:14 2012
Кодировка: koi8-r

Предсказание генов во фрагменте генома бактерии Yersinia bercovieri

1. Требуется «вырезать» из генома Yersinia bercovieri участок генома
[AALC01000096-4001-8000]
Вырезано командой
seqret /home/export/samba/public/tmp/yb.fasta:AALC01000096 -sask
где на запросы были указанны:
начальный нуклеотид - 4001
конечный нуклеотид - 8000
имя файла-результата.

2. Требуется получить трансляции всех открытых рамок считывания длиной не
менее 240 нуклеотидов, от старт-кодона до стоп-кодона.
Получены командой
getorf -sequence <имя_файла_с_геномом_ Yersinia_bercovieri > -outseq <файл_
с_трансляциями_рамок > -minsize 240 -table 11 -find 1
Где -table 11 - бактериальный код,
-find 1 - режим получения от СТАРТ-кодона до СТОП-кодона.

3. Требуется создать индексные файлы для таксона Enterobacteriales.
Получены в два этапа:
а) Получение геномов таксона: seqret sw-org:Enterobacteriales
На запрос - <имя_файла_с_белковым_банком_таксона>
б) Получение индексных файлов:
formatdb -i <имя_файла_с_белковым_банком_таксона> -n <имя_индексных_файлов
>

4. Требуется найти гомологи найденных в задании (2) рамок.
Для этого воспользуемся скриптом:
seqret <файл_с_трансляциями_рамок>:AALC01000096_* stdout | blastall -p
blastp -d enterobac -e 0.01 | grep "Number of sequences better than 1.0e-
02" > <файл_с_результатами_подсчета _гомологов>
Программа seqret «вырезает» последовательность, отправляет ее BLASTP, на
выходе от BLASTP ее берет grep и считает число гомологов.

Полученные результаты:

|Имя рамки |Нача|Коне|Направлени|Число |
| |ло |ц |е |гомологов |
|>AALC01000096|869 |1165|Прямая |0 |
|_1 | | | | |
|>AALC01000096|2623|3843|Прямая |0 |
|_2 | | | | |
|>AALC01000096|3599|3865|Прямая |0 |
|_3 | | | | |
|>AALC01000096|3484|3035|Обратная |0 |
|_4 | | | | |
|>AALC01000096|2889|2650|Обратная |0 |
|_5 | | | | |
|>AALC01000096|1164|925 |Обратная |0 |
|_6 | | | | |
|>AALC01000096|2434|2 |Обратная |3 |
|_7 | | | | |


2<-------------------2432
869------>1165 2623 ------------------------------------------
--------------->3843
925<--1164 2650<------2889
3035
<--------3484

3599------------>3865

5. Не все триплеты, кодирующие метионин, являются старт-кодонами, поэтому
некоторые предсказания кодирующих участков оказываются неверными.