Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~Snegir/pr9.doc
Дата изменения: Tue Dec 27 13:51:50 2005
Дата индексирования: Mon Oct 1 21:30:50 2012
Кодировка: koi8-r

Аннотация участка бактериального генома
1. Создадим файл, содержащий участок с 4001 по 8000 нуклеотид фрагмента
AALC01000101 генома бактерии Yersinia bercovieri (yb.fasta).
Исследуемый участок генома был получен с помощью программы seqret
(myseq.fasta):
seqret /home/export/samba/public/tmp/yb.fasta:AALC01000101 -sask
2. Извлечём из фрагмента генома Y. bercovieri трансляции всех открытых
рамок считывания длиной не менее 240 нуклеотидов, используя
стандартный для бактерий генетический код (-table 11). Открытой рамкой
считаеться последовательность, начинающуюся со старт-кодона и
заканчивающуюся стоп-кодоном (-find 1). С помощью программы getorf был
получен требуемый файл:
getorf myseq.fasta getorf.fasta -table 11 -minsize 240 -find 1
3. Создадим индексные файлы BLAST для всех последовательностей из
SwissProt из бактерий таксона Enterobacteriales. Сначала был получен
файл с последовательностями всех белков Enterobacteriales:
seqret sw-org:enterobacteriales
Затем были созданы индексные файлы BLAST:
formatdb -i enterobacteriales.fasta -p T -n bact
4. Создадим таблицу, включающую информацию обо всех открытых рамках
считывания в вашем фрагменте генома. Список рамок считывания был
получен при помощи программы grep:
grep -i '>' getorf.fasta > getorf.txt

|Рамка |Начало во |Конец во |Направление|Число |
|считывания |фрагменте |фрагменте | |гомологов |
|AALC01000101_1 |1507 |1800 |прямое |0 |
|AALC01000101_2 |3179 |3478 |прямое |0 |
|AALC01000101_3 |3516 |3259 |обратное |0 |
|AALC01000101_4 |3973 |3164 |обратное |4 |
|AALC01000101_5 |3145 |2108 |обратное |1 |
|AALC01000101_6 |2095 |1334 |обратное |7 |
|AALC01000101_7 |889 |236 |обратное |2 |



Cкрипт, с помощью которого получены данные о числе сходных
последовательностей:

seqret getorf.fasta:AALC01000101_1 stdout | blastall -p blastp -d bact -e
0.01 | grep -c ">" > 1.txt
seqret getorf.fasta:AALC01000101_2 stdout | blastall -p blastp -d bact -e
0.01 | grep -c ">" >> 1.txt
seqret getorf.fasta:AALC01000101_3 stdout | blastall -p blastp -d bact -e
0.01 | grep -c ">" >> 1.txt
seqret getorf.fasta:AALC01000101_4 stdout | blastall -p blastp -d bact -e
0.01 | grep -c ">" >> 1.txt
seqret getorf.fasta:AALC01000101_5 stdout | blastall -p blastp -d bact -e
0.01 | grep -c ">" >> 1.txt
seqret getorf.fasta:AALC01000101_6 stdout | blastall -p blastp -d bact -e
0.01 | grep -c ">" >> 1.txt
seqret getorf.fasta:AALC01000101_7 stdout | blastall -p blastp -d bact -e
0.01 | grep -c ">" >> 1.txt

Схематическое изображение предполагаемых генов (открытых рамок, имеющих
гомологов) на фрагменте:

3973(3164 3145(2108 2095(1334 889(236