Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~Try2Fly/t3_files/Report9.doc
Дата изменения: Mon Dec 19 12:53:26 2005
Дата индексирования: Tue Oct 2 11:36:38 2012
Кодировка: koi8-r

Аннотация фрагмента участка AALC01000092 генома бактерии

Yersinia bercovieri.

. Получение исследуемого фрагмента (4001-8000) данного участка генома:

|использованные команды UNIX: |
|seqret - получение последовательности; |
|параметры: сразу после команды задается необходимый |
|участок в виде путь/название_файла:имя_участка, так же |
|используется параметр |
|-sask после которого в диалоговом режиме вводится начало |
|и конец необходимого фрагмента. |

. Извлечение из исследуемого фрагмента трансляции всех открытых рамок
считывания длиной не менее 240 нуклеотидов:

|использованные команды UNIX: |
|wossname - поиск программ EMBOSS по ключевому слову; |
|параметры: после команды задается ключевое слово - ORF |
|(Open Reading Frames - открытые рамки считывания), |
|выбранная программа - Getorf; |
|getorf - программа, находящая рамки считывания; |
|параметры: -table - используемая таблица генетического |
|кода (значение -11 - бактериальный генокод), -minsize - |
|минимально допустимая длина рамки (240), -find - тип |
|выдачи (значение 1 - выдача результатов экспрессии |
|участков лишь между старт- и стоп-кодонами) |

. Создание индексных файлов BLAST для всех последовательностей из
SwissProt из бактерий таксона Enterobacteriales:

|использованные команды UNIX: |
|seqret - получение последовательности; |
|параметры: задание БД и таксона в виде |
|seqret sw-org:Enterobacteriales; |
|formatdb - создание индексного файла BLAST; |
|параметры: -i - входной файл, -p - тип последовательности|
|во входном файле (значение T - аминокислотная), -n - |
|базовое имя индексных файлов. |

. Поиск гомологов найденных ORF программой BLASTP:

|использованные команды UNIX: |
|seqret - был использован для получения |
|последовательностей отдельных ORF; |
|параметры: имя_файла:AC_ORFа - задание входного файла и |
|номера ORF, -outseq - задание выходного файла (значение |
|stdout - стандартный вывод bash); |
|blastall - вызов пакета программ BLAST; |
|параметры: -p - выбор варианта BLAST (blastp), -e - |
|ограничение |
|e-value (00,1), -d - базовое имя созданных индексных |
|файлов; |
|grep - команда анализирующая строки файла, содержащие |
|заданный символ или комбинацию символов; |
|параметры: -с - вывод числа строк, содержащих заданный |
|символ (выбранное значение ">" - т.к. в выдаче BLAST |
|перед каждым найденным гомологом стоит > , кавычки |
|использованы для того, чтобы bash не воспринимал этот |
|символ как команду); |
|echo - вывод в stdout введенных после значений |
|так же были использованы операторы bash перенаправления |
|stdout другой команде - |, записи stdout в файл - > , |
|и дозаписи stdout в файл - >> . |


Вышеприведенные команды были объединены в один скрипт, позволяющий
узнать число гомологов найденных BLASTP для каждого ORF. Ниже
приведен текст скрипта:

|echo AALC01000092_1 > scriptresult |
|seqret t2.fasta:AALC01000092_1 -outseq stdout | blastall -p blastp -e 0.01 -d ent | |
|grep -c ">" >> scriptresult |
|echo AALC01000092_2 >> scriptresult |
|seqret t2.fasta:AALC01000092_2 -outseq stdout | blastall -p blastp -e 0.01 -d ent | |
|grep -c ">" >> scriptresult |

. Информация обо всех открытых рамках считывания в исследуемом фрагменте
генома:

|Имя ORF: |Начало во|Конец во |Направлени|Число |
| |фрагменте|фрагменте|е: |гомолого|
| |: |: | |в: |
|AALC01000092_|1620 |1991 |прямое |0 |
|1 | | | | |
|AALC01000092_|3859 |2 |обратное |4 |
|2 | | | | |

. Предполагаемая структура генов в данном фрагменте:

2 <-------------------------- 3859

--------------------------------------