Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.fbb.msu.ru/FBB/year_08/term3/task9.html
Дата изменения: Tue Oct 27 15:11:23 2009 Дата индексирования: Tue Oct 2 06:37:49 2012 Кодировка: Windows-1251 |
Результатом заданий 2,3,5 должен стать файл MS-Excel "trna.xls", который должен лежать к следующему занятию в директории H:\Term3\BLAST, краткие выводы по всем заданиям 2–5 — в отчете в той же директории.
Выполните команду
tfm getorfи разберитесь, как запустить программу getorf так, чтобы получить набор трансляций всех открытых рамок данной последовательности длиной более 30 нуклеотидов, считая открытой рамкой последовательность триплетов, начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном, при использовании бактериального кода. Командную строку приведите в отчете.
Запустите getorf с указанными параметрами на последовательности из записи D89965. Определите, какая из найденных открытых рамок соответствует приведенной в записи CDS. Определите также, какая из рамок соответствует записи Swiss-Prot, на которую ссылается данная запись EMBL.
Этапы работы.
grep ">" trna_ecoli.fastaИмпортируйте ее в Excel.
Повторите поиск, на этот раз указав порог на E-value, равный 0.001.
Добавьте в отчетную таблицу соответствующий столбец.
Результатом этого задания должны стать два дополнительных столбца
в отчетном Excel-файле и абзац в отчете, с обязательным указанием
командных строк, использованных для запуска megablast.
Вырежьте гомологичный участок в отдельный файл командой
Как проаннотирован гомологичный участок в записи EMBL, описывающей геном бактерии?
seqret file.fasta:seqname1
Все ли найденные программой BLASTN гомологи найдены также и программой FastA? Если нет, приведите пример и постарайтесь разобраться, почему так получилось.