Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.su/FBB/year_07/term3/task9.html
Дата изменения: Tue Oct 28 18:10:16 2008 Дата индексирования: Mon Oct 1 21:57:49 2012 Кодировка: Windows-1251 |
Результатом заданий 2,3 и 5 должен стать файл MS-Excel "trna.xls", который должен лежать к следующему занятию в директории H:\Term3\BLAST, краткие выводы по всем заданиям 2-5 - в протоколе в той же директории.
Выполните команду
tfm getorfи разберитесь, как запустить программу getorf так, чтобы получить набор трансляций всех открытых рамок данной последовательности длиной более 30 нуклеотидов, считая открытой рамкой последовательность триплетов, начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном, при использовании бактериального кода. Командную строку приведите в отчете.
Запустите getorf с указанными параметрами на последовательности из записи D89965. Определите, какая из найденных открытых рамок соответствует приведенной в записи CDS. Определите также, какая из рамок соответствует записи Swiss-Prot, на которую ссылается данная запись EMBL.
Этапы работы.
grep ">" trna_ecoli.fastaИмпортируйте ее в Excel.
Повторите поиск, на этот раз указав порог на E-value, равный 0.001.
Добавьте в отчетную таблицу соответствующий столбец.
Результатом этого задания должны стать два дополнительных столбца
в отчетном Excel-файле и абзац в протоколе, с обязательным указанием
командных строк, использованных для запуска megablast.
Приведите в протоколе значения полей AC, DE и OS соответствующей записи EMBL, а также проаннотирован ли в EMBL (в поле FT) найденный гомологичный участок, и если проаннотирован, то как.
Вырежьте гомологичный участок в отдельный файл командой
cat $mydir/*.fasta > genomes.fasta(если предварительно правильно определить переменную "mydir").
seqret file.fasta:seqname1