Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.fbb.msu.ru/FBB/year_08/term3/help10.html
Дата изменения: Tue Nov 3 17:42:56 2009
Дата индексирования: Tue Oct 2 07:02:42 2012
Кодировка: Windows-1251
Help to practice 10 (Credit 2)

Материалы к зачетному заданию по блоку 2

Перед началом работы проверьте свою квоту и, если она превышена, просто перенесите энное количество файлов в директорию E:\Public (а после окончания работы - обратно :).

Используйте подсказки к занятиям 6-9.

Чем больше вы успеете к концу занятия, тем выше будет оценка. Но не надо торопиться за счет снижения качества!

Подсказки

  1. Как получить полный протеом кишечной палочки в fasta-формате?
  2. Используйте возможности EMBOSS. Команда
     seqret sw:*_ABCDE
    
    вытащит из банка Swiss-Prot и поместит в указанный Вами файл последовательности всех белков, имеющих идентификаторы, заканчивающееся на ABCDE. Поскольку кишечная палочка - хорошо изученный организм, практически весь ее протеом помещен в Swiss-Prot. Вспомните, как устроены идентификаторы записей Swiss-Prot, описывающих белки штамма K12 кишечной палочки!

    Если на вход программе seqret дать последовательность в любом формате (в том числе в формате EMBL), на выход она (по умолчанию) выдаст ту же последовательность в fasta-формате.

  3. Как получить последовательности открытых рамок?
  4. Для вырезания своего фрагмента используйте опцию -sask программы seqret. Для получения последовательностей трансляций открытых рамок используйте, как и в первом упражнении занятия 9, программу getorf. Если что-то забыли, запустите команду
     getorf -help
    
    и изучите, что означают значения, которые можно придавать параметрам find, table и minsize.

    Если вам приятнее не сразу задавать значения параметров в командной строке, а отвечать на вопросы программы, можно запустить getorf с опцией -opt, тогда программа сама спросит о значениях всех параметров (это касается всех программ пакета EMBOSS).
     

  5. Про программы и опции пакета BLAST читайте в подсказках к заданию 8, тексте задания 9 и в "родном" help'е BLAST'а (здесь или в окне Putty, запустив blastall без параметров). Про то, как написать и запустить скрипт, кратко написано здесь.
     
  6. Нарисовать схему генов можно и в каком-нибудь графическом редакторе или воспользовавшись "рисовалкой", встроенной в Word, но, как представляется, для отчета в HTML-формате проще и аккуратнее будет воспользоваться тегом <PRE> и "нарисовать" всю картинку из ASCI-символов.

    Кстати, если кто не знает, похожий эффект в Word'е достигается сменой шрифта абзаца, который хочется превратить в подобного рода "картинку", на шрифт постоянной ширины, например "Courier New".