Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/FBB/year_07/term3/task8.html
Дата изменения: Tue Oct 21 19:21:41 2008
Дата индексирования: Tue Oct 2 16:52:27 2012
Кодировка: Windows-1251
Task 8 (BLAST)

Занятие 8. Программы пакета BLAST для работы с нуклеотидными последовательностями

Создайте директорию BLAST для работы на этом и следующем занятиях. Выходные файлы программ пакета BLAST должны находиться в этой директории. Отчет должен появиться на вашем веб-сайте к вечеру дня следующего занятия.

На компьютере kodomo (и kodomo-count) в директории /home/export/samba/public/y07/Term3/EMBL лежат 3 файла:

  1. Поиск в геноме участков, кодирующих белки, похожие на заданный
  2. Вы знаете аминокислотную последовательность Вашего белка из Escherichia coli K-12. Ваша задача — определить, закодированы ли похожие белки в геноме другого организма, не пользуясь аннотацией генома.

    Создайте в своей рабочей директории индексные файлы пакета BLAST для поиска по заданному геному.

    Выберите подходящую для решения данной задачи программу из пакета BLAST (cм. материалы) и проведите с ее помощью поиск с порогом на E-value 0,001.

    По результатам поиска заполните таблицу.

    Поиск гомологов белка <...> в геноме <такой-то бактерии>

    Число находок с Е-value<0,001         
    Характеристика лучшей находки:  
       E-value находки  
    AC соответствующей записи EMBL  
    Координаты выравнивания(-ий) в записи EMBL  
    Координаты CDS в записи EMBL (если есть)  
    AC UniProt для этого CDS (если есть)  

  3. Аналогичный поиск сразу в нескольких геномах
  4. Создайте в своей директории индексные файлы BLAST для поиска по всем трем геномам сразу. С помощью выбранной ранее программы проведите поиск по трем геномам. Отметьте в отчете, как изменился (если изменился) E-value той находки, которая была лучшей по результатам предыдущего упражнения, а также общее число находок с E-value < 0,001.

  5. Поиск гомологов с помощью программы BLASTN
  6. Создайте в своей рабочей директории fasta-файл с последовательностью из генома E.coli, кодирующей ваш белок (для этого надо взять одну из записей EMBL, на которую ссылается ваша запись Swiss-Prot, найти в ней координаты соответствующей CDS и вырезать последнюю программой seqret в отдельный файл).

    Поищите гомологов этого гена в трех геномах программой BLASTN. Опишите результаты в отчете: укажите E-value лучшей находки, приведите соответствующее выравнивание и аннотацию соответствующего фрагмента генома (если она, конечно, есть в записи EMBL). Сравните результаты с результатами предыдущего упражнения, ваши наблюдения изложите в отчете.

См. подсказки.