Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.fbb.msu.ru/FBB/year_08/term4/task2.html
Дата изменения: Tue Feb 16 15:30:48 2010
Дата индексирования: Tue Oct 2 06:38:17 2012
Кодировка: Windows-1251
Task 2

Занятие 2.

Срок выполнения заданий — 2 марта 2010 г. Отчет по заданиям 1, 5, 6, 7 должен продолжать отчет по предыдущему занятию (можно на той же веб-странице). Задания 2 и 3 — промежуточные, по ним развернутого отчета составлять не надо, нужно лишь указать, какое семейство белков вы выбрали и какой программой выравнивали последовательности. Если сделаете дополнительные задания 4 и/или 8, то лучше вынести отчеты по ним на отдельные страницы.
  1. Пользуясь таксономическим сервисом NCBI: http://www.ncbi.nlm.nih.gov/taxonomy/, определите, к каким таксонам относятся отобранные вами бактерии. Есть ли на дереве отобранных бактерий ветви, выделяющие какие-нибудь из таксонов? Если да, укажите эти таксоны и соответствующие ветви.
     
  2. Из списка функций белков выберите одну: по белкам соответствующего семейства вы будете реконструировать филогенетическое дерево.

    ФункцияМнемоника
    Омега-субъединица ДНК-зависимой РНК-полимеразы RPOZ
    Фактор элонгации трансляции Ts EFTS
    Рибосомный белок L2 RL2
    Рибосомный белок S7 RS7
    Рибосомный белок S12 RS12
    Энолаза ENO

    Получите из Swiss-Prot последовательности белков с данной функцией из отобранных вами бактерий (для этого вспомните, как получить ID банка Swiss-Prot из мнемоники функции и мнемоники организма).
     

  3. Создайте выравнивание отобранных белков программой muscle или mafft (см. указания к прошлогоднему занятию 8).

    Рекомендуется для дальнейшей работы отредактировать fasta-файл с выравниванием, оставив от имен последовательностей только мнемонику видов — так легче будет разбираться с деревьями. Напоминание: именем в fasta формате считается слово, заключенное между знаком ">" и первым пробелом в той же строке (а если пробела нет, то до конца строки). Оставшаяся часть строки считается описанием.
     

  4. (* дополнительное) Импортируйте выравнивание в GeneDoc. Постарайтесь найти как можно больше диагностических позиций выравнивания, то есть таких, по которым можно судить о том, относится ли та или иная последовательность выравнивания к некоторому таксону.

    Указание. Удобно "подкрасить" позиции, консервативные внутри таксона. Для этого в GeneDoc в меню Groups выберите "Edit sequences groups", затем "New group", выберите для новой группы имя и цвет, затем выделите в списке имен последовательностей те, которые вы хотите добавить к группе, "Add", "OK". Если теперь в меню Groups отметить "Shade groups conserved", то позиции, консервативные внутри группы, покрасятся в соответствующий цвет. Диагностическими правильно считать позиции, в которых все последовательности из данного таксона содержат некоторый остаток, не встречающийся в этой позиции в последовательностях, не относящихся к такосну. Годятся и позиции, в которых все остатки принадлежат какой-либо функциональной группе в пределах таксона и не принадлежат этой группе вне таксона.
     

  5. Проведите реконструкцию дерева программой fprotpars. Сколько деревьев выдала программа? Приведите в отчете скобочную формулу(ы) и изображение(я).

    Сравните полученное дерево (одно из деревьев, если их больше одного) с правильным. Если есть несовпадающие ветви, укажите, какие ветви есть в дереве, постренном fprotpars, но отсутствуют в правильном, и какие — наоборот.

    Указания. Программа fprotpars установлена на сервере kodomo-count как часть пакета EMBOSS. Программа принимает на вход выравнивание аминокислотных последовательностей.

    Информация: в программе fprotpars реализован метод максимальной бережливости (maximal parsimony). Программа выдает неукорененное дерево без длин ветвей. Ответ не всегда единственен — довольно часто программа выдает несколько "одинаково бережливых" деревьев.
     

  6. Оцените эволюционные расстояния между последовательностями программой fprotdist. Приведите в отчете матрицу расстояний (как преформатировнный текст). Насколько расстояния отклоняются от ультраметричности (на одном-двух примерах)? Насколько расстояния отклоняются от аддитивности (на каком-нибудь одном примере)?
     
  7. Получите две реконструкции дерева программой fneighbor, используя два алгоритма: UPGMA и Neighbor-Joining. Сравните результаты между собой, с результатом fprotpars и с правильным деревом.

    Указания. Программа fneighbor принимает на вход матрицу расстояний (в том же формате, в котором ее выдает программа fprotdist). По умолчанию программа использует алгоритм Neighbor-Joining. Чтобы понять, как попросить ее использовать алгоритм UPGMA, а также как установить желаемое имя файла со скобочной структурой ("tree file"), выполните команду

    fneighbor -help
    или
    tfm fneighbor

    Информация: алгоритм UPGMA выдает укорененное дерево с длинами ветвей. Его можно применять, если справедлива гипотеза молекулярных часов (матрица расстояний не слишком далека от ультраметрической). Алгоритм Neighbor-Joining выдает неукорененное дерево с длинами ветвей; не предполагает молекулярных часов.

  8. (* дополнительное) Ознакомьтесь с созданным в НИИФХБ имени А.Н. Белозерского сервисом TreeTop и опишите результаты его работы и свои впечатления.