Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~Khrameeva/t4_html/Practice9.html
Дата изменения: Mon May 22 16:39:41 2006
Дата индексирования: Tue Oct 2 13:46:26 2012
Кодировка: Windows-1251
Practice9

Исследование филогенетического дерева семейства MIP, PF00230, из таксонов Bacillales, Pasteurellaceae и Escherichia

Ha главную страницу IV семестра

  1. Составление выборки аминокислотных последовательностей
  2. С помощью SRS в БД UniProt были найдены аминокислотные последовательности, соответствующие заданной выборке. Результат поиска был отфильтрован (удалены короткие фрагменты и белки, принадлежащие другому штамму организма). Аминокислотные последовательности были сохранены в формате FASTA2Seq:

    Посмотреть результат (файл Seq.txt)

    Перечень организмов выборки был сохранен в отдельный файл:

    Посмотреть результат (файл Taxon_names.txt)

  3. Построение филогенетического дерева
  4. Множественное выравнивание последовательностей выборки было построено с помощью программы ClustalX, а филогенетическое дерево (скобочная формула) реконструировано по алгоритму ближайших соседей (Neighbour-Joining). Изображение дерева было получено с помощью программы GeneMaster:

    Посмотреть результат (файл Tree.gdt)

    На схеме дерева красным цветом выделены ветви и вершины, соответствующие архейным белкам. Жирным шрифтом с подчеркиванием выделены ветви и вершины внешней группы.

  5. Построение таксономического дерева
  6. С помощью веб-сайта NCBI по списку Taxon_names.txt (из которого предварительно были удалены точки и некоторые указания на штаммы, которые программа не распознавала, — в этих случаях оставлен только род и вид) было построено таксономическое дерево и сохранено в текстовом формате и в виде скобочной формулы.

    После редактирования скобочная формула была импортирована в GeneMaster, и по ней построено следующее дерево:

    Надо отметить, что рода Sulfolobus и Staphylococcus программа почему-то не сохранила (см. текстовый формат), но на схеме в браузере эти рода присутствовали. Поэтому рода Sulfolobus и Staphylococcus были вручную вписаны в скобочную формулу, и только после этого она была импортирована в GeneMaster.

  7. Анализ дерева
  8. Чтобы было удобнее ориентироваться на анализируемом филогенетическом дереве, AC и ID белков были заменены на родовые и видовые названия организмов, которым белки принадлежат.

    На следующем рисунке разными цветами выделены наиболее вероятные пары ортологов, подчеркиванием разных цветов — наиболее вероятные пары паралогов. Красным цветом выделены ветви, ведущие к архейным белкам, жирным шрифтом с подчеркиванием — внешняя группа.

    Посмотреть раскраску на дереве с ID и AC белков (файл COPY.GDT)

    Пары ортологов выбирались таким образом, чтобы последовательности из одной пары принадлежали разным видам и имели общего предка (для упрощения рассматривались только пары ортологов, в которых последовательности непосредственно выходят из одного узла дерева). Пары паралогов выбирались по такому принципу, чтобы последовательности из одной пары принадлежали одному виду и возникали в результате дупликации гена в одном общем предке (для упрощения также выбирались только пары паралогов, в которых последовательности непосредственно выходят из одного узла). Кроме того, для каждой пары ортологов или паралогов по таксономическому дереву проверялось, не противоречит ли ему сделанный выбор (действительно ли у организмов имеется общий предок, не произошло ли горизонтального переноса и т.п.).

    Конечно, ортологичными и паралогичными могут быть не только последовательности, выходящие на дереве из одного узла, но и более удаленные. На следующем рисунке представлены некоторые такие группы ортологов (при выборе групп учитывалась относительная близость расположения организмов на таксономическом дереве, наличие общего предка и принадлежность последовательностей к разным видам). В пределах одной группы все последовательности ортологичны друг другу, за исключением встречающихся пар паралогов, которые, конечно, не ортологичны друг другу, но зато ортологичны всем остальным последовательностям группы:

    Заметим также, что паралогичными могут, в принципе, считаться любые последовательности, принадлежащие одному организму, в какой части дерева они бы ни находились.

    Кроме того, стоит обратить внимание на последовательность из внешней группы, принадлежащую Homo sapiens, которая попала на бактериальную ветку. Похоже, в данном случае мы имеем дело с горизонтальным переносом.


© Храмеева Екатерина, 2006