Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~lohmatikov/t3_files/PHYLIP.html
Дата изменения: Sat Dec 17 16:38:42 2005
Дата индексирования: Tue Oct 2 13:12:47 2012
Кодировка: Windows-1251
Пакет PHYLIP На главную страницу третьего семестра

Анализ и визуализация деревьев в пакете PHYLIP

   Программы пакета PHYLIP используются для построения и визуализации филогенетических деревьев. Исследованы два метода восстановления филогенетических деревьев — Bootstrap и Jackknife. Оба они основаны на том, что из имеющегося выравнивания последовательностей они случайным образом создают некоторое количество новых и строят не одно, а группу деревьев. После сравнения топологий этих деревьев методом Maximum Likelihood строится консенсусное дерево, на котором представлены ветви, чаще всего встречающиеся среди построенных деревьев.
   В качестве исходных последовательностей были выбраны листья дерева, корнем которого является кодирующая нуклеотидная последовательность белка FHUA_ECOLI.

Bootstrap-анализ выравнивания мутированных последовательностей, соответствующих листьям дерева

   Алгоритм Bootstrap основан на том, что новые выравнивания создаются из исходного путем замены 50% позиций в исходном выравнивании на другие столбцы этого выравнивания (программа seqboot.exe). По полученным выравниваниям было построено 100 деревьев, причем значение отношения транзиций и трансверсий было выбрано равным 1 (программа dnaml.exe). Затем было создано консенсусное дерево (программа consence.exe), которое представлено ниже.
                +--------------------leafC
         +100.0-|
         |      |      +-------------leafD
         |      +100.0-|
  +------|             |      +------leafF
  |      |             +-80.0-|
  |      |                    +------leafE
  |      |
  |      +---------------------------leafA
  |
  +----------------------------------leafB
   Примечание: на внутренних ветвях консенсусного дерева указан процент встречаемости их в 100 построенных деревьях (бутстреп-значения).

Jackknife-анализ выравнивания мутированных последовательностей, соответствующих листьям дерева

   Методом Jackknife из исходного выравнивания случайным образом вырезает половину ветвей — так появляются новые выравнивания, на основании которых строится консенсусное дерево. Использованы те же программы, что и для Bootstrap, было построено 100 деревьев, отношение транзиций к трансверсиям выбрано равным единице.
  +---------------------------leafD
  |
  |                    +------leafB
  |             +100.0-|
  |      +-99.0-|      +------leafA
  |      |      |
  +------|      +-------------leafC
         |
         |             +------leafF
         +--------87.0-|
                       +------leafE
   Оба метода реконструировали дерево с правильной топологией, то есть бутстреп-значения внутренних ветвей консенсусного и реального деревьев совпали. Все выданные бутстреп-значения и джекнайф-значения для внутренних ветвей оказались больше 70%, а значит, их можно принять за достоверные и не рассматривать остальные возможные внутренние ветви.

Графические изображения дерева

   С помощью программы drawtree.exe создано два графических изображения дерева, полученного методом Neighbor-Joining: в бескорневом виде и в виде филограммы, ориентированной горизонтально и укорененной в среднюю точку. Для переукоренения дерева была использована программа retree.exe.
   Ниже представлены полученные изображения деревьев (слева — в бескорневом виде, справа — в виде филограммы).

Восстановление предковой последовательности для выравнивания

   Пакет PHYLIP также позволяет восстанавливать предковые последовательности (узлы дерева) по выравниванию имеющихся (листьев дерева). Была использована программа dnaml.exe.

Получившееся дерево

  +---leafB     
  |  
  |             +-----------------------------------leafF     
  |         +---4  
  |  +------3   +--------------------leafE     
  |  |      |  
  1--2      +----------leafD     
  |  |  
  |  +-----leafC     
  |  
  +---leafA     

   Использование алгоритма Maximum Likelihood не предполагает восстановление корня, поэтому последовательности всех четырех узлов были сравнены с геном моего белка (выравнивание программой needle без гэпов, поскольку гэпы не использовались при внесении мутаций).
   Выравнивания для узла1, узла 2, узла 3, узла 4 с корнем.
   Из представленных выравниваний можно заключить, что наиболее близки к предковой последовательности последовательности узлов 3 и 4 (у них больше процент Identity и Similarity).

   Затем узлы исходного дерева были сравнены с узлами, полученными с помощью примененного алгоритма (поскольку он выдал дерево правильной топологии). Нумерация узлов, выданных программой, немного отличается от той, которая была изначально принята.
   Выравнивания для узла1, узла 2, узла 3, узла 4, восстановленых алгоритмом, с соответствующими узлами исходного дерева.
   Из приведенных выравниваний видно, что наибольшие проценты Identity получаются для узлов, расстояния от которых до ближайших листьев по дереву меньше, чем для других. Это связано с тем, что при мутации этих узлов в листья было произведено меньшее число замен, и следовательно, они могут быть восстановлены с большей точностью.

   Важно заметить, что в некоторых позициях алгоритм не восстанавливает нуклеотид точно. Вместо конкретных нуклеотидов в этих позициях указывается символ, обозначающий любой из нескольких возможных нуклеотидов. Эти обозначения включены и в матрицу замен, которую использует needle, и из-за наличия в выравнивании букв, отличных от A, G, C, T, значения для процентов Identity и Similarity отличаются.
   Со списком обозначений можно ознакомиться на сайте EBI.

На главную страницу третьего семестра


© Лохматиков Алексей,2005