Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~Try2Fly/t3_files/Pract13.htm
Дата изменения: Mon Dec 19 14:56:04 2005
Дата индексирования: Tue Oct 2 11:33:35 2012
Кодировка: Windows-1251
Реконструкция филогенетического дерева

Реконструкция филогенетического дерева с помощью различных методов

  • Изображение исходного дерева
    (расстояния указаны в числе мутаций на 100 п.н.):

  • Матрица попарных расстояний между листьями данного дерева (определена по методу Джукса-Кантора с помощью программы
    ednadist):

         A       B       C       D       E       F
  A   0,0000  0,2913  0,6018  1,0311  1,5397  1,3701
  B   0,2913  0,0000  0,5890  1,1477  1,5859  1,4162
  C   0,6018  0,5890  0,0000  1,0964  1,3525  1,3525
  D   1,0311  1,1477  1,0964  0,0000  1,4162  1,3101
  E   1,5397  1,5859  1,3525  1,4162  0,0000  1,3101
  F   1,3701  1,4162  1,3525  1,3101  1,3101  0,0000 
  • Изображение дерева, реконструированного методом UPGMA
    (с помощью программы eneighbor):

                                      +--------A
                             +--------1  
              +--------------2        +--------B
              !              !  
    +---------3              +-----------------C
    !         !  
  --5         +--------------------------------D
    !  
    !  +---------------------------------------E
    +--4  
       +---------------------------------------F 
((((A:0.14565,B:0.14565):0.15205,C:0.29770):0.24817,D:0.54587):0.16308, (E:0.65505,F:0.65505):0.05390);
  • Изображение дерева, реконструированного методом Neighbor-Joining
    (с помощью программы eneighbor):

                         +---------------------E  
                   +-----1  
           +-------2     +-----------------F    
           !       !  
     +-----3       +---------------D         
     !     !  
     !     +-------C         
     !  
   --4----B         
     !  
     +---A
((((E:0.71073,F:0.59937):0.19873,D:0.50937):0.27479,C:0.26808):0.18167, B:0.16279,A:0.12851);
  • Изображение дерева, реконструированного методом Maximum
    Likelihood (с помощью программы ednaml):

      +--B         
      !  
      !  +------C           
    --4--3  
      !  !      +-------------D         
      !  +------2  
      !         !      +----------------------E    
      !         +------1  
      !                +-----------------F       
      !  
      +--A
(B:0.16025,(C:0.34139,(D:0.69702,(E:1.15396,F:0.88439):0.32950):0.34613):0.17212, A:0.14954);
  • Изображение дерева, реконструированного методом Maximum
    Parsimony
    (с помощью программы ednapars):
            
                     +-----------B         
                  +--5  
                  !  !  +--------C         
                  !  +--4  
                  !     !  +-----D         
                --1     +--3  
                  !        !  +--F         
                  !        +--2  
                  !           +--E         
                  !  
                  +--------------A                

((B,(C,(D,(F,E)))),A);

  • Следует отметить, что только дерево, построенное методом UPGMA, является укорененным, на всех остальных схемах корень выполняет чисто декоративные функции;
  • Алгоритм UPGMA строит ультраметрическое дерево, а Parsimony не считает дистанции;
  • Алгоритмы UPGMA и N.-J. используют матрицу попарных расстояний, а Maximum Parsimony/Likelihood являются символьно-ориентированными (требуют на вход выравнивание);
  • Узлы пронумерованы каждым методом произвольно.

  • Сравнение топологий приведенных выше деревьев:
ABCDEF"Истина"UPGMAN.-J.LikelihoodParsimony
111100+++++
111000+++++
110000+++++


     Как можно видеть из таблицы, топология всех реконструированных деревьев совпадает с истинной. А метод UPGMA к тому же нашел правильное положение корня. Однако по данной таблице невозможно адекватно оценить эффективность алгоритмов, поэтому стоит сравнить определенные расстояния (в этом случае метод Parsimony "сходит с дистанции" потому что, как было указано выше, он их не находит).
 

  • Сравнение расстояний, определенных различными методами
    (деревья рассматриваются как неукорененные; расстояния округлены
    до целых):
Расстояние"Истина"UPGMAN.-J.Likelihood
AB-A20151315
AB-B20151616
AB-ABC20151817
C-ABC40302734
ABC-ABCD35252735
D-ABCD85555170
EF-ABCD30212033
EF-E856571115
EF-F85656088
Средняя ошибка
|[оцененное расстояние]-[истинное расстояние]|/[количество оценок]:
 13138


     Из этой таблицы видно, что наиболее точным оказался метод Maximum Likelihood, что является вполне ожидаемым результатом, так как это единственный (кроме метода Maximum Parsimony, не определяющего расстояния) переборный метод, участвующий в данном сравнении. Известно, что переборные алгоритмы отличаются большей эффективностью чем эвристические, в обмен на намного меньшую скорость работы. Однако, если внимательнее присмотреться к конкретным оценкам длин, можно заметить, что результаты алгоритма UPGMA выделяются своей "пропорциональностью" – равным по длине ветвям, он присваивает равные значения расстояний. Мне сложно обьяснить этот факт, но я предполагаю, что если бы мое дерево было ультраметрическим, алгоритм UPGMA показал бы намного (если не вообще) лучшие результаты.
     Таким образом выбор наиболее эффективного алгоритма во многом зависит непосредственно от поставленной задачи.