Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~Khrameeva/t3_html/tree.html
Дата изменения: Tue Dec 6 01:08:12 2005
Дата индексирования: Tue Oct 2 10:47:57 2012
Кодировка: Windows-1251
tree

Реконструкция филогенетического дерева

Ha главную страницу III семестра

Исходное филогенетическое дерево выглядит следующим образом (в виде укорененного слева, бескорневого — справа):

  1. Было построено выравнивание последовательностей, соответствующих листьям исходного дерева.

    Посмотреть файл выравнивания

  2. C помощью программы ednadist были определены эволюционные расстояния по Джуксу - Кантору между последовательностями выравнивания. В результате была получена следующая матрица:
    
    mutA        0.0000  0.2592  0.3892  0.6370  1.2445  1.3071
    mutB        0.2592  0.0000  0.4087  0.6587  1.3611  1.3071
    mutC        0.3892  0.4087  0.0000  0.6477  1.2209  1.2566
    mutD        0.6370  0.6587  0.6477  0.0000  1.0095  1.1332
    mutE        1.2445  1.3611  1.2209  1.0095  0.0000  1.4826
    mutF        1.3071  1.3071  1.2566  1.1332  1.4826  0.0000
    
  3. Были построены следующие филогенетические деревья:

    — по методу UGPMA с помощью программы eneighbor:
                                     +-------mutA      
                                 +---1  
                         +-------2   +-------mutB      
                         !       !  
         +---------------3       +-----------mutC      
         !               !  
      +--4               +-------------------mutD      
      !  !  
    --5  +-----------------------------------mutE      
      !  
      +--------------------------------------mutF
    

    (((((mutA:0.12960,mutB:0.12960):0.06988,mutC:0.19948):0.12443,
    mutD:0.32390):0.28060,mutE:0.60450):0.04416,mutF:0.64866);

    Графическое изображение дерева (слева) было получено при помощи сервиса drawtree из Online-версии пакета Phylip. Программа eneighbor построила по методу UGPMA укорененное дерево, однако на рисунке слева оно изображено как бескорневое, чтобы его было легче сравнивать с деревьями, построенными другими методами. Место корня на этом рисунке отмечено крестиком.

    Также следует отметить, что изображение дерева, полученное на выходе программы eneighbor (справа), представляет собой не кладограмму, а филограмму — полученное дерево является ультраметрическим.

    — по методу Neighbor-Joining с помощью той же программы eneighbor:
      +-----mutC      
      !  
      !      +------mutD      
    --4------2  
      !      !   +---------------------mutE      
      !      +---1  
      !          +----------------------mutF      
      !  
      !  +---mutA      
      +--3  
         +----mutB      
    

    (mutC:0.18289,(mutD:0.21813,(mutE:0.72030,mutF:0.76230):0.11192):0.22466,(mutA:0.11472,
    mutB:0.14448):0.08646);

    — по методу Maximum Likelihood с помощью программы ednaml:
      +---mutB      
      !  
      !              +------------------------mutF      
      !          +---4  
      !  +-------3   +----------------------mutE      
      !  !       !  
    --1--2       +-----mutD      
      !  !  
      !  +-----mutC      
      !  
      +---mutA  
    

    (mutB:0.13724,(((mutF:0.82444,mutE:0.76509):0.12825,
    mutD:0.19939):0.25400,mutC:0.19580):0.07974,mutA:0.12093);

    — по методу Parsimony с помощью программы ednapars:
                  +--mutF      
               +--5  
            +--4  +--mutE      
            !  !  
         +--3  +-----mutD      
         !  !  
      +--2  +--------mutC      
      !  !  
    --1  +-----------mutB      
      !  
      +--------------mutA      
    

    (((((mutF,mutE),mutD),mutC),mutB),mutA);

    Здесь надо заметить, что метод Parsimony не выдает на выходе длины ветвей, поэтому, в отличие от всех предыдущих случаев, на правом рисунке изображена кладограмма, а не филограмма.

  4. Cравнение топологии исходного филогенетического дерева модели и 4-х вариантов его реконструкции:

    ВетвьИсходное дерево моделиUPGMANJMLParsimony
    ABCDEF
    110000+++++
    111000+++++
    111100+++++

  5. Обсуждение полученных результатов, выводы и наблюдения:

    Если мы сравним все четыре изображения, полученных с помощью Phylip, с исходным деревом, то увидим, что это — одно и то же дерево, правда, с разными длинами ветвей. Значит, реконструкция хода эволюции при такого уровня расстояниях между последовательностями является надежной.

    Поскольку деревья одинаковы, то и топологии получились одинаковыми. На основе таких данных довольно трудно сделать выводы о том, какой из методов эффективнее. Поэтому сравним длины ветвей, полученные при построении деревьев разными методами, с истинными эволюционными расстояниями:

    Как можно видеть, ни один из использованных методов не определил длины ветвей с высокой точностью: средняя ошибка составляет до одной трети от истинного эволюционного расстояния. Особенно это заметно на больших расстояниях (> 75 мутаций на 100 нуклеотидов). Интересно, что на таких расстояниях лучше всего работает метод Maximum Likelihood, средне — Neighbor-Joining, и хуже всего — UPGMA. Вероятно, такой результат вызван неультраметричностью исходного дерева.

    Дело в том, что алгоритм UPGMA устроен таким образом, что за основу берется матрица эволюционных расстояний, в которой программа находит наиболее близкую пару последовательностей, объединяет их в кластер и пересчитывает для него эволюционные расстояния, а с полученной матрицей повторяет все то же самое. При этом место узла, с которым соединяется следующий кластер, определяется как среднее арифметическое. Таким образом, этот алгоритм в принципе не может восстановить неультраметрическое дерево.

    Так что ошибка заложена уже в самом факте подачи программе заведомо неультраметрического дерева, потому что, в остальном, метод UPGMA практически повторяет в обратном порядке последовательность действий, использованную при построении нашей эволюционной модели, и, если бы дерево было ультраметрическим, он должен был лучше всего подходить для реконструкции.

    Метод Neighbor-Joining, как и UPGMA, использует матрицу эволюционных расстояний, однако алгоритм здесь более сложный, и конечное дерево строится как раз таким образом, чтобы получить лучшую картину относительных длин отдельных ветвей. Этот метод подходит для реконструкции неультраметрических деревьев, но, к сожалению, полученные деревья не являются укорененными.

    Метод Maximum Likelihood не использует матрицу, а анализирует сами последовательности. Он строит все возможные (или не все, чтобы сократить время счета) деревья и оценивает вероятность того, что дерево отрадает реальную цепь событий. Лучшим деревом, естественно, считается то, для которого эта вероятность окажется максимальной. В нашем случае этот метод дал меньше ошибок в длинах ветвей, по крайней мере, на больших расстояниях, но постороенное дерево также является неукорененным.

    Метод Parsimony ("максимальной экономии") также основывается на анализе последовательностей. Он строит все возможные деревья и ставит им "оценки" в соответствии с числом эволюционных событий. Лучшим деревом считается то, для которого число эволюционных событий наименьшее. Этот метод не выдает информацию о длинах ветвей, поэтому здесь ничего нельзя сказать о его качестве. Онако считается, что он работает хорошо только при числе мутаций, меньшем, чем 20 на 100 нуклеотидов.


© Храмеева Екатерина, 2005