Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~Khrameeva/t3_html/tree.html
Дата изменения: Tue Dec 6 01:08:12 2005 Дата индексирования: Tue Oct 2 10:47:57 2012 Кодировка: Windows-1251 |
Исходное филогенетическое дерево выглядит следующим образом (в виде укорененного слева, бескорневого справа):
mutA 0.0000 0.2592 0.3892 0.6370 1.2445 1.3071 mutB 0.2592 0.0000 0.4087 0.6587 1.3611 1.3071 mutC 0.3892 0.4087 0.0000 0.6477 1.2209 1.2566 mutD 0.6370 0.6587 0.6477 0.0000 1.0095 1.1332 mutE 1.2445 1.3611 1.2209 1.0095 0.0000 1.4826 mutF 1.3071 1.3071 1.2566 1.1332 1.4826 0.0000
по методу UGPMA с помощью программы eneighbor:
Графическое изображение дерева (слева) было получено при помощи сервиса drawtree из Online-версии пакета Phylip. Программа eneighbor построила по методу UGPMA укорененное дерево, однако на рисунке слева оно изображено как бескорневое, чтобы его было легче сравнивать с деревьями, построенными другими методами. Место корня на этом рисунке отмечено крестиком.
Также следует отметить, что изображение дерева, полученное на выходе программы eneighbor (справа), представляет собой не кладограмму, а филограмму полученное дерево является ультраметрическим.
+-------mutA
+---1
+-------2 +-------mutB
! !
+---------------3 +-----------mutC
! !
+--4 +-------------------mutD
! !
--5 +-----------------------------------mutE
!
+--------------------------------------mutF
(((((mutA:0.12960,mutB:0.12960):0.06988,mutC:0.19948):0.12443,
mutD:0.32390):0.28060,mutE:0.60450):0.04416,mutF:0.64866);
по методу Neighbor-Joining с помощью той же программы eneighbor:
+-----mutC
!
! +------mutD
--4------2
! ! +---------------------mutE
! +---1
! +----------------------mutF
!
! +---mutA
+--3
+----mutB
(mutC:0.18289,(mutD:0.21813,(mutE:0.72030,mutF:0.76230):0.11192):0.22466,(mutA:0.11472,
mutB:0.14448):0.08646);
по методу Maximum Likelihood с помощью программы ednaml:
+---mutB
!
! +------------------------mutF
! +---4
! +-------3 +----------------------mutE
! ! !
--1--2 +-----mutD
! !
! +-----mutC
!
+---mutA
(mutB:0.13724,(((mutF:0.82444,mutE:0.76509):0.12825,
mutD:0.19939):0.25400,mutC:0.19580):0.07974,mutA:0.12093);
по методу Parsimony с помощью программы ednapars:
+--mutF
+--5
+--4 +--mutE
! !
+--3 +-----mutD
! !
+--2 +--------mutC
! !
--1 +-----------mutB
!
+--------------mutA
(((((mutF,mutE),mutD),mutC),mutB),mutA);
Здесь надо заметить, что метод Parsimony не выдает на выходе длины ветвей, поэтому, в отличие от всех предыдущих случаев, на правом рисунке изображена кладограмма, а не филограмма.
Ветвь | Исходное дерево модели | UPGMA | NJ | ML | Parsimony |
ABCDEF | |||||
110000 | + | + | + | + | + |
111000 | + | + | + | + | + |
111100 | + | + | + | + | + |
Если мы сравним все четыре изображения, полученных с помощью Phylip, с исходным деревом, то увидим, что это одно и то же дерево, правда, с разными длинами ветвей. Значит, реконструкция хода эволюции при такого уровня расстояниях между последовательностями является надежной.
Поскольку деревья одинаковы, то и топологии получились одинаковыми. На основе таких данных довольно трудно сделать выводы о том, какой из методов эффективнее. Поэтому сравним длины ветвей, полученные при построении деревьев разными методами, с истинными эволюционными расстояниями:
Как можно видеть, ни один из использованных методов не определил длины ветвей с высокой точностью: средняя ошибка составляет до одной трети от истинного эволюционного расстояния. Особенно это заметно на больших расстояниях (> 75 мутаций на 100 нуклеотидов). Интересно, что на таких расстояниях лучше всего работает метод Maximum Likelihood, средне Neighbor-Joining, и хуже всего UPGMA. Вероятно, такой результат вызван неультраметричностью исходного дерева.
Дело в том, что алгоритм UPGMA устроен таким образом, что за основу берется матрица эволюционных расстояний, в которой программа находит наиболее близкую пару последовательностей, объединяет их в кластер и пересчитывает для него эволюционные расстояния, а с полученной матрицей повторяет все то же самое. При этом место узла, с которым соединяется следующий кластер, определяется как среднее арифметическое. Таким образом, этот алгоритм в принципе не может восстановить неультраметрическое дерево.
Так что ошибка заложена уже в самом факте подачи программе заведомо неультраметрического дерева, потому что, в остальном, метод UPGMA практически повторяет в обратном порядке последовательность действий, использованную при построении нашей эволюционной модели, и, если бы дерево было ультраметрическим, он должен был лучше всего подходить для реконструкции.
Метод Neighbor-Joining, как и UPGMA, использует матрицу эволюционных расстояний, однако алгоритм здесь более сложный, и конечное дерево строится как раз таким образом, чтобы получить лучшую картину относительных длин отдельных ветвей. Этот метод подходит для реконструкции неультраметрических деревьев, но, к сожалению, полученные деревья не являются укорененными.
Метод Maximum Likelihood не использует матрицу, а анализирует сами последовательности. Он строит все возможные (или не все, чтобы сократить время счета) деревья и оценивает вероятность того, что дерево отрадает реальную цепь событий. Лучшим деревом, естественно, считается то, для которого эта вероятность окажется максимальной. В нашем случае этот метод дал меньше ошибок в длинах ветвей, по крайней мере, на больших расстояниях, но постороенное дерево также является неукорененным.
Метод Parsimony ("максимальной экономии") также основывается на анализе последовательностей. Он строит все возможные деревья и ставит им "оценки" в соответствии с числом эволюционных событий. Лучшим деревом считается то, для которого число эволюционных событий наименьшее. Этот метод не выдает информацию о длинах ветвей, поэтому здесь ничего нельзя сказать о его качестве. Онако считается, что он работает хорошо только при числе мутаций, меньшем, чем 20 на 100 нуклеотидов.
© Храмеева Екатерина, 2005