BOOTSTRAP и DRAWTREE
1. Проведение бутстреп-анализа выравнивания мутированных последовательностей, соответствующих листьям
моего дерева.
- Программой fseqboot было создано 100 бутстреп-реплик выравнивания:
fseqboot ali.fasta -auto
(результат был положен в файл с расширением
.fseqboot).
Получили файл ali.fseqboot - довольно-таки
большой, так как содержит 100 выравниваний.
- Полученные 100 выравниваний были
поданы на вход программе fdnaml.
fdnaml ali.fseqboot -ttratio 1 -auto
После почти 20 минут в выходном файле
(ali.treefile) оказалось 100 скобочных формул, соответствующих реконструкциям, сделанным по каждому из выравниваний.
- была использована программа fconsense. В выходной файл
были помещены результаты бутстреп-анализа.
contradiction@kodomo-count:restore$ fconsense
Majority-rule and strict consensus tree
Phylip tree file: ali.treefile
Phylip consense program output file [ali.fconsense]:
Consensus tree written to file "ali.treefile"
Output written to file "ali.fconsense"
Done.
*То есть содержимое файла со 100 скобочными
формулами заменилось на одну
консенсусную.
(((((B:100.0,A:100.0):95.0,D:100.0):59.0,C:100.0):100.0,E:100.0):100.0,F:100.0);
где X - название листа.
Содержимое другого файла ali.fconsense:
Consensus tree program, version 3.6b
Species in order:
1. F
2. E
3. C
4. D
5. B
6. A
Sets included in the consensus tree
Set (species in order) How many times out of 100.00
..**** 100.00
....** 95.00
...*** 59.00
Sets NOT included in consensus tree:
Set (species in order) How many times out of 100.00
..**.. 23.00
..*.** 18.00
..**.* 3.00
...**. 2.00
Extended majority rule consensus tree
CONSENSUS TREE:
the numbers on the branches indicate the number
of times the partition of the species into the two sets
which are separated by that branch occurred
among the trees, out of 100.00 trees
+------B
+-95.0-|
+-59.0-| +------A
| |
+100.0-| +-------------D
| |
+------| +--------------------C
| |
| +---------------------------E
|
+----------------------------------F
remember: this is an unrooted tree!
Посмотрим на
звездчато-точечные разбиения, что вошли в
консенсусное дерево.
с первого взгляда они похожи на то, что было в
исходном дереве задании, стоит обратить внимание на порядок
нумерации листьев! Там
буквы не в алфавитном порядке, а в
пртивоположном порядке, но это не правило
- так получилось случайно, буквы вообще
могут быть в разнобой.
А если составить
табличку разбиений станет видно:
A B C D E F
. . * * * *
. . * . * *
. . . . * *
обращаем
внимание на строчку
..*.**
59.00 - заметим, что от 50 отличается на 9 (пускай
ед. измерения будут штуки, проценты,
случаи) то есть возник спорный случай (с
этим мы еще сталкивались в предыдущем
задании, однако консенсусное дерево
НЕУКОРЕНЕННОЕ и по топологии совпадает
только с НЕУКОРЕНЕННЫМИ деревьями)
2. Создание изображения моего дерева программой fdrawtree.
- Скобочная формула была помещена
в отдельный файл.
- Файл был подан на вход fdrawtree.
- Результат fdrawtree имеет формат
postscript.
Это изображение моего дерева, дерево
неукорененное, разбиения совпадают с
исходным деревом, так как мы ничего не
восстанавливали - лишь по готовой формуле
создали изображение. Зато визуально видно,
что расстояние между узлами ((A,B),C) и (D,(E,F))
очень мало. При собственно реконструкции
алгоритмами, получались деревья с
несколько другим разбиением, что говорит о
том, что целиком и полностью на машину
полагаться не стоит.
ї
Бирюков
|