Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~contradiction/term4/bootstrap.htm
Дата изменения: Sat Mar 24 14:37:21 2007
Дата индексирования: Tue Oct 2 14:17:38 2012
Кодировка: Windows-1251
Эволюционная модель

ЧЕТВЕРТЫЙ СЕМЕСТР

на главную страницу


:НАВИГАЦИОННОЕ МЕНЮ





BOOTSTRAP и DRAWTREE


1. Проведение бутстреп-анализа выравнивания мутированных последовательностей, соответствующих листьям моего дерева.

  • Программой fseqboot было создано 100 бутстреп-реплик выравнивания: 
    fseqboot ali.fasta -auto
    (результат был положен в файл с расширением .fseqboot).
    Получили файл ali.fseqboot - довольно-таки большой, так как содержит 100 выравниваний.
  • Полученные 100 выравниваний были поданы на вход программе fdnaml. 
    fdnaml ali.fseqboot -ttratio 1 -auto
    После почти 20 минут в выходном файле (ali.treefile) оказалось 100 скобочных формул, соответствующих реконструкциям, сделанным по каждому из выравниваний. 
  • была использована программа fconsense. В выходной файл были помещены результаты бутстреп-анализа.

    contradiction@kodomo-count:restore$ fconsense
    Majority-rule and strict consensus tree
    Phylip tree file: ali.treefile
    Phylip consense program output file [ali.fconsense]:

    Consensus tree written to file "ali.treefile"

    Output written to file "ali.fconsense"

    Done.


    *То есть содержимое файла со 100 скобочными формулами заменилось на одну консенсусную.

    (((((B:100.0,A:100.0):95.0,D:100.0):59.0,C:100.0):100.0,E:100.0):100.0,F:100.0);

    где X - название листа.

    Содержимое другого файла ali.fconsense:

     

        
    
    Consensus tree program, version 3.6b
    
    Species in order: 
    
      1. F
      2. E
      3. C
      4. D
      5. B
      6. A
    
    
    Sets included in the consensus tree
    
    Set (species in order)     How many times out of  100.00
    
    ..****                     100.00
    ....**                     95.00
    ...***                     59.00
    
    
    Sets NOT included in consensus tree:
    
    Set (species in order)     How many times out of  100.00
    
    ..**..                     23.00
    ..*.**                     18.00
    ..**.*                      3.00
    ...**.                      2.00
    
    
    Extended majority rule consensus tree
    
    CONSENSUS TREE:
    the numbers on the branches indicate the number
    of times the partition of the species into the two sets
    which are separated by that branch occurred
    among the trees, out of 100.00 trees
    
                                  +------B
                           +-95.0-|
                    +-59.0-|      +------A
                    |      |
             +100.0-|      +-------------D
             |      |
      +------|      +--------------------C
      |      |
      |      +---------------------------E
      |
      +----------------------------------F
    
    
      remember: this is an unrooted tree!
    
    
    
     
    Посмотрим на звездчато-точечные разбиения, что вошли в консенсусное дерево. с первого взгляда они похожи на то, что было в исходном дереве задании, стоит обратить внимание на порядок нумерации листьев! Там буквы не в алфавитном порядке, а в пртивоположном порядке, но это не правило - так получилось случайно, буквы вообще могут быть в разнобой.
       

     А если составить табличку разбиений станет видно:

    A B C D E F
    . . * * * *
    . . * . * *
    . . . . * *

    обращаем внимание на строчку ..*.**                     59.00 - заметим, что от 50 отличается на 9 (пускай ед. измерения будут штуки, проценты, случаи) то есть возник спорный случай (с этим мы еще сталкивались в предыдущем задании, однако консенсусное дерево НЕУКОРЕНЕННОЕ и по топологии совпадает только с НЕУКОРЕНЕННЫМИ деревьями)

2. Создание изображения моего дерева программой fdrawtree.

  • Скобочная формула была помещена в отдельный файл.
  • Файл был подан на вход fdrawtree.
  • Результат fdrawtree имеет формат postscript.


Это изображение моего дерева, дерево неукорененное, разбиения совпадают с исходным деревом, так как мы ничего не восстанавливали - лишь по готовой формуле создали изображение. Зато визуально видно, что расстояние между узлами ((A,B),C) и (D,(E,F)) очень мало. При собственно реконструкции алгоритмами, получались деревья с несколько другим разбиением, что говорит о том, что целиком и полностью на машину полагаться не стоит.

ї Бирюков