Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~ksenechka91/algoritm.html
Дата изменения: Wed Mar 10 01:39:26 2010
Дата индексирования: Tue Oct 2 04:09:36 2012
Кодировка: Windows-1251
Report1/Term4/2008

Занятие 3.

Укоренение дерева в среднюю точку

Ранее было построено дерево с помощью метода neighbor-joining по группе белков факторов элонгации трансляции Ts из различных организмов:
Neighbor-joining:(неукорененное дерево)

Скобочная формула:
(EFTS_RHOS4:0.29082,(EFTS_RALPJ:0.47740,(EFTS_PSEAE:0.35108,
(EFTS_YERPE:0.11652,(EFTS_ERWCT:0.04115,EFTS_ECOLI:0.02548):0.08225):0.19624):0.05816):0.19958,EFTS_AGRRK:0.27895);


  +----------------EFTS_RHOS4
  ! 
  !           +----------------------------EFTS_RALPJ
  1-----------4 
  !           !  +---------------------EFTS_PSEAE
  !           +--5 
  !              !           +------EFTS_YERPE
  !              +-----------3 
  !                          !    +--EFTS_ERWCT
  !                          +----2 
  !                               +-EFTS_ECOLI
  ! 
  +----------------EFTS_AGRRK

С помощью программы retree пакета PHYLIP это дерево было укоренено в среднюю точку.

Результат работы программы приведен ниже:


Итак, укоренение произошло в ветвь 1-4 (если смотреть на дерево, построенное методом neighbor-joining), причем полученное укорененное дерево совпадает с правильным.

Использование аутгруппы

Необходимо реконструировать программой fprotpars укорененное дерево отобранных мной бактерий, используя то же семейство белков, что и в предыдущем задании, а в качестве аутгруппы - белок того же семейства из сенной палочки (Bacillus subtilis, BACSU). Чтобы получить последовательность белка EFTS_BACSU из Swiss-Prot, я использовала следующую программу:

seqret sw:EFTS_BACSU -outseq EFTS_BACSU.fasta

Чтобы добавить к файлу с невыровненными последовательностями белков протеобактерий последовательность белка из сенной палочки, я вбила команду:

seqret sw:EFTS_BACSU stdout >> EFTS.fasta

Далее необходимо построить выравнивание всех последовательностей, отредактировав имена (оставив только мнемонику видов), и результат подать на вход программе fprotpars.

Получаем выравнивания:

muscle -in EFTS.fasta -out EFTS_aligned_second.fasta

Даем результат на вход программе fprotpars: fprotpars -sequence EFTS_aligned_second.fasta

Получаем:

(((BACSU,((((ECOLI,ERWCT),YERPE),PSEAE),RALPJ)),RHOS4),AGRRK);

One most parsimonious tree found:




        +--------------BACSU     
        !  
        !           +--ECOLI     
        !        +--7  
     +--3     +--6  +--ERWCT     
     !  !     !  !  
     !  !  +--5  +-----YERPE     
     !  !  !  !  
  +--2  +--4  +--------PSEAE     
  !  !     !  
  !  !     +-----------RALPJ     
  1  !  
  !  +-----------------RHOS4     
  !  
  +--------------------AGRRK     

  remember: this is an unrooted tree!


requires a total of    931.000
Укорененное дерево выглядит следующим образом:


Полученное дерево, как и в предыдущем пункте, не отличается от правильного, а укоренение произошло между подмножествами {RHOS4;AGRRK} и {RALPJ;PSEAE;YERPE;ECOLI;ERWCT}.

Бутстреп

С помощью программ fseqboot, fprotpars и fconsense было создано 100 бутстреп-реплик выравнивания белков протеобактерий, по этим репликам были построены деревья, а после этого было создано единое дерево по принципу "расширенного большинства". Полученное дерево (совпало с предыдущими):


                                     +------EFTS RHOS4
                              +100.0-|
                       +-98.0-|      +------EFTS AGRRK
                       |      |
                +100.0-|      +-------------EFTS RALPJ
                |      |
         +-98.5-|      +--------------------EFTS PSEAE
         |      |
  +------|      +---------------------------EFTS YERPE
  |      |
  |      +----------------------------------EFTS ERWCT
  |
  +-----------------------------------------EFTS ECOLI

Было найдено 7 ветвей, не получивших поддержку, среди них правильных не оказалось:
{ERWCT;YERPE} против {ECOLI;PSEAE;RALPJ;RHOS4;AGRRK}       1.50
{PSEAE;RHOS4;AGRRK} против {ECOLI;ERWCT;YERPE;RALPJ}       1.00
{PSEAE;RALPJ} против {ECOLI;ERWCT;YERPE;RHOS4;AGRRK}       1.00