Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~lesya/1tree.html
Дата изменения: Mon Mar 8 22:11:02 2010
Дата индексирования: Mon Oct 1 22:32:08 2012
Кодировка:
Untitled Document

 

Задание 1.

Из предложенного списка мною выбраны следующие протеобактерии :

AGRRK , BURCA , ENT38 , SALTY , YERPE , VIBFM , PROMH , PASMU .

1. Дерево выбранных организмов выглядит следующим образом:

2. Скобочная формула дерева:

(((((((SALTY,ENT38),YERPE),PROMH),PASMU),VIBFM),BURCA),AGRRK)

3. Список нетривиальных ветвей:

{SALTY, ENT38} против {YERPE, PROMH, PASMU, VIBFM, BURCA, AGRRK}

{SALTY, ENT38, YERPE} против {PROMH, PASMU, VIBFM, BURCA, AGRRK}

{SALTY, ENT38, YERPE, PROMH} против {PASMU, VIBFM, BURCA, AGRRK}

{SALTY, ENT38, YERPE, PROMH, PASMU} против {VIBFM, BURCA, AGRRK}

{SALTY, ENT38, YERPE, PROMH, PASMU, VIBFM} против {BURCA, AGRRK}

Всего 5 нетривиальных ветвей.

Задание 2.

1. Пользуясь таксономическим сервисом NCBI: http://www.ncbi.nlm.nih.gov/taxonomy/, определяем к каким таксонам относятся отобранныебактерии:

Agrobacterium tumifaciens AGRRK Alphaproteobacteria, Rhizobiales, Rhizobium/Agrobacterium group, Agrobacterium
Burkholderia cenocepacia BURCA Betaproteobacteria; Burkholderiales; Burkholderiaceae; Burkholderia; Burkholderia cepacia complex
Enterobacter sp. 638 ENT38 Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae;Enterobacter
Salmonella typhimurium SALTY Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Salmonella; Salmonella enterica; Salmonella enterica subsp. enterica
Yersinia pestis YERPE  Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Yersinia
Vibrio fischeri VIBFM Gammaproteobacteria; Vibrionales; Vibrionaceae; Aliivibrio
Pasteurella multocida PASMU  Gammaproteobacteria; Pasteurellales; Pasteurellaceae; Pasteurella
Proteus mirabilis PROMH  Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Proteus

Ветвь {SALTY, ENT38, YERPE, PROMH} относится к группе  Enterobacteriaceae.

2. Из банка SwissProt получили последовательности белков с данной функцией из отобранных бактерий. Файл fastaENO.fasta .

3. Создали файл с выравниванием этих последовательностей с помощью программы muscle. Файл fastaENO_aligned.fasta .

4. Выравнивание в программе GeneDoc:

Зелёным цветом выделена выделены организмы,относящиеся к Enterobacteriaceae.

5. Проведём реконструкцию дерева программой fprotpars. Получили одно единственное дерево,однако оно не совпадает с нашим первоначальным вариантом.

  
               +--BURCA 
+--------------7 
!              +--AGRRK 
! 
!                 +--SALTY 
+--6           +--5 
!  !        +--4  +--ENT38 
!  !        !  ! 
!  !     +--3  +-----YERPE 
1  !     !  ! 
!  +-----2  +--------PROMH 
!        ! 
!        +-----------VIBFM 
! 
+--------------------PASMU 

6. С помощью программы fprotdist получили матрицу расстояний.
 
              PASMU     VIBFM     PROMH    YERPE      ENT38     SALTY     AGRRK     BURCA
PASMU       0.000000  0.136271  0.126878  0.137152  0.162247  0.141131  0.548605  0.461776
VIBFM       0.136271  0.000000  0.152839  0.124280  0.165555  0.142313  0.556635  0.481022
PROMH       0.126878  0.152839  0.000000  0.108578  0.112869  0.095445  0.562791  0.482655
YERPE       0.137152  0.124280  0.108578  0.000000  0.067687  0.061042  0.535921  0.464425
ENT38       0.162247  0.165555  0.112869  0.067687  0.000000  0.041455  0.558296  0.469612
SALTY       0.141131  0.142313  0.095445  0.061042  0.041455  0.000000  0.546852  0.460170
AGRRK       0.548605  0.556635  0.562791  0.535921  0.558296  0.546852  0.000000  0.456606
BURCA       0.461776  0.481022  0.482655  0.464425  0.469612  0.460170  0.456606  0.000000

Проверим выполняется ли свойство ультраметричности.

Выберем три группы организмов: YERPE, PASMU, AGRRK. И проверим,выполняется ли :

d(YERPE, PASMU) < d(YERPE, AGRRK) ; d(YERPE, PASMU) < d(AGRRK, PASMU) ; d(YERPE, AGRRK) равно d(AGRRK, PASMU).

d(YERPE, PASMU) = 0.137152

d(YERPE, AGRRK) = 0.535921

d(AGRRK, PASMU) = 0.548605

Действительно,можно скзать что свойство ультраметричности в принципе выполняется.

Проверим свойство аддитивности для данной матрицы.

Для проверки берём такие организмы: YERPE, ENT38, PROMH, SALTY.

d(YERPE, ENT38)+d(PROMH, SALTY) = d(YERPE,SALTY )+d(ENT38, PROMH)

Получаем, что 0,163132= 0,173911,но различие в подсчёте в одну сотую считаем допустимым.

И тогда необходимо проверить,чтобы: d(YERPE, PROMH)+ d(ENT38,SALTY ) была меньше других сумм.

Получим: 0,153128. Эта сумма,действительно меньше других полученных нами сумм.Следовательно,считаем,что свойство аддитивности тоже выполняется.

7. Получим две реконструкции дерева программой fneighbor, используя два алгоритма: UPGMA и Neighbor-Joining. 
 Neighbor-joining method

 Negative branch lengths allowed


  +---VIBFM     
  ! 
  !   +---PROMH     
  ! +-4 
  ! ! ! +-YERPE     
  ! ! +-3 
  ! !   ! +-ENT38     
  5-6   +-2 
  ! !     +SALTY     
  ! ! 
  ! !            +---------------AGRRK     
  ! +------------1 
  !              +----------BURCA     
  ! 
  +---PASMU  

Данная реконструкция дерева не соответствует моему исходному варианту,отличаяь от него наличием пары AGRRK-BURCA.
  
 UPGMA method 

 Negative branch lengths allowed
   

               +---PASMU     
             +-4 
             ! +---VIBFM     
  +----------5 
  !          ! +--PROMH     
  !          +-3 
  !            ! +-YERPE     
  !            +-2 
--7              ! +ENT38     
  !              +-1 
  !                +SALTY     
  ! 
  ! +------------AGRRK     
  +-6 
    +------------BURCA   

Дерево, полученное через второй алгоритм тоже не совпадает с первоначальным вариантом,наличием уже двух "нововведённых" ветвей: и PASMU-VIBFM.

8.  Ознакомимся с созданным в НИИФХБ имени А.Н. Белозерского сервисом TreeTop .

Запустив на вход программы выравнивание в фаста-формате получила две реконструкции дерева,выполненные разными алгоритмами (топологическим и кластерным) ,матрицу расстояний и графическое изображение дерева.

Матрица перехода между бактериями имеет вид:

           1     2     3     4     5     6     7     8     
 1 PASMU  0.000 0.136 0.123 0.142 0.156 0.139 0.367 0.321
 2 VIBFM  0.136 0.000 0.143 0.130 0.153 0.141 0.366 0.330
 3 PROMH  0.123 0.143 0.000 0.119 0.125 0.107 0.374 0.325
 4 YERPE  0.142 0.130 0.119 0.000 0.079 0.073 0.360 0.313
 5 ENT38  0.156 0.153 0.125 0.079 0.000 0.062 0.369 0.319
 6 SALTY  0.139 0.141 0.107 0.073 0.062 0.000 0.364 0.311
 7 AGRRK  0.367 0.366 0.374 0.360 0.369 0.364 0.000 0.301
 8 BURCA  0.321 0.330 0.325 0.313 0.319 0.311 0.301 0.000


Графическое изображение дерева,при использовании кластерного алгоритма:




Можно сказать,что дерево отличается от исходного варианта наличием пары AGRRK-BURCA,но в принципе при укоренении этого дерева
вероятнее всего мы получим мой первоначальный вариант.

Работать с данным сервером понравилось,так он хорошо оформлен и выдаёт страницу с доступными и наглядными,легко читаемыми результатами.