Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~ipoverennaya/term4/tree.html
Дата изменения: Wed Mar 3 00:57:16 2010
Дата индексирования: Tue Oct 2 11:54:41 2012
Кодировка: Windows-1251
Tree

Занятие 1. Построение филогенетического дерева.

 Задание 1. Создание паттернов аминокислотных последовательностей.
Отобранные бактерии
НазваниеМнемоника
Burkholderia cenocepaciaBURCA
Ralstonia pickettiiRALPJ
Neisseria meningitidisNEIMA
Erwinia carotovoraERWCT
Escherichia coliECOLI
Salmonella typhimuriumSALTY
Vibrio choleraeVIBCH
Proteus mirabilisPROMH
Скобочная формула дерева
((VIBCH,(PROMH,(ERWCT,(ECOLI,SALTY)))),(NEIMA,(RALPJ, BURCA)));
Изображение дерева.

Ветви дерева.
Дерево содержит следующие нетривиальные ветви:
1) {RALPJ, BURCA} против {NEIMA, VIBCH, PROMH, ERWCT, ECOLI, SALTY}
2) {NEIMA, RALPJ, BURCA} против {VIBCH, PROMH, ERWCT, ECOLI, SALTY}
3) {NEIMA, RALPJ, BURCA, VIBCH} против {PROMH, ERWCT, ECOLI, SALTY}
4) {NEIMA, RALPJ, BURCA, VIBCH, PROMH} против {ERWCT, ECOLI, SALTY}
5) {NEIMA, RALPJ, BURCA, VIBCH, PROMH, ERWCT} против {ECOLI, SALTY}
Таксономия.
C помощью таксономического сервиса NCBI: http://www.ncbi.nlm.nih.gov/taxonomy/ была определена таксономия отобранных бактерий:
Burkholderia cenocepacia - Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; 
                           Burkholderiaceae; Burkholderia; Burkholderia cepacia
Ralstonia pickettii      - Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; 
                           Burkholderiaceae; Ralstonia
Neisseria meningitidis   - Bacteria; Proteobacteria; Betaproteobacteria; Neisseriales; 
                           Neisseriaceae; Neisseria
Erwinia carotovora       - Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; 
                           Enterobacteriaceae; Pectobacterium
Escherichia coli         - Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; 
                           Enterobacteriaceae; Escherichia
Salmonella typhimurium   - Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; 
                           Enterobacteriaceae; Salmonella; Salmonella enterica; 
                           Salmonella enterica subsp. enterica
Vibrio cholerae          - Bacteria; Proteobacteria; Gammaproteobacteria; Vibrionales; 
                           Vibrionaceae; Vibrio
Proteus mirabilis        - Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; 
                           Enterobacteriaceae; Proteus

Как видно, на дереве есть ветви, выделяющие следующие таксоны:
NEIMA, RALPJ, BURCA - b-протеобактерии
VIBCH - g-протебактерия
PROMH, ERWCT, ECOLI, SALTY - энтеробактерии

Из банка Swiss-Prot были получены последовательности белков-энолаз отобранных бактерий. Множественное выравнивание этих белков было построено с помощью программы muscle (выходной файл: mneno.fasta).
Реконструкция дерева программой fprotpars.
По множественному выравниванию программа fprotpars построила 1 неукорененное дерево:


                    +--RALPJ     
                 +--7  
     +-----------6  +--BURCA     
     !           !  
     !           +-----NEIMA     
     !  
  +--5              +--SALTY     
  !  !           +--4  
  !  !        +--3  +--ECOLI     
  !  !        !  !  
  1  +--------2  +-----ERWCT     
  !           !  
  !           +--------PROMH     
  !  
  +--------------------VIBCH     
Скобочная формула:
((((RALPJ,BURCA),NEIMA),(((SALTY,ECOLI),ERWCT),PROMH)),VIBCH);
Полученное дерево полностью совпадает с правильным.
Оценка эволюционных расстояний.
С помощью программы fprotdist была получена матрица расстояний:
	       VIBCH     PROMH     ERWCT     ECOLI     SALTY    NEIMA     BURCA     RALPJ
VIBCH       0.000000  0.137001  0.133023  0.131800  0.132226  0.518464  0.506995  0.464014
PROMH       0.137001  0.000000  0.106934  0.097775  0.095445  0.537510  0.482655  0.457518
ERWCT       0.133023  0.106934  0.000000  0.056151  0.053870  0.505785  0.466193  0.431272
ECOLI       0.131800  0.097775  0.056151  0.000000  0.013573  0.499523  0.459059  0.434511
SALTY       0.132226  0.095445  0.053870  0.013573  0.000000  0.507496  0.460170  0.435582
NEIMA       0.518464  0.537510  0.505785  0.499523  0.507496  0.000000  0.365469  0.318335
BURCA       0.506995  0.482655  0.466193  0.459059  0.460170  0.365469  0.000000  0.097015
RALPJ       0.464014  0.457518  0.431272  0.434511  0.435582  0.318335  0.097015  0.000000
Проверка ультраметричности.
Аксиома ультраметричного пространства: d (A,B) ≤ max(d (A,C), d (B,C))
(или равносильно данной аксиоме: из трех расстояний между тремя объектами два всегда равны между собой и не меньше третьего)
Рассмотрим расстояния между BURCA, NEIMA и ECOLI:
d(BURCA, NEIMA)= 0.365469
d(BURCA, ECOLI)= 0.459059
d(NEIMA, ECOLI)= 0.499523
Условие ультраметричности не выполняется.
Теперь рассмотрим расстояния между VIBCH, ERWCT и SALTY:
d(VIBCH, ERWCT)= 0.133023
d(VIBCH, SALTY)= 0.132226
d(ERWCT, SALTY)= 0.053870
Аксиома выполняется, если считать погрешность = 0.133023-0.132226=0.000797 незначительной.
Проверка аддитивности
Аддитивность: если есть четыре последовательности A,B,C,D, то из трех сумм 1) d(A,B) + d(C,D) 2) d(A,C) + d(B,D) 3) d(A,D) + d(B,C) две равны между собой и больше третьей.
Рассмотрим выполнение/невыполнение аддитивности на примере VIBCH, NEIMA, BURCA и RALPJ:
 
d(VIBCH, NEIMA) + d(BURCA, RALPJ)= 0.518464 + 0.097015 = 0.615479 
d(VIBCH, BURCA) + d(NEIMA, RALPJ)= 0.506995 + 0.318335 = 0.82533
d(VIBCH, RALPJ) + d(BURCA, NEIMA)= 0.464014 + 0.365469 = 0.829483
Так как погрешность равна 0.004153, то можно считать, что отклонение незначительно, и условие аддитивности выполняется.
Реконструкции дерева программой fneighbor.
С помощью программы fneighbor было получено две реконструкции дерева программой (для создания первой был использован алгоритма Neighbor-Joining, второй - UPGMA). Выходные файлы: mneno_n.fneighbor, mneno_n.treefile и mneno_u.fneighbor, mneno_u.treefile.
Neighbor-Joining (создается неукорененное дерево)
    +--PROMH     
  +-5 
  ! ! +ERWCT     
  ! +-4 
  !   ! +ECOLI     
  !   +-3 
  !     +SALTY     
  ! 
  !              +-----------NEIMA     
  6--------------2 
  !              !     +---BURCA     
  !              +-----1 
  !                    +-RALPJ     
  ! 
  +---VIBCH     
Скобочная формула:
((PROMH:0.05887,(ERWCT:0.02970,(ECOLI:0.00674,SALTY:0.00683):0.01852):0.01540):0.01054,
(NEIMA:0.19793,(BURCA:0.06512,RALPJ:0.03190):0.09546):0.25770,VIBCH:0.07334);
UPGMA (создается укорененное дерево)
            +---VIBCH     
  +---------5 
  !         ! +--PROMH     
  !         +-4 
  !           ! +ERWCT     
  !           +-2 
--7             ! +ECOLI     
  !             +-1 
  !               +SALTY     
  ! 
  !   +---------NEIMA     
  +---6 
      !      +--BURCA     
      +------3 
             +--RALPJ     
Скобочная формула:
((VIBCH:0.06676,(PROMH:0.05003,(ERWCT:0.02751,(ECOLI:0.00679,
SALTY:0.00679):0.02072):0.02252):0.01673):0.17214,(NEIMA:0.17095,
(BURCA:0.04851,RALPJ:0.04851):0.12244):0.06794);
Топология обоих деревьев совпадает с топологией правильного и построенного при помощи программы fprotpars.
Меню
· Главная
· Результаты исследований
· Семестры
· Полезные ссылки
· Контакты
© Ирина Поверенная, 2008