Занятие 1. Построение филогенетического дерева.
Задание 1. Создание паттернов аминокислотных последовательностей.
Отобранные бактерии
Название | Мнемоника |
Burkholderia cenocepacia | BURCA |
Ralstonia pickettii | RALPJ |
Neisseria meningitidis | NEIMA |
Erwinia carotovora | ERWCT |
Escherichia coli | ECOLI |
Salmonella typhimurium | SALTY |
Vibrio cholerae | VIBCH |
Proteus mirabilis | PROMH |
Скобочная формула дерева
((VIBCH,(PROMH,(ERWCT,(ECOLI,SALTY)))),(NEIMA,(RALPJ, BURCA)));
Изображение дерева.
Ветви дерева.
Дерево содержит следующие нетривиальные ветви:
1) {RALPJ, BURCA} против {NEIMA, VIBCH, PROMH, ERWCT, ECOLI, SALTY}
2) {NEIMA, RALPJ, BURCA} против {VIBCH, PROMH, ERWCT, ECOLI, SALTY}
3) {NEIMA, RALPJ, BURCA, VIBCH} против {PROMH, ERWCT, ECOLI, SALTY}
4) {NEIMA, RALPJ, BURCA, VIBCH, PROMH} против {ERWCT, ECOLI, SALTY}
5) {NEIMA, RALPJ, BURCA, VIBCH, PROMH, ERWCT} против {ECOLI, SALTY}
Таксономия.
C помощью таксономического сервиса NCBI: http://www.ncbi.nlm.nih.gov/taxonomy/ была определена таксономия отобранных бактерий:
Burkholderia cenocepacia - Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales;
Burkholderiaceae; Burkholderia; Burkholderia cepacia
Ralstonia pickettii - Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales;
Burkholderiaceae; Ralstonia
Neisseria meningitidis - Bacteria; Proteobacteria; Betaproteobacteria; Neisseriales;
Neisseriaceae; Neisseria
Erwinia carotovora - Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales;
Enterobacteriaceae; Pectobacterium
Escherichia coli - Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales;
Enterobacteriaceae; Escherichia
Salmonella typhimurium - Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales;
Enterobacteriaceae; Salmonella; Salmonella enterica;
Salmonella enterica subsp. enterica
Vibrio cholerae - Bacteria; Proteobacteria; Gammaproteobacteria; Vibrionales;
Vibrionaceae; Vibrio
Proteus mirabilis - Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales;
Enterobacteriaceae; Proteus
Как видно, на дереве есть ветви, выделяющие следующие таксоны:
NEIMA, RALPJ, BURCA - b-протеобактерии
VIBCH - g-протебактерия
PROMH, ERWCT, ECOLI, SALTY - энтеробактерии
Из банка Swiss-Prot были получены последовательности белков-энолаз отобранных бактерий. Множественное выравнивание этих белков было
построено с помощью программы muscle (выходной файл: mneno.fasta).
Реконструкция дерева программой fprotpars.
По множественному выравниванию программа fprotpars построила 1 неукорененное дерево:
+--RALPJ
+--7
+-----------6 +--BURCA
! !
! +-----NEIMA
!
+--5 +--SALTY
! ! +--4
! ! +--3 +--ECOLI
! ! ! !
1 +--------2 +-----ERWCT
! !
! +--------PROMH
!
+--------------------VIBCH
Скобочная формула:
((((RALPJ,BURCA),NEIMA),(((SALTY,ECOLI),ERWCT),PROMH)),VIBCH);
Полученное дерево полностью совпадает с правильным.
Оценка эволюционных расстояний.
С помощью программы fprotdist была получена матрица расстояний:
VIBCH PROMH ERWCT ECOLI SALTY NEIMA BURCA RALPJ
VIBCH 0.000000 0.137001 0.133023 0.131800 0.132226 0.518464 0.506995 0.464014
PROMH 0.137001 0.000000 0.106934 0.097775 0.095445 0.537510 0.482655 0.457518
ERWCT 0.133023 0.106934 0.000000 0.056151 0.053870 0.505785 0.466193 0.431272
ECOLI 0.131800 0.097775 0.056151 0.000000 0.013573 0.499523 0.459059 0.434511
SALTY 0.132226 0.095445 0.053870 0.013573 0.000000 0.507496 0.460170 0.435582
NEIMA 0.518464 0.537510 0.505785 0.499523 0.507496 0.000000 0.365469 0.318335
BURCA 0.506995 0.482655 0.466193 0.459059 0.460170 0.365469 0.000000 0.097015
RALPJ 0.464014 0.457518 0.431272 0.434511 0.435582 0.318335 0.097015 0.000000
Проверка ультраметричности.
Аксиома ультраметричного пространства: d (A,B) ≤ max(d (A,C), d (B,C))
(или равносильно данной аксиоме: из трех расстояний между тремя объектами два всегда равны между собой и не меньше третьего)
Рассмотрим расстояния между BURCA, NEIMA и ECOLI:
d(BURCA, NEIMA)= 0.365469
d(BURCA, ECOLI)= 0.459059
d(NEIMA, ECOLI)= 0.499523
Условие ультраметричности не выполняется.
Теперь рассмотрим расстояния между VIBCH, ERWCT и SALTY:
d(VIBCH, ERWCT)= 0.133023
d(VIBCH, SALTY)= 0.132226
d(ERWCT, SALTY)= 0.053870
Аксиома выполняется, если считать погрешность = 0.133023-0.132226=0.000797 незначительной.
Проверка аддитивности
Аддитивность: если есть четыре последовательности A,B,C,D, то из трех
сумм 1) d(A,B) + d(C,D) 2) d(A,C) + d(B,D) 3) d(A,D) + d(B,C)
две равны между собой и больше третьей.
Рассмотрим выполнение/невыполнение аддитивности на примере VIBCH, NEIMA, BURCA и RALPJ:
d(VIBCH, NEIMA) + d(BURCA, RALPJ)= 0.518464 + 0.097015 = 0.615479
d(VIBCH, BURCA) + d(NEIMA, RALPJ)= 0.506995 + 0.318335 = 0.82533
d(VIBCH, RALPJ) + d(BURCA, NEIMA)= 0.464014 + 0.365469 = 0.829483
Так как погрешность равна 0.004153, то можно считать, что отклонение незначительно, и условие аддитивности выполняется.
Реконструкции дерева программой fneighbor.
С помощью программы fneighbor было получено две реконструкции дерева программой (для создания первой был использован алгоритма Neighbor-Joining, второй - UPGMA).
Выходные файлы:
mneno_n.fneighbor,
mneno_n.treefile и
mneno_u.fneighbor,
mneno_u.treefile.
Neighbor-Joining (создается неукорененное дерево)
+--PROMH
+-5
! ! +ERWCT
! +-4
! ! +ECOLI
! +-3
! +SALTY
!
! +-----------NEIMA
6--------------2
! ! +---BURCA
! +-----1
! +-RALPJ
!
+---VIBCH
Скобочная формула:
((PROMH:0.05887,(ERWCT:0.02970,(ECOLI:0.00674,SALTY:0.00683):0.01852):0.01540):0.01054,
(NEIMA:0.19793,(BURCA:0.06512,RALPJ:0.03190):0.09546):0.25770,VIBCH:0.07334);
UPGMA (создается укорененное дерево)
+---VIBCH
+---------5
! ! +--PROMH
! +-4
! ! +ERWCT
! +-2
--7 ! +ECOLI
! +-1
! +SALTY
!
! +---------NEIMA
+---6
! +--BURCA
+------3
+--RALPJ
Скобочная формула:
((VIBCH:0.06676,(PROMH:0.05003,(ERWCT:0.02751,(ECOLI:0.00679,
SALTY:0.00679):0.02072):0.02252):0.01673):0.17214,(NEIMA:0.17095,
(BURCA:0.04851,RALPJ:0.04851):0.12244):0.06794);
Топология обоих деревьев совпадает с топологией правильного и построенного при помощи программы fprotpars.
|
|