Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~lesya/1tree.html
Дата изменения: Mon Mar 8 22:11:02 2010 Дата индексирования: Mon Oct 1 22:32:08 2012 Кодировка: |
Задание 1.
Из предложенного списка мною выбраны следующие протеобактерии :
AGRRK , BURCA , ENT38 , SALTY , YERPE , VIBFM , PROMH , PASMU .
1. Дерево выбранных организмов выглядит следующим образом:
2. Скобочная формула дерева:
(((((((SALTY,ENT38),YERPE),PROMH),PASMU),VIBFM),BURCA),AGRRK)
3. Список нетривиальных ветвей:
{SALTY, ENT38} против {YERPE, PROMH, PASMU, VIBFM, BURCA, AGRRK}
{SALTY, ENT38, YERPE} против {PROMH, PASMU, VIBFM, BURCA, AGRRK}
{SALTY, ENT38, YERPE, PROMH} против {PASMU, VIBFM, BURCA, AGRRK}
{SALTY, ENT38, YERPE, PROMH, PASMU} против {VIBFM, BURCA, AGRRK}
{SALTY, ENT38, YERPE, PROMH, PASMU, VIBFM} против {BURCA, AGRRK}
Всего 5 нетривиальных ветвей.
Задание 2.
1. Пользуясь таксономическим сервисом NCBI: http://www.ncbi.nlm.nih.gov/taxonomy/, определяем к каким таксонам относятся отобранныебактерии:
Agrobacterium tumifaciens | AGRRK | Alphaproteobacteria, Rhizobiales, Rhizobium/Agrobacterium group, Agrobacterium |
Burkholderia cenocepacia | BURCA | Betaproteobacteria; Burkholderiales; Burkholderiaceae; Burkholderia; Burkholderia cepacia complex |
Enterobacter sp. 638 | ENT38 | Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae;Enterobacter |
Salmonella typhimurium | SALTY | Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Salmonella; Salmonella enterica; Salmonella enterica subsp. enterica |
Yersinia pestis | YERPE | Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Yersinia |
Vibrio fischeri | VIBFM | Gammaproteobacteria; Vibrionales; Vibrionaceae; Aliivibrio |
Pasteurella multocida | PASMU | Gammaproteobacteria; Pasteurellales; Pasteurellaceae; Pasteurella |
Proteus mirabilis | PROMH | Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Proteus |
Ветвь {SALTY, ENT38, YERPE, PROMH} относится к группе Enterobacteriaceae.
2. Из банка SwissProt получили последовательности белков с данной функцией из отобранных бактерий. Файл fastaENO.fasta .
3. Создали файл с выравниванием этих последовательностей с помощью программы muscle. Файл fastaENO_aligned.fasta .
4. Выравнивание в программе GeneDoc:
Зелёным цветом выделена выделены организмы,относящиеся к Enterobacteriaceae.
5. Проведём реконструкцию дерева программой fprotpars. Получили одно единственное дерево,однако оно не совпадает с нашим первоначальным вариантом.
+--BURCA +--------------7 ! +--AGRRK ! ! +--SALTY +--6 +--5 ! ! +--4 +--ENT38 ! ! ! ! ! ! +--3 +-----YERPE 1 ! ! ! ! +-----2 +--------PROMH ! ! ! +-----------VIBFM ! +--------------------PASMU6. С помощью программы fprotdist получили матрицу расстояний.
PASMU VIBFM PROMH YERPE ENT38 SALTY AGRRK BURCA PASMU 0.000000 0.136271 0.126878 0.137152 0.162247 0.141131 0.548605 0.461776 VIBFM 0.136271 0.000000 0.152839 0.124280 0.165555 0.142313 0.556635 0.481022 PROMH 0.126878 0.152839 0.000000 0.108578 0.112869 0.095445 0.562791 0.482655 YERPE 0.137152 0.124280 0.108578 0.000000 0.067687 0.061042 0.535921 0.464425 ENT38 0.162247 0.165555 0.112869 0.067687 0.000000 0.041455 0.558296 0.469612 SALTY 0.141131 0.142313 0.095445 0.061042 0.041455 0.000000 0.546852 0.460170 AGRRK 0.548605 0.556635 0.562791 0.535921 0.558296 0.546852 0.000000 0.456606 BURCA 0.461776 0.481022 0.482655 0.464425 0.469612 0.460170 0.456606 0.000000
Проверим выполняется ли свойство ультраметричности.
Выберем три группы организмов: YERPE, PASMU, AGRRK. И проверим,выполняется ли :
d(YERPE, PASMU) < d(YERPE, AGRRK) ; d(YERPE, PASMU) < d(AGRRK, PASMU) ; d(YERPE, AGRRK) равно d(AGRRK, PASMU).
d(YERPE, PASMU) = 0.137152
d(YERPE, AGRRK) = 0.535921
d(AGRRK, PASMU) = 0.548605
Действительно,можно скзать что свойство ультраметричности в принципе выполняется.
Проверим свойство аддитивности для данной матрицы.
Для проверки берём такие организмы: YERPE, ENT38, PROMH, SALTY.
d(YERPE, ENT38)+d(PROMH, SALTY) = d(YERPE,SALTY )+d(ENT38, PROMH)
Получаем, что 0,163132= 0,173911,но различие в подсчёте в одну сотую считаем допустимым.
И тогда необходимо проверить,чтобы: d(YERPE, PROMH)+ d(ENT38,SALTY ) была меньше других сумм.
Получим: 0,153128. Эта сумма,действительно меньше других полученных нами сумм.Следовательно,считаем,что свойство аддитивности тоже выполняется.
7. Получим две реконструкции дерева программой fneighbor, используя два алгоритма: UPGMA и Neighbor-Joining.Neighbor-joining method Negative branch lengths allowed +---VIBFM ! ! +---PROMH ! +-4 ! ! ! +-YERPE ! ! +-3 ! ! ! +-ENT38 5-6 +-2 ! ! +SALTY ! ! ! ! +---------------AGRRK ! +------------1 ! +----------BURCA ! +---PASMU Данная реконструкция дерева не соответствует моему исходному варианту,отличаяь от него наличием пары AGRRK-BURCA. UPGMA method Negative branch lengths allowed +---PASMU +-4 ! +---VIBFM +----------5 ! ! +--PROMH ! +-3 ! ! +-YERPE ! +-2 --7 ! +ENT38 ! +-1 ! +SALTY ! ! +------------AGRRK +-6 +------------BURCA
Дерево, полученное через второй алгоритм тоже не совпадает с первоначальным вариантом,наличием уже двух "нововведённых" ветвей: и PASMU-VIBFM.
8. Ознакомимся с созданным в НИИФХБ имени А.Н. Белозерского сервисом TreeTop .
Запустив на вход программы выравнивание в фаста-формате получила две реконструкции дерева,выполненные разными алгоритмами (топологическим и кластерным) ,матрицу расстояний и графическое изображение дерева.
Матрица перехода между бактериями имеет вид:
1 2 3 4 5 6 7 8 1 PASMU 0.000 0.136 0.123 0.142 0.156 0.139 0.367 0.321 2 VIBFM 0.136 0.000 0.143 0.130 0.153 0.141 0.366 0.330 3 PROMH 0.123 0.143 0.000 0.119 0.125 0.107 0.374 0.325 4 YERPE 0.142 0.130 0.119 0.000 0.079 0.073 0.360 0.313 5 ENT38 0.156 0.153 0.125 0.079 0.000 0.062 0.369 0.319 6 SALTY 0.139 0.141 0.107 0.073 0.062 0.000 0.364 0.311 7 AGRRK 0.367 0.366 0.374 0.360 0.369 0.364 0.000 0.301 8 BURCA 0.321 0.330 0.325 0.313 0.319 0.311 0.301 0.000 Графическое изображение дерева,при использовании кластерного алгоритма: Можно сказать,что дерево отличается от исходного варианта наличием пары AGRRK-BURCA,но в принципе при укоренении этого дерева вероятнее всего мы получим мой первоначальный вариант. Работать с данным сервером понравилось,так он хорошо оформлен и выдаёт страницу с доступными и наглядными,легко читаемыми результатами.