Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~xenia_l/gomologs.html
Дата изменения: Tue Mar 16 00:36:14 2010 Дата индексирования: Tue Oct 2 01:29:08 2012 Кодировка: Windows-1251 |
Строим филогенетическое дерево тех же бактерий, что в предыдущих заданиях, используя последовательности РНК малой субъединицы рибосомы (16S rRNA).
1. Получаем последовательности 16S рибосомальной РНК каждой из выбранный бактерий: rRNA.fasta
2. Выравниваем программой muscle: rRNA_aligned.fasta
3. Получаем матрицу расстояний программой пакета PHYLIP fdnadist: rrna_aligned.fdnadist
Для получения дерева подаем эту матрицу на вход программе fkitsch.
Результат работы fkitsch: rrna_aligned.fkitsch
Построенное дерево(укорененное):
+SALTY +-7 +---6 +ECOLI ! ! +-5 +ERWCT ! ! +-4 +----PSEAE ! ! +-3 +-----AGRRK ! ! ! ! +---NEIMA --1 +-2 ! +---RALPJ ! +------RHOS4Вспомним, как выглядит правильное дерево
Топология дерева с правильным не совпадает, отличие - в эволюции AGRRK.
Возможно имеет место такой перенос(показано линией) генов у организма AGRRK(Agrobacterium tumifaciens).
Такой же результат, выдали и другие программы, принимающие на вход матрицу расстояний(fneighbor, ffitch).
Также, как и реконструкция дерева по белкам, реконструкция дерева по нуклеотидной последовательности не дала 100% результата.
Создаем индексные файлы для поиска по файлу proteo.fasta:
Необходимо провести поиск программой BLASTP гомологов (с порогом на E-value=0,0001) и отобрать по мнемонике видов только те находки, которые относятся к отобранным бактериям.formatdb -i proteo.fasta -p T -n base
blastall -p blastp -d base -i FTSH_ECOLI.fasta -e 0.0001 -o blastp.out
Затем выравниваем полученные последовательности программой muscle: gomologs_aligned.fasta
Строим матрицу расстояний программой fprotdist: gomologs_aligned.fprotdist
Подаем этот файл на вход программе fneighbor: gomologs_aligned.fneighbor
Дерево гомологов:
+------------------B9JPL8_AGR ! ! +-----HSLU_RHOS4 ! +---------------------------5 ! ! ! +----HSLU_RALPJ ! ! +-4 ! ! ! +---HSLU_PSEAE ! ! +-3 ! ! ! +-HSLU_PASMU ! ! +-2 7--8 ! +HSLU_ECOLI ! ! +--1 ! ! +HSLU_SALTY ! ! ! ! +------------------------Q9I5R4_PSE ! ! ! ! +-9 +-----------------------------------------B9JD33_AGR ! ! ! ! ! ! +----B9J9H1_AGR ! +-10 +-16 ! ! ! +------Q3J045_RHO ! ! ! ! ! ! +-B2UE66_RAL ! +----18 +--------6 ! ! ! +--B2UIS9_RAL ! ! ! ! ! ! +----Q9HV48_PSE ! +-19 +-15 ! ! ! ! +---Q9CNJ2_PAS ! ! ! +-13 ! ! ! ! +Q6D9B8_ERW ! ! ! +-12 ! +-17 ! +FTSH_ECOLI ! ! +-11 ! ! +FTSH_SALTY ! ! ! ! +----A1IR46_NEI ! +-14 ! +-----B2UGP9_RAL ! +-------------------------------------------B2U6W7_RALДва гомологичных белка будем называть ортологами, если они:
4 пары ортологов:
1)HSLU_ECOLI и HSLU_SALTY
2)FTSH_ECOLI и FTSH_SALTY
3)A1IR46_NEIMA и B2UGP9_RALPJ
4)B9J9H1_AGRRK и Q3J045_RHOS4.
B2U6W7_RALPJ и B9JPL8_AGRRK по построеннному дереву также можно отнести к ортологам,
но по топологии правильного дерева из предыдущего задания разделение линии общего предка организмов,
из которых взяты соответствующие белки, не приводит к видообразованию.
1 пара паралогов:
B2UE66_RALPJ и B2UIS9_RALPJ.