|
Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~nivunja/projects/Term_4/pr4/pr4.html
Дата изменения: Mon May 24 00:27:20 2010 Дата индексирования: Sat Jun 26 01:52:35 2010 Кодировка: Windows-1251 |
|   | ||
|   |   |
Занятие 4.1. Построение дерева по нуклеотидным последовательностямНеобходимо построить филогенетическое дерево бактерий, используя последовательности РНК малой субъединицы рибосомы (16S rRNA).Нужные РНК-последовательности были извлечены из записей EMBL и сохранены в файле rnaseqs.fasta. Затем они были выровнены при помощи программы muscle. Файл с выравниванием: rnaseqs_al.fasta. Для построения филогенетического дерева воспользуемся программами пакета PHYLIP (fdnaml, fdnapars, fdnadist; матрица расстояний подавалась на вход программам fneighbor, ffitch и fkitsch.) Все деревья, построенные этими программами, совпали между собой и с правильным. Приведем пример дерева, полученного fdnapars: +-----NEIMA
+--6
| +---BURCA
+---5
| | +---RHIEC
| +-----4
| +---BRAJA
|
| +YERPS
| +--3
1--2 +YERPE
| |
| +-ECOLI
|
+---VIBFM
В отличие от дерева, построенного по выравниванию белковых последовательностей программой fprotpars, это дерево совпадает с правильным. Таким образом, в этом случае качество реконструкции по ДНК выше, чем по белкам.Программа fkitsch выдала укорененное дерево: +---NEIMA
+--7
! +---BURCA
!
+-6 +YERPS
! ! +-3
! ! +-2 +YERPE
! ! ! !
--4 +---1 +ECOLI
! !
! +--VIBFM
!
! +--RHIEC
+---5
+--BRAJA
Это укоренение (в нетривиальную ветвь {RHIEC,BRAJA} против {BURCA,NEIMA,VIBFM,ECOLI,YERPS,YERPE} совпадает с укоренениями, сделанными ранее.2. Построение и анализ дерева, содержащего паралогиНеобходимо найти в исследуемых бактериях достоверные гомологи белка FTSH_ECOLI. Для этого нужно получить последовательность этого белка:seqret sw:ftsh_ecoliЗатем по файлу proteo.fasta создаем базу данных для поиска гомологов программой blastp: formatdb -i proteo.fasta -n db_proteo -p Tи осуществляем поиск гомологов: blastall -p blastp -d db_proteo -i ftsh_ecoli.fasta -e 0.0001 -o homologs.out -m 8Файл с выдачей: homologs.out; файл с последовательностями белков нужных бактерий: homologs_m.fasta. Теперь выровняем белки программой muscle, полученное выравнивание подадим на вход программе fprotdist, чтобы получить матрицу расстояний. По ней при помощи fneighbor получаем дерево:
+--HSLU_VIBFM
+-3
! ! +-HSLU_ECOLI
! +-2
! ! +HSLU_YERPE
! +-1
! +HSLU_YERPS
!
! +----------------------------Q89KG3_BRAJA
! !
! ! +---------------------------Q89BR3_BRAJA
! ! +--7
4------------------6 ! ! +---------------B5FCR8_VIBFM
! ! ! +----------5
! ! ! +----------Q8KKT3_RHIEC
! ! !
! +---------8 +-----------Q1BNJ2_BURCA
! ! !
! ! ! +-----A1IR46_NEIMA
! ! ! +-13
! ! ! ! +-----Q1BXC9_BURCA
! +-----14 +-15
! ! ! ! +--B5FA73_VIBFM
! ! ! +-11
! ! ! ! +FTSH_ECOLI
! ! ! +-10
! +-16 ! +Q0WBE7_YERPE
! ! +-9
! ! +Q66F66_YERPS
! !
! ! +---Q2K4M2_RHIEC
! +-12
! +---Q9XBG5_BRAJA
!
+------HSLU_BRAJA
Дерево считаем реконструированным верно.Ортологи - гомологичные белки, возникшие в результате видообразования. Примеры ортологов: HSLU_VIBFM, HSLU_ECOLI, HSLU_YERPE и HSLU_YERPS (узел 3), A1IR46_NEIMA и Q1BXC9_BURCA (узел 13). Паралоги - гомоличные белки в одном организме. Примеры паралогов: Q89KG3_BRAJA и Q89BR3_BRAJA, Q1BNJ2_BURCA и Q1BXC9_BURCA. Заметим, что в данном случае нет ни одной пары паралогов, составляющих узел из двух листьев. Назад |