Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~xenia_l/gomologs.html
Дата изменения: Tue Mar 16 00:36:14 2010
Дата индексирования: Tue Oct 2 01:29:08 2012
Кодировка: Windows-1251
Анализ деревьев, содержащих паралоги. Особенности работы с нуклеотидными последовательностями. Назад

Анализ деревьев, содержащих паралоги. Особенности работы с нуклеотидными последовательностями.

Построение дерева по нуклеотидным последовательностям

Строим филогенетическое дерево тех же бактерий, что в предыдущих заданиях, используя последовательности РНК малой субъединицы рибосомы (16S rRNA).

1. Получаем последовательности 16S рибосомальной РНК каждой из выбранный бактерий: rRNA.fasta

2. Выравниваем программой muscle: rRNA_aligned.fasta

3. Получаем матрицу расстояний программой пакета PHYLIP fdnadist: rrna_aligned.fdnadist
Для получения дерева подаем эту матрицу на вход программе fkitsch.
Результат работы fkitsch: rrna_aligned.fkitsch

Построенное дерево(укорененное):

              +SALTY
            +-7
        +---6 +ECOLI
        !   !
      +-5   +ERWCT
      ! !
    +-4 +----PSEAE
    ! !
  +-3 +-----AGRRK
  ! !
  ! ! +---NEIMA
--1 +-2
  !   +---RALPJ
  !
  +------RHOS4


Вспомним, как выглядит правильное дерево


Топология дерева с правильным не совпадает, отличие - в эволюции AGRRK.
Возможно имеет место такой перенос(показано линией) генов у организма AGRRK(Agrobacterium tumifaciens).

Такой же результат, выдали и другие программы, принимающие на вход матрицу расстояний(fneighbor, ffitch).

Также, как и реконструкция дерева по белкам, реконструкция дерева по нуклеотидной последовательности не дала 100% результата.

Построение и анализ дерева, содержащего паралоги

Найдем в выбранных бактериях достоверные гомологи белка FTSH_ECOLI.
Чтобы найти гомологов в заданных организмах, воспользуемся файлом proteo.fasta, где лежат записи банка UniProt, относящиеся к протеобактериям, перечисленным в таблице к заданию 1.

Создаем индексные файлы для поиска по файлу proteo.fasta:

formatdb -i proteo.fasta -p T -n base

Необходимо провести поиск программой BLASTP гомологов (с порогом на E-value=0,0001) и отобрать по мнемонике видов только те находки, которые относятся к отобранным бактериям.
blastall -p blastp -d base -i FTSH_ECOLI.fasta -e 0.0001 -o blastp.out

Результат поиска blastp.out

Затем выравниваем полученные последовательности программой muscle: gomologs_aligned.fasta
Строим матрицу расстояний программой fprotdist: gomologs_aligned.fprotdist
Подаем этот файл на вход программе fneighbor: gomologs_aligned.fneighbor
Дерево гомологов:

  +------------------B9JPL8_AGR
  !
  !                              +-----HSLU_RHOS4
  !  +---------------------------5
  !  !                           ! +----HSLU_RALPJ
  !  !                           +-4
  !  !                             ! +---HSLU_PSEAE
  !  !                             +-3
  !  !                               ! +-HSLU_PASMU
  !  !                               +-2
  7--8                                 !  +HSLU_ECOLI
  !  !                                 +--1
  !  !                                    +HSLU_SALTY
  !  !
  !  ! +------------------------Q9I5R4_PSE
  !  ! !
  !  +-9  +-----------------------------------------B9JD33_AGR
  !    !  !
  !    !  !        +----B9J9H1_AGR
  !    +-10     +-16
  !       !     !  +------Q3J045_RHO
  !       !     !
  !       !     !           +-B2UE66_RAL
  !       +----18  +--------6
  !             !  !        +--B2UIS9_RAL
  !             !  !
  !             !  !     +----Q9HV48_PSE
  !             +-19  +-15
  !                !  !  !  +---Q9CNJ2_PAS
  !                !  !  +-13
  !                !  !     !  +Q6D9B8_ERW
  !                !  !     +-12
  !                +-17        !  +FTSH_ECOLI
  !                   !        +-11
  !                   !           +FTSH_SALTY
  !                   !
  !                   !  +----A1IR46_NEI
  !                   +-14
  !                      +-----B2UGP9_RAL
  !
  +-------------------------------------------B2U6W7_RAL
Два гомологичных белка будем называть ортологами, если они:
а) из разных организмов;
б) разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования.
Два гомологичных белка из одного организма будем называть паралогами.
Можно определить, считая, что дерево реконструировано верно:

4 пары ортологов:

1)HSLU_ECOLI и HSLU_SALTY
2)FTSH_ECOLI и FTSH_SALTY
3)A1IR46_NEIMA и B2UGP9_RALPJ
4)B9J9H1_AGRRK и Q3J045_RHOS4.

B2U6W7_RALPJ и B9JPL8_AGRRK по построеннному дереву также можно отнести к ортологам,
но по топологии правильного дерева из предыдущего задания разделение линии общего предка организмов,
из которых взяты соответствующие белки, не приводит к видообразованию.

1 пара паралогов:

B2UE66_RALPJ и B2UIS9_RALPJ.



© Ксения Лежнина 2008