Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~anuta_al/4.html
Дата изменения: Wed Sep 8 17:40:12 2010
Дата индексирования: Mon Oct 1 21:56:01 2012
Кодировка: Windows-1251
Анализ деревьев, содержащих паралоги. Особенности работы с нуклеотидными последовательностями.

Анализ деревьев, содержащих паралоги. Особенности работы с нуклеотидными последовательностями.



  1. Построение дерева по нуклеотидным последовательностям.
  2. Построим филогенетическое дерево бактерий, выбранных в прошлых заданиях, используя последовательности РНК малой субъединицы рибосомы (16S rRNA). Для этого найдем последовательности 16S рибосомальной РНК каждой из бактерий.

    В записи EMBL, описывающей полный геном бактерии, найдем соответствующую "особенность" (FT), она имеет ключ (FTkey) "rRNA" и в описании: /note="16S rRNA". Ссылку на запись EMBL, описывающую полный геном, проще всего найти в записи Swiss-Prot, описывающей какой-нибудь белок. Часто в геноме имеется несколько копий рРНК, берем только одну.

    Переместим все последовательности в единый файл в fasta-формате, с названиями, отвечающими организмам, и произведем их выравнивание программой muscle, получим выровненные последовательности.
    Воспользуемся программой из пакета PHYLIP на kodomo-count -- fdnaml. На выходе получаем скобочную версию дерева и изображение:

     +---PSEAE     
      |  
      |           +ECOLI     
      |        +--5  
      |     +--4  +SALTY     
      |     |  |  
      |  +--3  +YERPE     
      |  |  |  
      1--2  +--VIBCH     
      |  |  
      |  +------PASMU     
      |  
      +--------RHOS4     
    


    a) По сравнению с эталонным деревом у приведенного выше дерева образовалась новая ветвь: {PSEAE, PASMU, RHOS4} против {ECOLI, SALTY, YERPE, VIBCH}.
    Старая ветвь: {ECOLI, SALTY, YERPE, PASMU} против {VIBCH, PSEAE, RHOS4}.

    b) От дерева, построенного по белкам того же семейства (ENO), не отличается.


  3. Построение и анализ дерева, содержащего паралоги
  4. Найдем в выбранных бактериях достоверные гомологи белка FTSH_ECOLI и построим дерево этих гомологов.
    Для этого проведем поиск программой BLASTP (с порогом E-value, равным 0.0001) в файле proteo.fasta и отберем по мнемонике видов только те находки, которые относятся к выбранным бактериям.

    Получим файл с последовательностью белка FTSH_ECOLI в fasta-формате с помощью команды:
    seqret sw:FTSH_ECOLI
    

    Сохраним последовательность в файле ftsh_ecoli.fasta.
    Затем создадим индексные файлы пакета BLAST для поиска по файлу с помощью команды:
    formatdb -i proteo.fasta -p T -n pr
    

    Теперь проведем поиск гомологов программой BLASTP c порогом E-value, равным 0.0001:
    blastall -p blastp -d pr -i ftsh_ecoli.fasta -o pblast.fasta -e 0.0001
    


    На выходе получили файл с гомологами белка FTSH_ECOLI.
    Теперь выберем из них те, которые мы отобрали в первом задании, полученный файл сохраним.

    Теперь с помощью программы seqret получим последовательности выбранных белков. Полученный файл подадим на вход muscle и получим выровненные последоваельности.
    Затем используя программу fprotpars, получили филогенитическое дерево гомологов и его скобочную модель.

    
    
                                             +--FTSH_SALTY
                                          +-14  
                                       +-13  +--FTSH_ECOLI
                                       !  !  
                                    +-12  +-----Q0WBE7_YER
                                    !  !  
                                 +-11  +--------Q9KU86_VIB
                                 !  !  
                              +-10  +-----------Q9CNJ2_PAS
                              !  !  
                           +--9  +--------------Q9HV48_PSE
                           !  !  
         +-----------------8  +-----------------Q3J045_RHO
         !                 !  
         !                 +--------------------Q9I5R4_PSE
         !  
         !                          +-----------HSLU_PASMU
      +--7                          !  
      !  !                          !        +--HSLU_SALTY
      !  !                       +--3     +--6  
      !  !                       !  !  +--5  +--HSLU_ECOLI
      !  !                       !  !  !  !  
      1  +-----------------------2  +--4  +-----HSLU_YERPE
      !                          !     !  
      !                          !     +--------HSLU_VIBCH
      !                          !  
      !                          +--------------HSLU_PSEAE
      !  
      +-----------------------------------------HSLU_RHOS4
    


    В этом дерево очень четко выделяется поддерево семейства белков HSLU.
    Поддерево этого семейства в точности повторяет деревья, построенные NJ, UPGMA и fprotpars.

    Если считать, что дерево реконструированно верно, то мы можем указать ортологи и паралоги.
    Два гомологичных белка будем называть ортологами, если они а) из разных организмов; б) разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования. Два гомологичных белка из одного организма будем называть паралогами.

    Ортологи:

    HSLU_SALTY и HSLU_ECOLI;
    FTSH_SALTY и FTSH_ECOLI;

    Паралоги:

    Q9KU86_VIBH и HSLU_VIBCH;
    HSLU_PASMU и Q9CNJ2_PASMU;
    HSLU_PSEAE и Q9HV48_PSEAE;