Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~serge2006/T4P2/practice2.html
Дата изменения: Tue Mar 18 18:13:35 2008
Дата индексирования: Tue Oct 2 12:18:09 2012
Кодировка: Windows-1251
Моделирование и реконструкция эволюции гена

Занятие 2. Моделирование и реконструкция эволюции гена

назад

19.02.2008

Модель судьбы заданного гена в виде скобочной формулы из файла: (((А:50,B:50):40,(C:60,D:60):20):25,(E:60,F:60):4);
  1. Создание изображения дерева, описанного заданной формулой.
    Воспользуемся программой ChemSketch, чтобы нарисовать дерево, а потом экспортируем в *.gif.
    Примечание: дерево не ультраметрично, т.к суммы расстояний от корня до всех листьев не равны.

  2. Описание ветвей дерева как разбиения множества листьев (считаем дерево бескорневым).
      A B C D E F
      . . * * * *
      * * . . * *
      * * * * . .
    
  3. Получение искуственных мутантных последовательностей.
    Создаем директорию (03) для мутантных последовательностей, копируем туда последовательность гена (из 2 семестра выбираем одну из полученных последовательностей, например k03503_134_1678.fasta, переименуем в ilvA.fasta).
    Длина гена: 1678-134+1=1545 нк.
    Формула пересчета расстояний в число мутаций в данном гене (ilvA): n=округл(длина_гена/100*длину_ветки).
    Скрипт для получения мутантных последовательностей: script (сохранен как текст UNIX в FAR, chmod +x script, ./script).
  4. Реконструирование деревьев (на основе "листьев") различными алгоритмами.
    • рабочая поддиректория: 04.
    • создать fasta-файл A__F.fasta с последовательностями 6 листьев (A.fasta, ..., F.fasta)
    • Алгоритмом максимального правдоподобия:
      fdnaml A__F.fasta -outfile A__F.fdnaml -outtreefile A__F.treefile -ttratio 1 -auto
        +----------B
        |
        |                 +------------F
        |         +-------4
        |         |       +--------------E
        1---------3
        |         |    +--------------D
        |         +----2
        |              +--------------C
        |
        +------------A
    • подсчитать попарные расстояния между последовательностями:
      fdnadist A__F.fasta -outfile A__F.fdnadist -ttratio 1 -auto
    • Алгоритмом Neighbor-joining:
      fneighbor A__F.fdnadist -outfile A__F.fneighbor -outtreefile A__F_fneighbor.treefile -auto
        +----------B
        !
        !               +--------------C
        !         +-----3
        !         !     +--------------D
        1---------4
        !         !        +--------------E
        !         +--------2
        !                  +-------------F
        !
        +------------A
    • Алгоритмом UPGMA:
      fneighbor A__F.fdnadist -outfile A__F_upgma.fneighbor -outtreefile A__F_upgma.treefile -treetype u -auto
                             +-----------------------A
          +------------------1
          !                  +-----------------------B
        +-4
        ! !            +-----------------------------C
        ! +------------3
      --5              +-----------------------------D
        !
        !              +----------------------------E
        +--------------2
                       +----------------------------F
      Примечание: только этот алгоритм выдал укорененное дерево, причем корень находится между узлами ABCD и EF, как и в исходном дереве.

    Внутренние ветви всех деревьев в виде разбиений листьев:
    A B C D E F
    Исходное дерево Алгоритм максимального правдоподобия Алгоритм Neighbor-joining Алгоритм UPGMA
    . . * * * *
    ++++
    * * . . * *
    ++++
    * * * * . .
    ++++

    Вывод: реконструированные деревья совпадает по топологии с реальным.
    назад

© Serge I. Mitrofanov, 2008Последнее обновление: 16.03.2008