19.02.2008
Модель судьбы заданного гена в виде скобочной формулы из файла: (((А:50,B:50):40,(C:60,D:60):20):25,(E:60,F:60):4);
- Создание изображения дерева, описанного заданной формулой.
Воспользуемся программой ChemSketch, чтобы нарисовать дерево, а потом экспортируем в *.gif.
Примечание: дерево не ультраметрично, т.к суммы расстояний от корня до всех листьев не равны.
- Описание ветвей дерева как разбиения множества листьев (считаем дерево бескорневым).
A B C D E F
. . * * * *
* * . . * *
* * * * . .
- Получение искуственных мутантных последовательностей.
Создаем директорию (03) для мутантных последовательностей, копируем туда последовательность гена (из 2 семестра выбираем одну из полученных последовательностей, например k03503_134_1678.fasta, переименуем в ilvA.fasta).
Длина гена: 1678-134+1=1545 нк.
Формула пересчета расстояний в число мутаций в данном гене (ilvA): n=округл(длина_гена/100*длину_ветки).
Скрипт для получения мутантных последовательностей: script (сохранен как текст UNIX в FAR, chmod +x script, ./script).
- Реконструирование деревьев (на основе "листьев") различными алгоритмами.
- рабочая поддиректория: 04.
- создать fasta-файл A__F.fasta с последовательностями 6 листьев (A.fasta, ..., F.fasta)
- Алгоритмом максимального правдоподобия:
fdnaml A__F.fasta -outfile A__F.fdnaml -outtreefile A__F.treefile -ttratio 1 -auto
+----------B
|
| +------------F
| +-------4
| | +--------------E
1---------3
| | +--------------D
| +----2
| +--------------C
|
+------------A
- подсчитать попарные расстояния между последовательностями:
fdnadist A__F.fasta -outfile A__F.fdnadist -ttratio 1 -auto
- Алгоритмом Neighbor-joining:
fneighbor A__F.fdnadist -outfile A__F.fneighbor -outtreefile A__F_fneighbor.treefile -auto
+----------B
!
! +--------------C
! +-----3
! ! +--------------D
1---------4
! ! +--------------E
! +--------2
! +-------------F
!
+------------A
- Алгоритмом UPGMA:
fneighbor A__F.fdnadist -outfile A__F_upgma.fneighbor -outtreefile A__F_upgma.treefile -treetype u -auto
+-----------------------A
+------------------1
! +-----------------------B
+-4
! ! +-----------------------------C
! +------------3
--5 +-----------------------------D
!
! +----------------------------E
+--------------2
+----------------------------F
Примечание: только этот алгоритм выдал укорененное дерево, причем корень находится между узлами ABCD и EF, как и в исходном дереве.
Внутренние ветви всех деревьев в виде разбиений листьев:
A B C D E F |
Исходное дерево |
Алгоритм максимального правдоподобия |
Алгоритм Neighbor-joining |
Алгоритм UPGMA |
. . * * * * | + | + | + | + |
* * . . * * | + | + | + | + |
* * * * . . | + | + | + | + |
Вывод: реконструированные деревья совпадает по топологии с реальным.
назад
|