Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~danilenko/gene_reconstruct.html
Дата изменения: Fri Mar 21 18:09:11 2008 Дата индексирования: Tue Oct 2 05:16:42 2012 Кодировка: Windows-1251 |
Дана скобочная формула: (((А:80,B:80):40,(C:50,D:50):10):25,(E:60,F:60):4).
По ней построено дерево:
Дерево не ультраметрично. Если мы считаем, что у него есть корень - достаточно близкий родственник все 6 организмов, то ближе всего к нему находятся организмы E и F, а самые далекие - A и B.
A | B | C | D | E | F |
+ | + | - | - | - | - |
+ | + | + | + | - | - |
- | - | + | + | - | - |
(считаем, что в корне находится последовательность гена белка SYH_ECOLI).
Длина гена 1275 нуклеотидов.
Формула для пересчета (где N - требуемое количество мутаций на 100 нуклеотидов): (1275*N)/100,
Скрипт:
используется следующая команда (здесь n - количество мутаций на всю последовательность)
msbar infile outfile -point 4 -count n -auto
msbar syh_ecoli.fasta ABCD.fasta -point 4 -count 318 -auto
msbar ABCD.fasta CD.fasta -point 4 -count 127 -auto
msbar ABCD.fasta AB.fasta -point 4 -count 510 -auto
msbar CD.fasta C.fasta -point 4 -count 637 -auto
msbar CD.fasta D.fasta -point 4 -count 637 -auto
msbar AB.fasta A.fasta -point 4 -count 1020 -auto
msbar AB.fasta B.fasta -point 4 -count 1020 -auto
msbar syh_ecoli.fasta EF.fasta -point 4 -count 51 -auto
msbar EF.fasta E.fasta -point 4 -count 765 -auto
msbar EF.fasta F.fasta -point 4 -count 765 -auto
+------------------B | | +---------D | | 1-----------2 +------------F | | +--------4 | +--3 +--------------E | | | +------------C | +-----------------A
Скобочная формула: (B:0.61992,(D:0.33320,((F:0.42395,E:0.49428):0.28544, C:0.40714):0.04978):0.40610,A:0.59717).
UPGMA method Negative branch lengths allowed +------------------------------------A +-----------4 ! +------------------------------------B ! --5 +-----------------------C ! +-----------1 ! ! +-----------------------D +------------3 ! +---------------------------E +-------2 +---------------------------F
Скобочная формула: ((A:0.61301,B:0.61301):0.19982,((C:0.39626,D:0.39626):0.19460, (E:0.46443,F:0.46443):0.12643):0.22197).
Neighbor-joining method Negative branch lengths allowed +-----------------B ! ! +----------D 1------------3 ! ! +------------C ! +-4 ! ! +---------------E ! +--------2 ! +-----------F ! +-------------------A
Скобочная формула: (B:0.57514,(D:0.34825,(C:0.43559,(E:0.52284,F:0.40602):0.29343):0.03627):0.41745,A:0.65088)
ABCDEF | Исходная последовательнось | Алгоритм максимального правдоподобия | Алгоритм UPGMA | Алгоритм Neighbor-Joining |
**.... | + | + | + | + |
****.. | + | + | + | + |
..**.. | + | - | + | - |
....** | + | + | + | + |
Как можно заметить, алгоритмы максимального правдоподобия и Neighbor-Joining построили одинаковые деревья, причем они оба не выделили отдельного предка для C и D. Алгоритм UPGMA построил дерево, идентичное по топологии исходному, если считать исходное дерево бескорневым. Таким образом, вновь созданные деревья оказались похожими на исходное, но все же с некоторыми отличиями. Это подтверждает то, что с помощью деревьев можно делать предположения о родстве и ходе эволюции лишь с некоторой вероятностью. При попытках описать эволюцию и происхождение таксонов опираются на различные деревья, построенные для многих генов, и консенсусное дерево дает более достоверную информацию о происходении и родстве организмов.