|
Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~dracon/t2-files/align.html
Дата изменения: Thu Apr 21 19:56:32 2005 Дата индексирования: Tue Oct 2 09:29:24 2012 Кодировка: Windows-1251 |
| M | K | T | D | ||
| 0 | Ñ-2 | Ñ-4 | Ñ-6 | Ñ-8 | |
| A | Ó-2 | Õ-1 | Ñ-3 | Ñ-5 | Ñ-7 |
| M | Ó-4 | Õ0 | Ñ-2 | Ñ-4 | Ñ-6 |
| K | Ó-6 | Ó-2 | Õ2 | Ñ0 | Ñ-2 |
| C | Ó-8 | Ó-4 | Õ0 | Õ1 | Ñ-1 |
| C | Ó-10 | Ó-6 | Ó-2 | Ó-1 | Õ0 |
- M K T D A M K C C |
| M | K | D | T | T | P | S | L | E | ||
| 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
| K | 0 | 0 | Õ2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| T | 0 | 0 | 0 | Õ4 | Ñ2 | Õ2 | 0 | 0 | 0 | 0 |
| S | 0 | 0 | 0 | Ó2 | Õ3 | Ñ1 | Õ1 | Õ2 | 0 | 0 |
| L | 0 | 0 | 0 | 0 | Ó1 | Õ2 | 0 | 0 | Õ4 | Ñ2 |
| E | 0 | 0 | 0 | 0 | 0 | 0 | Õ1 | 0 | Ó2 | Õ6 |
S L E S L E |
K T K T |
С помощью программы Needle были построены выравнивания с разными параметрами для двух последовательностей:
Параметры первого выравнивания:
Параметры второго выравнивания:
Ниже приведены эти выравнивания.
CLCA_ECOLI 1 MKTDTPSLETPQAARLRRRQLIRQLLERDKTPLAILFMAAVVGTLVGLAA 50
URODEC 1 0
CLCA_ECOLI 51 VAFDKGVAWLQNQRMGALVHTADNYPLLLTVAFLCSAVLAMFGYFLVRKY 100
URODEC 1 0
CLCA_ECOLI 101 APEAGGSGIPEIEGALEDQRPVRWWRVLPVKFFGGLGTLGGGMVLGREGP 150
URODEC 1 0
CLCA_ECOLI 151 TVQIGGNIGRMVLDI-FRLKGDEARHTLLATGAAAGLAAAFNAPLAGILF 199
| ||.: | . | . |. ||||||||||||
URODEC 1 R-VLPVKF-F-G--G----LG-GAAAGLAAAFNA 24
CLCA_ECOLI 200 IIEEMRPQFRYTLISIKAVFIGVIMSTIMYRIFNHEVALIDVGKLSDAPL 249
URODEC 25 24
CLCA_ECOLI 250 NTLWLYLILGIIFGIFGPIFNKWVLGMQDLLHRVHGGNITKWVLMGGAIG 299
URODEC 25 24
CLCA_ECOLI 300 GLCGLLGFVAPATSGGGFNLIPIATAGNFSMGMLVFIFVARVITTLLCFS 349
URODEC 25 24
CLCA_ECOLI 350 SGAPGGIFAPMLALGTVLGTAFGMVAVELFPQYHLEAGTFAIAGMGALLA 399
URODEC 25 24
CLCA_ECOLI 400 ASIRAPLTGIILVLEMTDNYQLILPMIITGLGATLLAQFTGGKPLYSAIL 449
URODEC 25 24
CLCA_ECOLI 450 ARTLAKQEAEQLARSKAASASENT 473
URODEC 25 24
CLCA_ECOLI 1 MKTDTPSLETPQAARLRRRQLIRQLLERDKTPLAILFMAAVVGTLVGLAA 50
URODEC 1 0
CLCA_ECOLI 51 VAFDKGVAWLQNQRMGALVHTADNYPLLLTVAFLCSAVLAMFGYFLVRKY 100
URODEC 1 0
CLCA_ECOLI 101 APEAGGSGIPEIEGALEDQRPVRWWRVLPVKFFGGLGTLGGGMVLGREGP 150
||||||||||||
URODEC 1 RVLPVKFFGGLG------------- 12
CLCA_ECOLI 151 TVQIGGNIGRMVLDIFRLKGDEARHTLLATGAAAGLAAAFNAPLAGILFI 200
||||||||||||
URODEC 13 ------------------------------GAAAGLAAAFNA 24
CLCA_ECOLI 201 IEEMRPQFRYTLISIKAVFIGVIMSTIMYRIFNHEVALIDVGKLSDAPLN 250
URODEC 25 24
CLCA_ECOLI 251 TLWLYLILGIIFGIFGPIFNKWVLGMQDLLHRVHGGNITKWVLMGGAIGG 300
URODEC 25 24
CLCA_ECOLI 301 LCGLLGFVAPATSGGGFNLIPIATAGNFSMGMLVFIFVARVITTLLCFSS 350
URODEC 25 24
CLCA_ECOLI 351 GAPGGIFAPMLALGTVLGTAFGMVAVELFPQYHLEAGTFAIAGMGALLAA 400
URODEC 25 24
CLCA_ECOLI 401 SIRAPLTGIILVLEMTDNYQLILPMIITGLGATLLAQFTGGKPLYSAILA 450
URODEC 25 24
CLCA_ECOLI 451 RTLAKQEAEQLARSKAASASENT 473
URODEC 25 24
Учитывая, что программа Needle не считает крайние делеции, в первом случае наблюдается 6 делеций, а во втором - только 1. Так происходит, потому что задача программы - найти такое выравнивание, при котором достигается наибольший вес выравнивания. Естественно, при линейной системе штрафов (первый случай) "выгодней" сделать больше делеций, совместив тем самым больше аминокислот, чем при аффинной системе штрафов (второй случай), где одна большая делеция, скорее всего, даст больший вес, чем ряд мелких вставок.
Вот так вот все и получается...
© Трушкин Никита,2005