Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~ait/alignment.htm
Дата изменения: Thu May 27 19:58:59 2004
Дата индексирования: Mon Oct 1 22:43:42 2012
Кодировка: Windows-1251
Untitled Document

Глобальное и локальное выравнивание аминокислотных последовательностей

Работа с программами GeneDoc, Excel, Needle, Water и Matcher.
Матрица переходов

Для построения матрицы глобального выравнивания использовались последовательности

  1. seq1-HIATL
  2. seq2-IAT

Параметры для построения матрицы переходов: вес совпадения = 2, вес замены = -1, штраф за делецию = -2.

Красным цветом отмечен путь оптимального пути перехода.

Вес выранивания: 2

  1 HIATL      5
     ||| 
  1  IAT       3
       

 

 

 

Для построения матрицы локального выравнивания использовались последовательности

  1. seq3-ELLLGVNID
  2. seq4- LLNID

 

Красным цветом отмечен путь оптимального выравнивания.

Зеленым цветом отмечен путь субоптимального выравнивания.

Также есть второй субоптимальный путь, вес которого также равен 4. (отмечен голубым цветом)

вес оптимального выравнивания: 6

вес субоптимального выравнивания: 4

          
7 NID      9
  |||
3 NID      5
        

Поиск участков локальной гомологии

Локальное выравнивание строилось для следующих последовательностей:

Последовательность изучаемого белка >sp|P24223|PDXJ_ECOLI Pyridoxal phosphate biosynthetic protein pdxJ (PNP synthase) - Escherichia coli, and Escherichia coli O157:H7.
AELLLGVNIDHIATLRNARGTAYPDPVQAAFIAEQAGADGITVHLREDRRHITDRDVRIL
RQTLDTRMNLEMAVTEEMLAIAVETKPHFCCLVPEKRQEVTTEGGLDVAGQRDKMRDACK
RLADAGIQVSLFIDADEEQIKAAAEVGAPFIEIHTGCYADAKTDAEQAQELARIAKAATF
AASLGLKVNAGHGLTYHNVKAIAAIPEMHELNIGHAIIGRAVMTGLKDAVAEMKRLMLEA
RG
Дополнительные аминокислотные последовательности >uniprot|Q8ZCP4|PDXJ_YERPE Pyridoxal phosphate biosynthetic protein pdxJ (PNP synthase).
MADLLLGVNIDHIATLRNARGTIYPDPVQAAFIAEQAGADGITVHLREDRRHITDRDVRI
LRQTIQTRMNLEMAVTDEMVDIACDIKPHFCCLVPEKRQEVTTEGGLDVAGQVDKMTLAV
GRLADVGILVSLFIDADFRQIDAAVAAGAPYIEIHTGAYADASTVLERQAELMRIAKAAT
YAAGKGLKVNAGHGLTYHNVQPIAALPEMHELNIGHAIIGQAVMTGLAAAVTDMKVLMRE
ARR

Последовательность, созданная из последовательности изучаемого белка ( отмечено краснымв исходном)

>
GVNIDHIATLGLKDAVAEMK

 

Координаты:с 7 по 16; с 227 по 237

>sp|P24223|PDXJ_ECOLI Pyridoxal phosphate biosynthetic protein pdxJ (PNP synthase) - Escherichia coli, and Escherichia coli O157:H7.
MAELLL
GVNIDHIATLRNARGTAYPDPVQAAFIAEQAGADGITVHLREDRRHITDRDVRIL
RQTLDTRMNLEMAVTEEMLAIAVETKPHFCCLVPEKRQEVTTEGGLDVAGQRDKMRDACK
RLADAGIQVSLFIDADEEQIKAAAEVGAPFIEIHTGCYADAKTDAEQAQELARIAKAATF
AASLGLKVNAGHGLTYHNVKAIAAIPEMHELNIGHAIIGRAVMT
GLKDAVAEMKRLMLEA
RG
          10     
PDXJ_E GVNIDHIATL
       ::::::::::
  seq3 GVNIDHIATL
               10
	                220       230    
PDXJ_E LNIGHAIIGRAVMTGLKDAVAEMK
       .:: :      .  ::::::::::
  seq3 VNIDHI-----ATLGLKDAVAEMK
                   10        20
PDXJ_E ASLGLK
       :.::::
  seq3 ATLGLK
        10   

 

Участки гомологии из локального выранивания, созданного программой matcher

# Length: 241
# Identity:     196/241 (81.3%)
# Similarity:   208/241 (86.3%)
# Gaps:           0/241 ( 0.0%)
# Score: 972.0
# 
#
#=======================================

PDXJ_ECOLI         1 AELLLGVNIDHIATLRNARGTAYPDPVQAAFIAEQAGADGITVHLREDRR     50
                     |:|||||||||||||||||||.||||||||||||||||||||||||||||
PDXJ_YERPE         2 ADLLLGVNIDHIATLRNARGTIYPDPVQAAFIAEQAGADGITVHLREDRR     51

PDXJ_ECOLI        51 HITDRDVRILRQTLDTRMNLEMAVTEEMLAIAVETKPHFCCLVPEKRQEV    100
                     |||||||||||||:.||||||||||:||:.||.:.|||||||||||||||
PDXJ_YERPE        52 HITDRDVRILRQTIQTRMNLEMAVTDEMVDIACDIKPHFCCLVPEKRQEV    101

PDXJ_ECOLI       101 TTEGGLDVAGQRDKMRDACKRLADAGIQVSLFIDADEEQIKAAAEVGAPF    150
                     |||||||||||.|||..|..||||.||.||||||||..||.||...|||:
PDXJ_YERPE       102 TTEGGLDVAGQVDKMTLAVGRLADVGILVSLFIDADFRQIDAAVAAGAPY    151

PDXJ_ECOLI       151 IEIHTGCYADAKTDAEQAQELARIAKAATFAASLGLKVNAGHGLTYHNVK    200
                     ||||||.||||.|..|:..||.|||||||:||..|||||||||||||||:
PDXJ_YERPE       152 IEIHTGAYADASTVLERQAELMRIAKAATYAAGKGLKVNAGHGLTYHNVQ    201

PDXJ_ECOLI       201 AIAAIPEMHELNIGHAIIGRAVMTGLKDAVAEMKRLMLEAR    241
                     .|||:||||||||||||||:||||||..||.:||.||.|||
PDXJ_YERPE       202 PIAALPEMHELNIGHAIIGQAVMTGLAAAVTDMKVLMREAR    242


#---------------------------------------
#--------------------------------------- 

Влияние параметров на глобальное выравнивание

Матрица Eblossum40 papopen=1 gapextend=1 Матрица Eblossum80 papopen=1 gapextend=1
# Length: 243
# Identity:      15/243 ( 6.2%)
# Similarity:    17/243 ( 7.0%)
# Gaps:         224/243 (92.2%)
# Score: 98.0
# 
#
#=======================================

PDXJ_ECOLI         1 AELLLGVNIDHIATLRNARGTAYPDPVQAAFIAE-QAGADGITVHLREDR     49
                          ||||||||||    |  ..|    | :|| :              
seq3               1      GVNIDHIATL----G--LKD----A-VAEMK                   20

PDXJ_ECOLI        50 RHITDRDVRILRQTLDTRMNLEMAVTEEMLAIAVETKPHFCCLVPEKRQE     99
                                                                       
seq3              21                                                        20

PDXJ_ECOLI       100 VTTEGGLDVAGQRDKMRDACKRLADAGIQVSLFIDADEEQIKAAAEVGAP    149
                                                                       
seq3              21                                                        20

PDXJ_ECOLI       150 FIEIHTGCYADAKTDAEQAQELARIAKAATFAASLGLKVNAGHGLTYHNV    199
                                                                       
seq3              21                                                        20

PDXJ_ECOLI       200 KAIAAIPEMHELNIGHAIIGRAVMTGLKDAVAEMKRLMLEARG    242
                                                                
seq3              21                                                 20


#---------------------------------------
#---------------------------------------

	  
	 
# Length: 242
# Identity:      13/242 ( 5.4%)
# Similarity:    14/242 ( 5.8%)
# Gaps:         222/242 (91.7%)
# Score: 47.0
# 
#
#=======================================

PDXJ_ECOLI         1 AELLLGVNIDHIATLRNARGTAYPDPVQAAFIAEQAGADGITVHLREDRR     50
                                                                       
seq3               1                                                         0

PDXJ_ECOLI        51 HITDRDVRILRQTLDTRMNLEMAVTEEMLAIAVETKPHFCCLVPEKRQEV    100
                                                                       
seq3               1                                                         0

PDXJ_ECOLI       101 TTEGGLDVAGQRDKMRDACKRLADAGIQVSLFIDADEEQIKAAAEVGAPF    150
                                                                       
seq3               1                                                         0

PDXJ_ECOLI       151 IEIHTGCYADAKTDAEQAQELARIAKAATFAASLGLKVNAGHGLTYHNVK    200
                                                                       
seq3               1                                                         0

PDXJ_ECOLI       201 AIAAIPEMHELNIGHAIIGRAVMTGLKDAVAEMKRLMLEARG    242
                              .:||.|     ....||||||||||        
seq3               1          GVNIDH-----IATLGLKDAVAEMK             20


#---------------------------------------
#---------------------------------------

Изменение штрафа за первый пропуск влияет на установление соответствия между а.к.о двух последовательностей.

В первом случае (Матрица Eblossum40 papopen=1 gapextend=1) выранивание было проведено в начале последовательности, второе (Матрица Eblossum80 papopen=1 gapextend=1) было проведено в совершенно ином месте, уже в конце последовательности.

Изменение матрицы аминокислотных замен ведет к сохранению общего вида выравнивания, но ведет к изменению оценки программой качества выравнивания (в баллах) и близости сравниваемых последовательностей (в процентах):