Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.fbb.msu.ru/~ramil.mintaev/projects/CLPB_ECOLI/Aln2.php
Дата изменения: Unknown
Дата индексирования: Fri Feb 28 07:03:33 2014
Кодировка: Windows-1251
Парные выравнивания аминокислотных последовательностей.


Парные выравнивания аминокислотных последовательностей.

Работа в командной строке Linux

Попытаемся создать файл, содержащий аминокислотную последовательность в fasta формате белка clpb_ecoli и clpl_lacla. При этом последовательности "добудутся" из банка данных SwissProt Выполняю команду:
seqret sw:p63284 -autо
seqret sw:Q06716 -autо

Появляются нужные мне файлы, содержащие а/п в fasta формате, пригодном для использования в программах из пакета EMBOSS.

Более подробное описание и эмоции, вызванные работой с командной строкой Linux, можно найти
здесь.

Строим и сравниваем оптимальные глобальное и оптимальное локальное выравнивание 2-х последовательностей



----------------------------------------

Попытаемся построить карту локального сходства заданных последовательностей с помощью программы dotmatcher пакета EMBOSS

Для этого выполняем команду dotmatcher clpb_ecoli.fasta clpl_lacla.fasta -graph ps в командной строке Linux.
Полученный файл dotmatcher.ps*

Конвертировал файл postscript в pdf. В конце получил картинку локального сходства:

На картинке очень хорошо заметны две протяженные линии, обозначенные как 1 и 2. Возможно, это функциональные участки, имеющие биологический смысл.

Попытаемся получить несколько субоптимальных локальных выравниваний заданных последовательностей с помощью программы matcher пакета EMBOSS.

Для этого выполняем команду matcher clpb_ecoli.fasta clpl_lacla.fasta -alt 6 в командной строке Linux.
Полученный файл cola.matcher*

Выберим из полученного файла несколько субоптимальных локальных выравниваний:

#--------
#
# Aligned_sequences: 2
# 1: CLPB_ECOLI
# 2: CLPL_LACLA
# Matrix: EBLOSUM62
# Gap_penalty: 14
# Extend_penalty: 4
#
#--------
#=======================================
#
# Length: 18
# Identity:       9/18 (50.0%)
# Similarity:    13/18 (72.2%)
# Gaps:           0/18 ( 0.0%)
# Score: 45
#
#
#=======================================

             610
CLPB_E LFLGPTGVGKTELCKALA
       : .: .::::: . . ::
CLPL_L LLVGESGVGKTAVVEGLA
       180       190


#=======================================
#
# Length: 40
# Identity:      14/40 (35.0%)
# Similarity:    18/40 (45.0%)
# Gaps:           0/40 ( 0.0%)
# Score: 43
#
#
#=======================================

             650       660       670       680
CLPB_E SVSRLVGAPPGYVGYEEGGYLTEAVRRRPYSVILLDEVEK
       :: :: : :   .:  .  .:    .:    ::  ::  :
CLPL_L SVERLTGIPVSDMGANDIEHLKNLDKRLKVMVIGEDEAVK
          450       460       470       480


#=======================================
#
# Length: 26
# Identity:      10/26 (38.5%)
# Similarity:    17/26 (65.4%)
# Gaps:           1/26 ( 3.8%)
# Score: 41
#
#
#=======================================

              140       150
CLPB_E ATTANITQAIEQMRGGESVNDQGAED
       ::  .. :..:.. :   :.: :: :
CLPL_L ATIDDVAQSVERLTG-IPVSDMGAND
        440       450        460


#=======================================