Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~plazmoliz/Term2/Cr_2.html
Дата изменения: Fri Apr 4 02:09:28 2008
Дата индексирования: Tue Oct 2 08:58:33 2012
Кодировка: Windows-1251
Биологическое выравнивание.

Биологический смысл выравнивания последовательностей белков

Задача:

состоит в том ,что бы построить выравнивание двух данных фрагментов последовательностей гомологичных белков - поринов (порины образуют поры во внешней мембране грамотрицательных бактерий) программой полного парного выравнивания с биологически обоснованным выравниванием построенным при рассмотрении расположения данных фрагментов в пространстве.

Дано:

1. Последовательности шести гомологичных белков-Porins_6.fasta

2.Совмещенные пространственные структуры тех же шести поринов Porins_6.ent

3.Указание фрагментов двух последовательностей.(239-275:Е , 230-264:F)

Выполнение:

1.Для извлечения необходимых фрагментов последовательности из файла Porins_6.ent необходимо выполнить команды пакета EMBOSS:

seqret porins_6.fasta:E[239:275] region_1.fasta

seqret porins_6.fasta:F[230:264] region_2.fasta

Полученные файлы будут содержать последовательности указанных участков.

2.Автоматическое выравнивание 2х последовательностей было сделано при помощи команды Needle.

Needle region_1.fasta region_2.fasta Petrova_auto.msf -aformat msf

Файл содержащий автовыравнивание Petrova_auto.msf

3. Для получения биологически обоснованного выравнивания необходимо рассмотреть расположения пространственных структур исследуемых фрагментов.Для этого в программе RasMol открывается файл Porins_6.ent. Далее выполняюся команды определяющие 4 подмножества:

define chain_1 *:E

define chain_2 *:F

define region_1 239-275

define region_2 230-264

Затем запускается скрипт ( предоставленный А.В.Алексеевским),который выделяет шариками Cα-атомы двух фрагментов, сближенные менее чем на 2 ангстрема.

После чего можем наблюдать следующее :

На картинке шариками изображены Cαатомы, сближенные менее,чем на 2 ангстрема.
На картинке шариками изображены Cαатомы, сближенные менее, чем на 4 ангстрема.

Если мы видим что имеются схожие пространственные структуры (определяющиеся аминокислотными последовательностями) , то справедливо говорить что на этих участках аминокислотная последовательность будет консервативна и /или будут замены на аминокислоты, выполняющие сходную функцию(что и обеспечит сохранение пространственной структуры).

Близкие друг другу Cα-атомы определят консервативные аминокислоты, которые в биологически обоснованном выравнивание должны располагаться одна под другой .

При запуске скрипта с параметром 2 ангстрема (рис. слева), даже невооруженным глазом видно, что структуруры похожи на более длинном отрезке, нежели тот, на котором выделены Cα-атомы. Поэтому для получения лучших результатов скрипт был перезапущен с параметром 4 ангстрема. (рис. справа).Приэтом ,несмотря на выделенные атомы хорошо видно некоторое расхож дение цепей относительно друг друга.Поэтому, логично предположить что атомы аминокислот,совме щающиеся при 2 ангстремых либо консервативны,либо функционально консервативны, а при 4хангстремном совмещении выделяются такие пары аминокислот, что бы сохранялась длина и конформация полипептидной цепи.

На основании полученного совмещение в программе GenDoc было построено биологическое выравнивание. Где совмещенным атомам строго соответствуют совмещенные аминокислоты.

3.Биологическое выравнивание было размечено по следующему принципу:


В строчке Aligned поставьте букву A (от "aligned") "A" отмечены колонки, сопоставленые на основании совмещения структур, а также комонки слева и справа от которых уже стоят буквы A (скорее всего, расстояние между соответствующими Cα-атомами немножко превысило порог 4 ангстрема.) "A"удалена из колонок, по соседству с которыми и справа, и слева буква A не стоит (скорее всего, это "случайное" совпадение Cα-атомов в пространстве).

4.Сравнение выравниваний.

Полное парное выравнивание программы needle:

E *TFGATTVGGYVQVLDIDTIDDVTYYGLGASYDLGGGA 37

F YAFGATTVRAYVS**DIDRAGADTAYGIGADYQFAEG* 35

Биологически обоснованное выравнивание:

E *TFGATTVGG YVQVLDIDTI DDV*TYYGLG ASYDLGGGA

F YAFGATTVRA YVSDID**R* AGADTAYGIG ADYQFAEG*     AAAAAAAAAAAAAAA         AAAAAAAA  AAAAAAAA

Некоторые характерискики биологического выравнивания:

1.Суммарная длина биологически обоснованных участков выравнивания =31

2. Процент от общего числа позиций выравнивания =31/39*100=79.48%

3.Число совпадающих остатков на биологически обоснованных участках выравнивания =17

4. Процент совпадающих остатков на биологически обоснованных участках выравнивания=17/31*100=54.83%

5.Число функционально сходных остатков на биологически обоснованных участках выравнивания= 18

6. Процент функционально сходных остатков на биологически обоснованных участках выравнивания= 18/31*100=58.06%

Сравнение выравниваний

Сходства:

  1. Совпадают выравнивания участков с 239 по 250 аминокислоту (2-13 позиции в выравнивании) и с 261 по 275 аминокислоту (24-38 позиции в выравнивани) остатков в auto соответственно с 231 по 242 аминокислоту (2-13 позиции в выравнивани)и с 252 по 264 аминокислоту (25-39) позиции в выравнивания)bio.Эти участки выделены красным цветом.
  2. Различия:

  3. В bio выравненными являются 260 аминокислота с 247(выделены оранжевым), чего не наблюдается в auto.
  4. Биологически выравненный участок 251-253 амин-ту с участком 243-245(14-16 позиции,выделены синим), не является таковым в auto выравнивание,поскольку программа посчитала,что лучше выровнять участок 253-255 с участком 243-245 (16-18 позиции в auto, выделено фиолетовым),т.к тогда этот участок полностью консервативен, в отличие от bio выравненного участка, где аминокислоты консервативны лишь функционально.

    И с точки зрения программного алгоритма лучше сопоставить полностью совпадающие аминокислоты - поэтому появляются различия в данных выравниваниях, а также демонстрирует,тот факт,что не всегда полученные программой выравнивания несут смысловую нагрузку.

    Второй семестр

    Первый семестр

    Главная страница


    ©Петрова Светлана,2007