Документ взят из кэша поисковой машины. Адрес оригинального документа : http://dualopt1.cmm.msu.ru/pub/Education/WebHome/task_modeller_2009.doc
Дата изменения: Thu Apr 29 20:35:45 2010
Дата индексирования: Fri Feb 28 20:27:51 2014
Кодировка: koi8-r




Задание 1: моделирование структуры белка по гомологии.

Вы будете работать с белком лизоцимом из указанного организма. Используя
известную структуру лизоцима форели как образец, Вам необходимо построить
модель комплекса Вашего белка с лигандом.

Постройте выравнивание последовательности из структуры ID: 1lmp и
предложенного Вам белка. Рекомендуемые ресурсы и программы:
http://www.genebee.msu.su/clustal/

и GeneDoc

Полученное выравнивание сохраните в формате PIR.
Программе MODELLER для моделирования структуры белков, в качестве входных
данных нужны: управляющий скрипт, файл pdb со структурой-образцом, файл
выравнивания с дополнительной информацией.


Модификация файла выравнивания:
Переименуйте последовательность в файле выравнивания так:
|Было: |Стало |
|>P1;uniprot|P37712|LYSC_CAMDR |>P1;seq |
|>P1;1LMP__|PDBID|CHAIN|SEQUENCE |>P1;1lmp |


После имени последовательности моделируемого белка добавьте строчку:

sequence:ХХХХХ::::::: 0.00: 0.00

эта строчка описывает входные параметры последовательности для modeller.
После имени последовательности белка-образца добавьте:

structureX:1lmp_now.ent:1 :A: 132 :A:undefined:undefined:-1.00:-1.00

эта строчка описывает, какой файл содержит структуру белка с этой
последовательностью, номера первой и последней аминокислот в структуре,
идентификатор цепи и т.д.
В конце каждой последовательности добавьте символы

/.*

(должна остаться только одна звездочка в конце посл-ти)
Символ "/ " означает конец цепи белка. Точка указывает на то, что имеется
один лиганд (если бы было два - стояли бы две точки). "*" - символ конца
последовательности.

Модификация файла со структурой:
удалите всю воду из структуры (в текстовом редакторе)
всем атомам лиганда присвойте один и тот же номер "остатка" (MODELLER
считает, что один лиганд = один остаток) и модифицируйте имена атомов
каждого остатка, добавив в конец буквы A, B, C. Смысл операции в том, что
атомы остатка 130 имели индекс А, атомы остатка 131 имели индекс В и т.д.
Пример:


|Было: |Стало |
|HETATM 1014 O7 NAG 130 |HETATM 1014 O7A NAG 130 |
|HETATM 1015 C1 NAG 131 |HETATM 1015 C1B NAG 130 |

сохраните в файле 1lmp_now.ent


Создание управляющего скрипта my_seq.py (my_seq - имя Вашей
последовательности, например, lysc_chram)

Вам представляется следующая заготовка:

from modeller.automodel import *
class mymodel(automodel):
def special_restraints(self, aln):
rsr = self.restraints
for ids in (('OD1:98', 'O6A:131'),
('N:65', 'O7B:132'),
('OD2:73', 'O1C:133')):
rsr.add(atom_ids=ids, restraint_parameters=(2, 1, 1, 22, 2, 2,
0, 3.0, 0.1))
env = environ()
env.io.hetatm = True
a = mymodel(env, alnfile='test1.ali', knowns=('1lmp'), sequence='seq')
a.starting_model = 1
a.ending_model = 5
a.make()

В скрипте указано
что нужно использовать стандартные ограничения на длины связей и валентные
углы в полипептидной цепи (строчка 4)
что дополнительно нужно сохранять взаимное расположение определенных пар
атомов;

в данном случае трех атомов белка, образующих водородные связи с тремя
атомами лиганда - строчки 5-7 с ID пар атомов; параметры взаимного
расположения атомов пары описаны в строчке 8 . 3 точки могут однозначно
расположить сложную структуру в пространстве, поэтому мы выбираем
водородные связи как источник данных точек.
что ковалентные связи в гетероатомах нужно вычислять по расстояниям между
атомами (так же, как это делает Rasmol) - строчка 10
имя файла с выравниванием и имена последовательностей образца и
моделируемого белка - строчка 11 (а имя файла со структурой содержится в
выравнивании)
число и номера моделей, которые нужно построить (в данном примере - 5
моделей) - строки 12-13
что пора строить модель - строчка 14

В скрипте Вам необходимо отредактировать строчки, в которых указаны какие
водородные связи белка с лигандом должны быть В БУДУЩЕЙ МОДЕЛИ. Номера
остатков и имена нужных атомов определите по выравниванию и тому, какие
водородные связи имеются в образце. Критерий водородной связи - расстояние
менее 3 ангстрем между азотом или кислородом белка с подходящими атомами
лиганда.


Если в моделируемом белке число остатков не совпадает с числом остатков в
белке-образце, то номера "остатков" лиганда изменятся.


ВНИМАНИЕ. В скриптовом языке (на основе python ) важно с какой строчки
начинается информация.

Соблюдайте предложенный в заготовке синтаксис.


Запустите исполнение скрипта командой : mod8v1 myscript &

(на kodomo-count)
Просмотрите полученные Вами модели.
Проверьте качество моделей и выберите лучшую. На сайте
http://swift.cmbi.ru.nl/servers/html/modcheck.html доступна программа
проверки качества для "своей" структуры. Выберете лучшую модель для
дальнейшей работы.
Подсказки.
Последовательность из pdb файла удобно найти, используя новый сайт банка
PDB по адресу http://pdbbeta.rcsb.org/pdb/Welcome.do . Программе ClustalW
сразу укажите формат выравнивания PIR.
Для поиска контактирующих атомов используйте RASMOL. Напоминаем синтаксис:
select within( 3. , NAG) and not HOH
Для поиска номеров остатков, которые будут контактировать с лигандом в
Вашей модели можно воспользоваться GeneDoc.
Для выполнения команды моделирования зайдите на kodomo-count с помощью
putty. Все входные файлы для моделирования сохраните в Unix-формате с
помощью FAR (Shift+F3)