Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.fbb.msu.ru/~ogion/projects/DP-cont/DP-cont.htm
Дата изменения: Wed Mar 5 00:43:38 2008
Дата индексирования: Tue Oct 2 11:06:09 2012
Кодировка: Windows-1251
Alex Makarov. Personal Page. DNA-Protein contacts.
Пространственные структуры нуклеиновых кислот
Комплексы ДНК-Белок.
GO TO:
Таблица контактов ДНК-БЕЛОК
В данной работе нам было пердложенно исселдовать заданную структуру из PDB (code: 1K3X), содержащую белок DNA repair enzyme endonuclease viii класса E.C.4.2.99.18, на наличие в ней связей между ДНК и Н-терминальным доменом белка, выяснить их количество и характер.
Для этого из исходного PDB файла были удалены все остатки, начиная с 105-ого.
Поиск связей осуществлялся программой RasMol с использованием следующего скрипта (note: скрипт не демострирует самих связей в виде пунктирных палочек и не пишет расстояний - ибо это можно делать только при работе с отдельными атомами, а не со множествами, но в процессе работы скрипта можно измерять расстояния), в результате получились следующие данные:

Таблица. Контакты разного типа в комплексе 1K3X

  Полярные Гидрофобные Всего
Контакты белка с ...      
... остатками 2'-дезоксирибозы 1 26 27
... остатками фосфорной кислоты 11 - 11
... остатками азотистых оснований со стороны большой бороздки 0 4 4
... остатками азотистых оснований со стороны малой бороздки 1 3 4

Из таблицы хорошо видно, что белок контактирует в основном с атомами сахарных остатков и полярными атомами фосфатов, что видимо объяснеятся тем, что атомы оснований смотрят скорее "внутрь" спирали.
Поиск специфических контактов, обеспечивающих узнавание сайта в молекуле ДНК
В качестве наиболее специфичного контакта между ДНК и Н-терминальным доменом белка были выбраны контакты трех последовательно лежащих аминокислот GLN69, LEU70 и TYR71, а так же двух последовательных ак PRO1 и GLN2, с фрагментом моей днк. Особенность этого контакта состоит в том, что ДНК в этом месте явно дефектна: Выделенный красным Тимин имеет разорванное сахарное кольцо, а основание вообще отсутсвует. Особожденный из кольца, и выставленный тем самым вбок атом O4' связан полярной связью с одним из OE атомов GLN2, в брешь в бороздке между двумя цепями входит триплет GLN69-LEU70-TYR71, взаимодействующий как полярным, так и гидрофобным способом с окружающими его нуклеотидами. Очевидно, что такой контакт возможен только при наличии разорванного кольца и бреши между двумя цепями, образованной отсутсвием основания у дефектного нуклеотида.

Описание белка и его основных доменов в базах Uniprot и Pfam.
Мой белок записан в базе Uniprot как END8_ECOLI и является DNA repair enzyme endonuclease viii. Это белок E.Coli K12(как впрочем вероятно и других штаммов). Он принимает участие в процессах ремонта поврежденных вследствие окисления или мутаций ДНК. Данный белок узнает, прежде всего, поврежденные пиримидины, такие как тимингликоль, 5,6-дегидроурацил, 5,6-дегидротимин. Будучи лиазой, он удаляет поврежденные основания, оставляя разрез на поврежденной цепи ДНК-овой спирали, который, видимо, затем должен узнаваться другими ремонтными белками, призванными заделать эту щель. При этом этот белок вместе с поврежденным основанием и его сахарным кольцом удаляет и оба фосфата с 5' и 3' концов.

Исходя из данных Pfam в белке есть два домена:

Source Domain Start End
PfamA Fapy_DNA_glyco 1 104
PfamA H2TH 126 214


Первый домен - тот, который мы и рассматриваем - это собственно ремонтный домен, который осуществляет удаление поврежденных оснований из ДНК.
Второй домен является по сути ДНК-связывающим доменом.
Поиск контактов ДНК-белок программой nucplot
Так же для поиска контактов ДНК-белок в моей структуре была использована программа nucplot. К сожалению исходный файл не обрабатывался программой, поэтому он был изменен следующим образом: все группы атомов вида DG, DC, DT и DA были заменены на G, C, T и А соответсвенно; группы BRU были заменены на T. В обозначениях всех атомов сахаров в днк " ' " был заменен на " * ", а все атомы OP1 и OP2 на O1P и O2P соответсвенно. Помимо этого из записи были удалены все атомы воды, дабы не захламлять рисунок. После этой замены nucplot обработал полученный файл pdb и выдал следующий результат:

Из результатов видно, что предложенные в качестве специфческих контактов мотивы (GLN69-LEU70-TYR71) и (PRO1-GLN2) дейтвительно специфически взаимодейтсвует 1-ый с 407-ым A, у которого нет парного основания, 2-ой - с дефектиыным 427-ым Т (DA407 и PED427 на рисунке выше - картинка создана с "новоформатного" pdb).

NUCPLOT v.1.0  -  Bond file (1K3X.bond)
-----------------------------------------------

**** Hydrogen Bonds ***************************
      Donor               Acceptor     Distance
LYS A   52    NZ       G C  428    O1P   2.71
LYS A   52    NZ       A C  429    O2P   2.72
HIS A   67    NE2      A C  429    O1P   2.74
GLN A   69    NE2      A B  407    N3    2.93
VAL A   88    N        C B  409    O1P   2.86
ARG A   90    NH1      T B  408    O1P   2.90
ARG A   90    NH2      T B  408    O1P   2.92
SER A  104    OG       C B  409    O1P   2.67


**** Non Bonded Contacts **********************
     protein                DNA        Distance
PRO A    1    C        T C  427    C1*   2.96
PRO A    1    CD       T C  427    C2*   3.29
GLU A    2    OE2      T C  427    C4*   3.22
GLU A    2    OE2      T C  427    O4*   2.56
TYR A   71    OH       A B  407    C1*   3.22
ARG A   87    CA       C B  409    O1P   3.25


**** Covalent Bonds ***************************
     protein                DNA        Distance
PRO A    1    N        T C  427    C1*   2.96


В целом же сравнивать результаты полученные в ручную в первом задании и этой программы сложно: Во-первых, программа закономерно считает, что кислороды остатков фосфорной кислоты образуют скорее водородные связи с белком, нежели полярные, в то время как мы считаем их полярными, во-вторых, программа в принципе настроена искать прежде всего водородные связи, считая остальные ги дрофобные взаимодействия не столь важными.
Ниже представлено выравнивание моего домена по базе Pfam (выравнивание было сделано по всем имеющимся белкам с этим доменом - их 665шт.):


Как видно по выравниванию, пара PRO1-GLN2 действительно является довольно постоянным мотивом в моем домене.
Выделенный же мной триплет оказался менее постоянным. Наиболее консервативным оказался Leu70, в то время как два остальных остатка варьировались довольно заметно.

© designed by Alex Makarov