Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~igogo/Term3/DNA_prot.html
Дата изменения: Mon Nov 13 02:35:44 2006
Дата индексирования: Tue Oct 2 08:45:40 2012
Кодировка: Windows-1251
DNA-Protein complexes

Исследование белок-нуклеиновых контактов


На главную страницу третьего семестра
  1. Получение файлов со структурами, их изучение.

    Заданный файл PDB - 1p8k был получен с сайта PDB (единственная выдача - файл 1p8k.pdb); а биологическая единица изучаемого комплекса - с сайта Macromolecular Structure Database EBI (файл 1p8k_mmol.pdb).
    Следующий этап - изучение полученных структур средствами RasMol.

    Результаты: различий между структурами не обнаружено. Имеются различия в размерах и, соответственно, содержании PDB-файлов: 1p8k.pdb содержит больше информации об "отдельных" компонентах - ДНК и белке (в т.ч. поля REMARK; о последовательностях ДНК и белка - поле SEQRES; о модифицикации аминокислот - поле MODRES (также в HETATM; есть и брутто-формула - поле FORMUL); о вторичной структуре белка (шпильки, стренды)- поля HELIX, SHEET и т.д. - не в том смысл, чтобы перечислить все поля файла PDB). 1p8k_mmol.pdb - тут информация, касающаяся комплекса ДНК-белок вцелом (без "идентификации" отдельных молекул).
    О функциональных особенностях белка (а это интрон-кодируемая эндонуклеаза I-ANII)- см. п. 4.
    В соответствии с заданием, дальнейшая работа ведется с файлом с биологической единицей.

  2. Исследование контактов между молекулами белка и нуклеиновой кислоты.

    Как в тексте полученных документов названы нужные атомы: Необходимо также определить множества полярных и неполярных атомов ДНК. Критерии: полярными атомами считаются все атомы кислорода и азота, а неполярными - все атомы углерода.
    Тогда:
      - pol_dr - полярные атомы 2'-дезоксирибозы;
      - pol_ph - полярные атомы остатков фосфорной кислоты: " *.O?P " (это два атома кислорода: O1P и O2P);
      - pol_bs_mjg (pol_bs_mig) - полярные атомы азотистых оснований, обращенные в большую (малую) бороздку;
      - npolar_drнеполярные атомы 2'-дезоксирибозы: " *.C?* " (эквивалентно: "dna and backbone and carbon", поскольку все атомы углерода остова ДНК находятся в остатке сахара);
      - npolar_bs_mjg (npolar_bs_mig)неполярные атомы ... бороздки: "carbon and ...".

    Был выдан скрипт dna.def. В нем определены еще 3 множества:
      base - все атомы оснований ДНК (эквивалентно dna and not backbone);
      mjg - атомы оснований ДНК, обращенные в большую бороздку ("major groove");
      mig - атомы оснований ДНК, обращенные в малую бороздку ("minor groove").

    При поиске полярных контактов использован порог расстояния в 3,5 Å, а при поиске неполярных - 4,5 Å (cоответственно, полярный контакт, или водородная связь, имеет место, если оба контактирующих атома полярны; неполярный контакт, или гидрофобное взаимодействие, предполагает, что оба атома неполярны).

    Для выполнения поставленной задачи - исследования контактов между молекулами белка и ДНК - составлен данный скрипт ("2 в 1": определение необходимых множеств + выделение исследуемых окрестностей; в поле echo дается "расшифровка" определений).
    Результаты оформлены в таблицу "Число атомов белка, участвующих во взаимодействии с ...":

      Полярные Гидрофобные Всего
    Контакты белка с ...
    ... остатками 2'-дезоксирибозы 8 58 66
    ... остатками фосфорной кислоты 29 34 63
    ... остатками азотистых оснований со стороны большой бороздки 11 46 57
    ... остатками азотистых оснований со стороны малой бороздки 0 0 0

    Итак:

  3. Поиск специфических контактов, обеспечивающих узнавание сайта в молекуле ДНК.

    Задание: "Предположить, какие остатки белка отвечают за специфичность узнавания белком ДНК. ".
    Для выполнения поставленной задачи необходимо посмотреть, какие аминокислотные остатки контактируют с атомами азотистых оснований большой бороздки ДНК ( образуя, соответственно, полярное и неполярное взаимодействия). Это нетрудно сделать, взяв за основу предложенный ранее скрипт. Cписок аминокислотных остатков, образующих полярные контакты (в скобках указаны соответствующие атомы) - следовательно, отвечающих за специфичность узнавания белком ДНК: Гидрофобные взаимодействия образуют (число контактирующих атомов обозначено *): Наиболее интересный, на мой взгляд, контакт Arg 61 (2 полярных взаимодействия + 1 гидрофобное (атом CZ) - "заякоренный а.о."). Этот контакт достоин рассмотрения, т.к.
    Средствами RasMol построено изображение выбранного остатка и контактирующего с ним фрагмента ДНК в шарнирной модели:

    На этой картинке атомы, образующие рассматриваемые полярные взаимодействия, соединены пунктирными линиями. Атомы, образующие гидрофобные контакты - атомы углерода - изображены серыми шариками.
    Скрипт, генерирующий данное изображение, можно увидеть здесь.

    В статье Structural and biochemical analyses of DNA and RNA binding by a bifunctional homing endonuclease and group I intron splicing factor (Jill M. Bolduc et al., 2003) я нашла подтверждение своему предположению: все 4 указанных а.о. arg - Arg 59, Arg 61, Arg 70, Arg 72 - отвечают за специфичность узнавания белком такой пуриновой последовательности ДНК: 5'-GGAGG-3'.
    Статья доступна на этом ресурсе.

  4. Описание функций исследованного белка.

    Найдено описание заданного белка в UniProt и описание соответствующего ДНК-связывающего домена в Pfam (была выбрана ссылка PF00961 в поле PFAM - это и есть ДНК-связывающий домен).

    О белке: он совмещает 2 функции: это интрон-кодируемая ДНК эндонуклеаза I-AniI и мРНК матураза bI1.

    ДНК-связывающий домен - домен LAGLIDADG (на полной доменной структуре по данным Pfam изображен красными блоками):


    Еще одна "визуализация" (теперь изображены только домены LAGLIDADG):

    Эндонуклеазы семейства LAGLIDADG характеризуются способностью "встраивать" в ДНК последовательности ("мобильные элементы" - интроны). 'Homing' - перенос "вставочного" элемента (последовательности) в близкородственную аллель, в которой этого элемента нет. Процесс этот инициируется в т.ч. сайт-специфичными эндонуклеазами семейства LAGLIDADG, кодируемыми открытыми рамками считывания (ORF) в пределах мобильных элементов. Белки этого семейства имют уникальную стратегию узнавания очень длинных сайтов ДНК (15-30 bp), что позволяет свести к минимум "случайную" резку в пределах гена.

    B Pfam было получено множественно выравнивание (оба типа: "сокращенное" - из 91 последовательности и "расширенное" (полное) - из 508 последовательности). Выравнены последовательности доменов, а не всего белка. Значит номер 61 (по последовательности, см. файл 1p8k_mmol.pdb) аминокислотного остатка Arg 61 не будет соответствовать 61ой позиции выравнивания.
    Рассматриваем "сокращенный" вариант выравнивания. И вот что получается: среди консервативных а.о. не оказывается рассмотренного ранее Arg 61. Причем даже не требовалось полной консервативности!!!! Далее открылась очень интересная вещь: когда я попыталась в выравнивании в строке, соответствующей выравниванию рассматриваемого белка, найти целиком участок VSFRKR (это по нумерации pdb остатки с 56 по 61), потерпела неудачу. Так был найден только участок, отмеченный желтым цветом (в нумерации pdb остатки с 56 по 59). А этого участка - совершенно иная последовательность, нежели все в том же pdb. Тогда я вспомнила об обстоятельстве, смутившем меня при получении информации из UniProt: в единственном(!) файле-выдаче UniProt содержится информация о белке в 488 аминокислотных остатка - предшественнике интрон-кодируемой ДНК эндонуклеазы I-AniI; в файле содержится цитохром b.
    Но вот, опять же, с полной доменной структурой я разобралась выше: cytochrome b соответствует зеленому блоку на схеме, т.е. перед LAGLIDADG доменами (т.о. его включение не должно повлиять на выравнивание и, тем более, "разобщение" pdb-шных участков 56-59 и 60-61).

    Asp61 не оказался консервативным. Это может быть связано только с названной выше проблемой. Хотя... еще одно объяснение (разумное ли?:-)): как я уже говорила, белки данного семейства кодируются ORF'ами, имеются ограничения на их длину, позицию. М.б. поэтому не консервативен Asp61. Но это как-то маловероятно.

  5. Построение схемы контактов белка с ДНК.

    Программа nucplot предназначена для визуализации контактов между ДНК и белком. Запускается на сервере kodomo-count с использованием команды:
    nucplot 1p8k_mmol.pdb
    В выдаче получено несколько файлов. Графическое изображение контактов содержится в файле nucplot.ps (всего 4 страницы). Привожу вторую страницу:

    Изучив данную схему, видно следующее:

    Но, несмотря на превосходные результаты работы программы nucplot, результаты "ручного поиска" не стоит игнорировать: вместе они дают нам целостную картину взаимодействия белка и ДНК (так, nucplot хорош для определения полярных контактов; гидрофобных же находится меньше (особенности алгоритма). Но при взаимодействии ДНК и эндонуклеазы их значение велико - см.п.2 "Исследование контактов между молекулами белка и нуклеиновой кислоты").

їNADEZDA TUKHTUBAEVA,2006