Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~alexus/projects/protein_search.html
Дата изменения: Thu May 27 22:36:47 2010
Дата индексирования: Tue Oct 2 14:49:23 2012
Кодировка: Windows-1251
Поиск белка с заданной функциональной специфичностью

 

Поиск белка с заданной функциональной специфичностью

 

  1. Первый этап: описание функциональных особенностей заданной группы.
  2. В качестве белка-прототипа был задан белок RbsR_Ecoli, выделенный из Escherichia coli (strain K-12). Описание свойств данного белка было взято на сайте EcoCyct.
    Длина последовательности RbsR_Ecoli составляет 330 аминокислотных остатков.

    RbsR_Ecoli - транскрипционный репрессор рибозного оперона. Ингибируется, будучи связанным с D-рибозой, не препятствуя транскрипции оперона. Т.е. для активации транскрипции оперона необходимо наличие D-рибозы и отсутствие глюкозы.
    RbsR принадлежит к семейству GalR/LacI.

    Термины GO:

    Biological Process: GO:0006350 - transcription (транскрипция)
    GO:0006355 - regulation of transcription, DNA-dependent (регуляция ДНК-зависимой транскрипции)
    GO:0016052 - carbohydrate catabolic process (процесс углеводного катаболизма)
    Molecular Function: GO:0005515 - protein binding (связывание с белком)
    GO:0003677 - DNA binding (связывание с ДНК)
    GO:0003700 - transcription factor activity (активность транскрипционного фактора)
    GO:0016564 - transcription repressor activity (активность транскрипционного репрессора)
    Cellular Component: GO:0005622 - intracellular (внутриклеточный)
    GO:0005737 - cytoplasm (цитоплазма)



    Как мы видим, в аннотации GO ничего не сказано об эффекторе белка RbsR_Ecoli - рибоозе. Структурная формула D-рибозы (БД KEGG):

  3. Второй этап: создание множественного выравнивания доменов с разметкой по группам специфичности.
    1. Создать хорошее множественное выравнивание доменов заданной группы белков (столбец "Общая работа").
    2. Необходимо создать выравнивание эффекторсвязывающих доменов белков группы специфичности galrs. Воспользуемся БД PFAM.
      Доменная структура белка-прототипа GalR_Ecoli группы galrs выглядет следующим образом:

      Зеленым цветом показан ДНК-связывающий домен, розовым - эффекторсвязывающий. Перейдя на страничку с описанием эффекторсвязывающего домена, получим выравнивание всех доменов этого типа в формате FASTA (PF00532_full.fasta). Для того, чтобы из полного выравнивания получить выравнивание нужных нам доменов (galrs), напишем скрипт (galrs.scr). Так, множественное выравнивание эффекторсвязывающих доменов белков группы специфичности galrs сохранено в файл PF00532_galrs.fasta.

    3. Создать единое множественное выравнивание заданных доменов всех групп специфичности (столбец "Для исследования").
    4. Выравнивание ДНК-связывающих доменов белков группы rbsr импортировали в Genedoc. Объявили его последовательности новой группой (кнопка меню "Groups=>Edit sequence groups"). Назвали группу именем группы специфичности rbsr. Задали зеленый цвет для маркировки последовательностей этой группы.
      Затем последовательно добавляли по одному выравниванию доменов с разной специфичностью (кнопка "S"), каждый раз объявляя новую группу.
      Получили раскраску по группам (меню "Groups"), наиболее наглядно иллюстрирующую различия между группами. Способ раскраски "Shade Group Conserved": позиции, консервативные в пределах группы, раскрашены в цвет группы, а позиции, консервативные для всех последовательностей, окрашены в черный цвет. Изображение выравнивания - dna-bind.jpg. Файл с выравниванием - dna-bind.msf. Позиция 59 - консервативная для группы rbsr.

    5. Создайте лого-изображения полного выравнивания заданных доменов и выравнивания доменов заданной группы специфичности.
    6. Лого-изображение полного выравнивания эффекторсвязывающих доменов

      Лого-изображение выравнивания эффекторсвязывающих доменов белков группы специфичности galrs

      Лого-изображение выравнивания ДНК-связывающих доменов белков всех групп специфичности

      Лого-изображение выравнивания ДНК-связывающих доменов белков группы специфичности rbsr

  4. Третий этап: создание профиля и поиск белка с заданной специфичностью (rbsr).

    1. Создание профиля для ДНК-связывающего домена белков заданной группы специфичности (rbsr)

      При помощи программы pfw пакета PFTOOLs добавим веса в выравнивание ДНК-связывающих доменов белков группы rbsr:

      pfw -m dna_rbsr.fasta > dna_rbsr.weighted.fasta

      Построим профиль:

      pfmake -m dna_rbsr.weighted.fasta /usr/share/pftools23/blosum45.cmp > dna_rbsr.profile.prf

      Нормируем профиль относительно случайной базы:

      autoscale -m dna_rbsr.profile.prf > dnarbsrprofile.scaled.prf
    2. Поиск белков заданной группы специфичности (rbsr)

    В протеоме Marinomonas sp. (strain MWYL1) проведем поиск белков группы rbsr по полученному профилю:

    pfsearch -x -f dnarbsrprofile.scaled.prf Marinomonas.fasta > dnarbsr2_marin.search

    Найдено 13 возможных гомологов. При поиске с порогом 20.0 был найден всего один белок.

    При помощи программы ClustalW2 получим выравнивание только что найденных последовательностей (dnarbsr2_marin.search) с уже имеющимися последовательностями ДНК-связывающих доменов белков группы rbsr (dna_rbsr.fasta).Полученное выравнивание (dna_rbsr_final.aln) импортируем в GeneDoc. Вот его изображение. Желтым цветом помечена группа предполагаемых гомологов, зеленым - белки группы rbsr. Оранжевым (у белков группы rbsr) помечены позиции, отвечающие за ДНК-связывание. Как видно, можно сделать предположение, что все находки пренадлежат семейству LACI. Но в других группах специфичности эти же позиции отвечают за ДНК-связывание. Поэтому необходимо учесть отличие группы rbsr от других. В приведенном выравнивании консервативная для группы rbsr позиция - 35 - изолейцин. Белок первый и четвертый сверху (10.785 и 10.380) имеют в данной позиции лейцин. Поэтому можно предположить, что эти белки относятся в группе специфичности rbsr.

©2008-2010 Михальченко Алексей