1. Первый этап: описание функциональных особенностей заданной группы.
Для работы мне был дан белок-прототип PurR_Ecoli.
На сайте EcoCyc, а именно на странице
"Escherichia coli K-12 substr. MG1655 Protein: PurR transcriptional repressor"
была получена информация о специфических функциональных свойствах.
PurR - это транскрипционный репрессор семейства белков GalR/LacI. Его димер контролирует транскрипцию несколько генов, участвующих в биосинтезе пуриновых и пиримидиновых нуклеотидов и в синтезе самого PurR. Он связывается с двумя продуктами метаболизма пурина: гипоксантином и гуанином, что позволяет ему связаться с ДНК. Сайт связывания на ДНК состоит из 16 пар нуклеотидов, представляет из себя инвертированный повтор.
В БД KEGG находим структурные формулы лигандов:
Гипоксантин | Гуанин |
2. Второй этап: создание множественного выравнивания доменов с разметкой по группам специфичности.
1. Создать хорошее множественное выравнивание доменов заданной группы белков.
Для этого задания мне определили группу специфичность purr и ДНК-связывающий домен. По картинке с мотивами в БД InterPro для моего белка-прототипа мотив для ДНК-связывающего домена в БД SMART оказался самым длинным. Поэтому будет удобней работать с доменами этой БД.
В SMART мной были получены:
- представительское выравнивание ДНК-связывающих доменов HTH_LACI семейства LACI (SMART.fasta).
- последовательности ДНК-связывающих доменов всех бактериальных белков этого семейства (dna_purr_all.fasta)
Окончательное выравнивание группы специфичности: dna_purr_aln.fasta.
2. Создать единое множественное выравнивание заданных доменов всех групп специфичности.
Импортируем выравнивания всех групп специфичности в GeneDoc. Для ДНК-связывающих доменов сдвинем группы так, чтоб консервативные позиции оказались друг под другом. Удалим колонки с гэпами. Записи различных групп специфичности располагаются рядом. Заданная группа специфичности находится на самом верху.
- Ракраска остатков была выполнена следующим образом:
- каждая группа специфичности покрашена отдельным цветом;
- способ раскраски "Shade Group Conserved", то есть позиции, консервативные в пределах группы, раскрашены в цвет группы, а позиции, консервативные для всех последовательностей, - в черный цвет;
- позиции, консервативные в пределах каждой группы, но в которых находятся разные остатки в разных группах, раскрашены у первой последовательности зеленым цветом.
- Эффекторсвязывающий домен: effectbind.gif
- ДНК-связывающий домен: DNAbind.gif
3. Создайте лого-изображения полного выравнивания заданных доменов и выравнивания доменов заданной группы специфичности.
Для создания лого-изображений использовались выравнивания с удаленными колонками, состоящими только из гэпов.- Эффекторсвязывающий домен:
- Logo для полного выравнивания: logo_effect.png
- Logo для выравнивания группы purr: logo_purr.png
- ДНК-связывающий домен:
- Logo для полного выравнивания: logo_DNA.png
- Logo для выравнивания группы purr: logo_purrDNA.png
3. Третий этап: поиск белка заданной группы специфичности в протеоме
Был задан протеом организма Pseudomonas aeruginosa. На сервере SRS были получены последовательности всех белков из TrEMBL с ID: *_PSEAE, соответствующими белкам данного организма. Используем БД TrEMBL, так как в ней имеется информация обо всех возможных, еще не аннотированных белках. Также был скачен файл из PBD с ID 1BDH, содержащим расположение структур одного из белков в выборке группы специфичности, а именно PURR_ECOLI (AC: P0ACP7), ДНК и эффектора, с которыми он связывается, для дополнительной проверки важных позиций.Последовательно были выполнены следующие программы:
- pfw - для добавления весов в выравнивание группы специфичности
- pfmake - для составления профиля группы специфичности
- autoscale - для нормирования этого профиля
- pfsearch - для для поиска последовательностей в протеоме по профилю (со значением порога 20.0)
- ClustalW2 - для выравнивания найденных последовательностей под выравнивание семейства
Были найдены 3 идентичные последовательсности с разными AC. Поэтому на картинке оставлена только одна. Некоторые позиции в найденной последовательности не совпадают с консервативными в группе. Кроме того среди специфических для данной группы позиций, в найденной последовательности есть только одна совпадающая.
С помощью RasMol в файле PDB были обнаружены аминокислотные остатки, взаимодействующие с ДНК гидрофильными и гидрофобными связями. Это остатки: Val13, Ser14, Thr17, Ala29, Thr32, Leu54. Не все из этих позиций совпадают в найденной последовательности с группой специфичности, но совпадающие позиции не являются специфичными только для данной группы.
-Эффекторсвязывающий домен: effectbind.search.aln,
effect_search.gif
Было найдено 9 последовательностей, из которых только 3 различные.
Консервативных в группе позиций, совпадающих в найденных последовательностях, меньше половины
от всех консервативных. А также случаи совпадения со специфическими позициями единичны.
С помощью RasMol в файле PDB (позиция 58 в файле PDB соответствует позиции 1
в последовательности эффектор-связывающего домена белка PURR_ECOLI)
были обнаружены аминокислотные остатки, взаимодействующие
с лигандом гипоксантином гидрофильными и гидрофобными связями. Это остатки (в скобках позиция
в домене PURR_ECOLI): Ala71(14), Tyr73(16), Arg189(132), Thr191(134),
Arg195(138), Phe220(163), Asp274(217). Из них консервативные:
Tyr73(16), Arg189(132), Arg195(138), Phe220(163), Asp274(217).
В найденных последовательностях совпадают лишь некоторые из этих позиций.
По данным результатам можно сделать вывод, что в протеоме Pseudomonas aeruginosa нет белков, имеющих ДНК-связывающих и эффектор-связывающих доменов группы специфичности PurR, то есть нет белка-репрессора пуринового оперона.