Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.fbb.msu.ru/~smivic/Projects/Term_4/project.html
Дата изменения: Fri May 28 17:23:12 2010 Дата индексирования: Tue Oct 2 11:15:58 2012 Кодировка: Windows-1251 |
Главная | Проекты | Семестры |
- Первый этап: описание функциональных особенностей заданной группы. В качестве белка-прототипа мне задан белок из Klebsiella pneumoniae (strain 342) B5Y088_KLEP3 (репрессор сахарозного оперона). Данных об эффекторе на странице UniProt нет. Это ДНК-зависимый транскрипционный фактор, отвечающий на фруктозу (описание по терминам GO, указанным в UniProt).
- Второй этап: создание множественного выравнивания доменов с разметкой по группам специфичности.
- Создать хорошее множественное выравнивание доменов группы белков purr. Требуется построить выравнивание ДНК-связывающих доменов заданной группы белков.
Такое выравнивание рекомендовано строить по данным БД SMART, а не PFAM, т. к. в Pfam кроме нужного домена HTH_LACI (LacI в Pfam) аннотирован домен Peripla_BP_1:
Файл с представительским выравниванием SMART.
Файл с последовательностями всех доменов HTH_LACI.
Файл с выравниванием (группа purr).
- Создать единое множественное выравнивание эффекторсвязывающих доменов всех групп специфичности. Заданная мне для иследования группа - scrr - в выравнивании помещена первой и отмечена оранжевым цветом.
Файл с выравниванием и разметкой по группам.
Картинка выравнивания с разметкой по группам (4,71 МБ).Позиции из пунктов 1 и 2 - специфичны для данной группы. Позиции из пункта 3, скорее всего, наиболее важные для функции связывания эффектора, т. к. встречаются у многих групп этого домена.
- Позиции выравнивания, консервативные (одинаковые) и характерные только для моей группы (scrr):
52, 253.- Позиции выравнивания, консервативные (одинаковые) только для моей группы (scrr), но встречабющиеся и в других группах:
29, 58, 70, 72, 83, 90, 108, 160, 169, 210, 212, 225, 257, 262, 263, 265.- Позиции выравнивания, консервативные (одинаковые) для нескольких групп, включая мою:
34, 36-38, 44, 49, 50, 57, 64, 65, 68, 73-76, 79, 85, 95, 101, 104, 105, 107, 109, 110, 112, 114, 117, 143, 145, 146, 149, 150, 166, 167, 185, 201, 203, 204, 209, 213, 217, 218, 221, 226, 233, 244, 260, 261.- Создайте лого-изображения полного выравнивания заданных доменов и выравнивания доменов заданной группы специфичности. Использован ресурс WebLogo.
logo для всех эффекторсвязывающих доменов.
logo для эффекторсвязывающих доменов группы scrr.
- Третий этап: построения профиля для группы scrr и поиск по нему в протеоме Pantoea ananatis LMG 20103.
- Создание и нормирование профиля. Сначала к выравниванию эффекторсвязывающих доменов семейства scrr с помощью программы pfw были добавлены веса. Команда:
pfw -m scrr_.fasta > scrr.aliКоманда для построения профиля по выравниванию:pfmake -m scrr.ali /usr/share/pftools23/blosum45.cmp > scrr_profile.prfВручную профиль не редактировался, т. к. ни один из белков семейства не имеет PDB-структуры и установить заведомо функциональные остатки нельзя. Нормирование профиля:autoscale -m scrr_profile.prf > scrr_profile.scaled.prf- Поиск по профилю в протеоме Pantoea ananatis LMG 20103. Поиск проводился с тремя значениями порога: 5, 10 и 30.
Порог 5.0, 50 находок:pfsearch -C 5.0 -f scrr_profile.scaled.prf Pantoea.fasta > scrr5.searchПорог 10.0, 17 находок:pfsearch -C 10.0 -f scrr_profile.scaled.prf Pantoea.fasta > scrr10.searchПорог 30.0, 1 находка:pfsearch -C 30.0 -f scrr_profile.scaled.prf Pantoea.fasta > scrr30.searchФайл с последовательностями, найденными при пороге 10.0.
Файл с выравниванием найденных последовательностей по созданному ранее выравниванию доменов семейства scrr. Выравнивание проводилось программой clustalw2. То же в формате msf.
Картинка выравнивания; ярко-оранжевым в группе scrr отмечены позиции, признанные специфичными (п. 1, 2 из задания 2.2), светло-оранжевым в находках отмечены совпадающие со специфичными остатки.
То же выравнивание в формате msf
Из картинки видно, что в белке 336 есть все специфичные позиции, поэтому вероятность принадлежности его к данной группе специфичности (scrr) велика. Во многих других находках есть специфичные для группы позиции, но нет ни одного белка, кроме 336, в котором присутствовали бы все такие позиции.