Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~mumin/Term4/project.htm
Дата изменения: Fri May 28 12:37:06 2010
Дата индексирования: Tue Oct 2 07:40:05 2012
Кодировка: Windows-1251
project
 
 
 


Проект "Поиск белка с заданной функциональной специфичностью"

Первый этап: описание функциональных особенностей заданной группы.

Заданный мне белок-прототип LACI_Ecoli является репрессором транскрипции lac-оперона.

Лактозный ингибитор Lacl является ДНК-связывающимся транскрипционным фактором репрессирует транскрипцию оперона участвующего в транспорте и катаболизме лактозы. При отсутствии алолактозы, LacI репрессирует lac оперон. В данной системе репрессии LacI присоединяеться к двум операторам, а образование репрессионной петли является критичным. Этот репрессор присоединяет в тандеме к обратным повторяющимся последовательностям, длина которых составляет в 21 нуклеотид, являющиеся консервативными мотивами.

Lacl кодирует белок репрессор который может обратимо соединяется с операторным районом и препятствует транскрипции.

Индукция происходит когда физиологический индуктор, аллолактоза, связывается с lac репрессором, препятствуя ему связаться с оператором. Нефизиологические аналоги, такие как тиогалактозиды могут тоже работать как индукторы.

Белок Lacl принадлежит GalR/LacI семейству и как член данной семьи транскрипционных регуляторов, Lacl состоит из 3х доменов: спираль - петля - спиральный мотив расположенный в N-конце, центральный домен, который присоединяется к лигандом сахаров, и C-терминальный, который включает тетрамеризационный домен.

Реакционная формула с аллолактозой:

Второй этап: создание множественного выравнивания доменов с разметкой по группам специфичности.

1. Создать хорошее множественное выравнивание доменов заданной группы белков

Доменная структура LACI_Ecoli белка-прототипа заданной группы (страница InterPro):

Для дальнейшей работы мы берем домен из БД SMART: SM00354. Данный домен является самым длинным из правильно расположенных доменов. БД SMART хоть является довольно избыточной, но в ней нет идентичных белков.

Все последовательности ДНК-связывающих доменов семейства LACI были получены из БД SMART через поиск по имени домена HTH_LACI. По которому было найдено представительское выравнивание доменов в формате FASTA: SMART.fasta и последовательности всех бактериальных доменов данного семейства в формате FASTA, которые были сохранены в текстовом файле: allseq.txt

Откуда были полученны последовательности белков указанных в списке идентификаторов последовательностей, по мнению эксперта, обладающих данной специфичностью в файле dna_laci.fasta

Далее было произведено выравнивание с помощью программой ClustalW2. На выходе данной программы было получено выравнивание. После чего из него были удалены все последовательности представительского выравнивания. В итоге получился файл.

2. Создать единое множественное выравнивание заданных доменов всех групп специфичности

В БД Pfam была получена доменная организация белка прототипа LACI_Ecoli

Домен красного цвета является эффектор связывающим. Далее были получены выравнивания всех доменов этого типа: PF00532_full, откуда с помощью скрипта были получены необходимые выравнивания, которые указаны в файле laci, и сохранены в файле PF00532_laci.fasta.

Файл множественного выравнивания: all_align.msf
Графический файл: all_align.jpeg

Позиция 582 является консервативной для всех групп.

3. Создайте лого-изображения полного выравнивания заданных доменов и выравнивания доменов заданной группы специфичности

Используя ресурс WebLogo были созданы лого-изображения

Третий этап: Построение профиля

4. Добавление веса в выравнивание

С помощью программы pwf из пакета PFTOOLs напишем команду, которая добавит вес в выравнивание:

pfw -m PF00532_laci.fasta > out.weighted.fasta

5. Построение профиля

Построение профиля делаем с помощью команды:

pfmake -m out.weighted.fasta /usr/share/pftools23/blosum45.cmp > myprofile.prf

Затем нормируем профиль относительно случайной базы:

autoscale -m myprofile.prf > myprofile.scaled.prf

6. Поиск по профилю в выборке последовательностей

Выполняем с помощью команды:

pfsearch -f myprofile.scaled.prf Edwardsiella.fasta> ed.search

Получаем файл, который оказался пустым, следовательно в данном организме белка, отвечающего данному профилю нет. Возможно в этом организме нет белка, выполняющего данную функцию.