Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~moshka/Term4/4-10-Proj.html
Дата изменения: Tue May 25 16:25:55 2010
Дата индексирования: Tue Oct 2 11:16:52 2012
Кодировка: Windows-1251
Task 4-10. Protein search

Задание 10 (выполнено Борисовой Мариной)

Задача: определить, есть ли белок с заданной специфичностью в заданном протеоме.

Заданный белок: GntR_Ecoli

Этап I. Описание функциональных особенностей заданной группы.

GntR - транскрипционный фактор, который является репрессором оперона gntRKU, отвечающего за катаболизм D-глюконата. В E.coli GntR перестает репрессировать в присутсвии D-глюконата или в отсутсвии глюкозы. Сайт-связывания GntR - это последовательность из 20 н.п., которая является инвертированным повтором.

Структурная формула D-глюконата из БД KEGG:

Этап II. Создание множественного выравнивания доменов с разметкой по группам специфичности.

1. Создаем хорошее множественное выравнивание доменов заданной группы белков - GntR ДНК-связывающий домен.

SM00354 - это наиболее длинный ДНК-связываниющий домен из представленных. Данный представитель находится в БД SMART. Нам необходим наиболее длинный домен, для того, чтобы получить максимум информации о последовательности.

Достали представительское выравнивание: SMART.fasta

Достали последовательности белков всего семейства LacI: protein

Вынули из всех последовательностей белков только перечисленные: dna_gntr.fasta

Выровняли представительское выравнивание и выравнивание для GntR, а затем удалили первое: dna_gntr2.fasta

2. Создаем единое множественное выравнивание заданных доменов всех групп специфичности.

Раскрашеные выравнивания находятся в файле: DNA.msf

Выравнивание в виде изображения: DNA.png

Последовательности GntR (рассматриваемая группа) располагаются первыми и раскрашены синим.

Консервативные позиции для всех последовательностей: 26 - серин, 29 - лейцин/изолейцин, 46 - валнин/изолейцин, 55 - тирозин/фенилаланин. Они выделены черным фоном с белыми буквами.

Для заданной специфичности выделены серым фоном с белыми буквами пять консервативных позиции: 23 - метионин, 30 - аргинин, 35 - фенилаланин, 62 - фенилаланин, 70 - серин.

3. Создаем лого-изображения полного выравнивания заданных доменов и выравнивания доменов заданной группы специфичности.

Диаграмма ЛОГО для полного выравнивания:

Диаграмма ЛОГО для выравнивания GntR:

 

Этап III. Создание профиля и определение функции заданного белка.

1. Создаем обучающую выборку, строим профиль.

Были посчитаны веса c помощью pfw -m GntR.ali >GntR.pfw: GntR.pfw.

Был получен профиль c помощью pfmake -m GntR.pfw /usr/share/pftools23/blosum45.cmp > GntR.prf : GntR.prf.

2. Ищем по профилю гомологи.

Провели поиск гомологичных белков в Pantoea ananatis LMG 20103 с порогом по умолчанию: Panto.search

С помощью ClustalX2 выравниваем Panto.search и GntR.fasta. И полученное выравнивание импортируем в GenDoc и проверяем наличие позиций специфичности для заданной группы. Получаем, что только один белок (3706 из Pantoea.fasta) можно считать гомологом GntR репрессора из Pantoea ananatis LMG 20103.

Раскрашеные выравнивания находятся в файле: DNApantoea.msf. Выравнивание в виде изображения: Pantoea.png. В выравниваниях сверху желтым раскрашена группа полученных верятных гомологов. Подходящий гомолог находится последним в этой группе, ближе к выравниванию анализируемой группы (отмечено синим цветом).

Структуры белка в PDB с рядом расположенной ДНК не удалось найти. Поэтому в качестве доказательства отнесения этого белка в группу-специфичности был проведен анализ консерватиных позиций и позиций специфичности. После всего был проведен поиск подтвержденного гомолога (3706) в BLASTP (в Pantoea ananatis LMG 20103 и изначально заданые условия)и, действительно, это бело уже проаннотирован - GntR, что еще раз доказывает правоту.

Для исключения, что из отброшеных гомологов был GntR, т.е. правильный гомолог, был проведен в BLASTP анализ других белков:

508 CytR
1261 IdnR
2450 LacI
2542 GalS

Из данного поиска видно, что гомологи все относятся к LacI семейству, но другим группам-специфичности.


    ї 2010 Borisova Marina