Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~moshka/Term4/4-10-Proj.html
Дата изменения: Tue May 25 16:25:55 2010 Дата индексирования: Tue Oct 2 11:16:52 2012 Кодировка: Windows-1251 |
Заданный белок: GntR_Ecoli
GntR - транскрипционный фактор, который является репрессором оперона gntRKU, отвечающего за катаболизм D-глюконата. В E.coli GntR перестает репрессировать в присутсвии D-глюконата или в отсутсвии глюкозы. Сайт-связывания GntR - это последовательность из 20 н.п., которая является инвертированным повтором.
Структурная формула D-глюконата из БД KEGG:
SM00354 - это наиболее длинный ДНК-связываниющий домен из представленных. Данный представитель находится в БД SMART. Нам необходим наиболее длинный домен, для того, чтобы получить максимум информации о последовательности.
Достали представительское выравнивание: SMART.fasta
Достали последовательности белков всего семейства LacI: protein
Вынули из всех последовательностей белков только перечисленные: dna_gntr.fasta
Выровняли представительское выравнивание и выравнивание для GntR, а затем удалили первое: dna_gntr2.fasta
Раскрашеные выравнивания находятся в файле: DNA.msf
Выравнивание в виде изображения: DNA.png
Последовательности GntR (рассматриваемая группа) располагаются первыми и раскрашены синим.
Консервативные позиции для всех последовательностей: 26 - серин, 29 - лейцин/изолейцин, 46 - валнин/изолейцин, 55 - тирозин/фенилаланин. Они выделены черным фоном с белыми буквами.
Для заданной специфичности выделены серым фоном с белыми буквами пять консервативных позиции: 23 - метионин, 30 - аргинин, 35 - фенилаланин, 62 - фенилаланин, 70 - серин.
Диаграмма ЛОГО для полного выравнивания:
Диаграмма ЛОГО для выравнивания GntR:
Этап III. Создание профиля и определение функции заданного белка.
1. Создаем обучающую выборку, строим профиль.
Были посчитаны веса c помощью pfw -m GntR.ali >GntR.pfw: GntR.pfw.
Был получен профиль c помощью pfmake -m GntR.pfw /usr/share/pftools23/blosum45.cmp > GntR.prf : GntR.prf.
2. Ищем по профилю гомологи.
Провели поиск гомологичных белков в Pantoea ananatis LMG 20103 с порогом по умолчанию: Panto.search
С помощью ClustalX2 выравниваем Panto.search и GntR.fasta. И полученное выравнивание импортируем в GenDoc и проверяем наличие позиций специфичности для заданной группы. Получаем, что только один белок (3706 из Pantoea.fasta) можно считать гомологом GntR репрессора из Pantoea ananatis LMG 20103.
Раскрашеные выравнивания находятся в файле: DNApantoea.msf. Выравнивание в виде изображения: Pantoea.png. В выравниваниях сверху желтым раскрашена группа полученных верятных гомологов. Подходящий гомолог находится последним в этой группе, ближе к выравниванию анализируемой группы (отмечено синим цветом).
Структуры белка в PDB с рядом расположенной ДНК не удалось найти. Поэтому в качестве доказательства отнесения этого белка в группу-специфичности был проведен анализ консерватиных позиций и позиций специфичности. После всего был проведен поиск подтвержденного гомолога (3706) в BLASTP (в Pantoea ananatis LMG 20103 и изначально заданые условия)и, действительно, это бело уже проаннотирован - GntR, что еще раз доказывает правоту.
Для исключения, что из отброшеных гомологов был GntR, т.е. правильный гомолог, был проведен в BLASTP анализ других белков:
508 | CytR |
1261 | IdnR |
2450 | LacI |
2542 | GalS |
Из данного поиска видно, что гомологи все относятся к LacI семейству, но другим группам-специфичности.