Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~manyashka/Term4/ribosom_evolution.html
Дата изменения: Tue May 19 17:47:06 2009
Дата индексирования: Tue Oct 2 15:09:38 2012
Кодировка: Windows-1251
ribosome evolution(BLAST)

Эволюция белков митохондриальных рибосом

Поиск бактериальных гомологов по нормированному профилю белков L9 митохондриальных рибосом эукариот.

Создание обучающей выборки, построение выравнивания и профиля

С помощью SRS из UniProt были получены последовательности рибосомального белка L9 из митохондрий разных эукариот. Для этого был создан запрос:

> Description - L9

> Description - S39

> Taxonomy - eukaryota

В результате была получена выборка из 11 белков. Два белка из данной выборки (с AC B4DDZ7 и B4DUJ1) проаннотированы как "similar to 39S ribosomal protein L9", их мы тоже решили учитывать в построении профиля.

Была рассмотрена доменная организация полученных белков. У всех последовательностей выборки нашелся одинаковый домен - N-terminal domain (идентификатор Pfam - PF01281). На рисунке ниже приведено изображение домена (на примере рибосомального белка L9 из организма челвека).

Было построено два выравнивания полученных последовательностей:

1) полных последовательностей с помощью программы muscle; 2) последовательностей домена с помощью Pfam. Что касается сравнения полученных выравниваний, то выравнивание полных последовательностей в области домена совпадает с выравниванием Pfam. Из чего был сделан вывод о достаточно хорошем качестве общего выравнивания, сделанного с помощью muscle.

Следующим шагом в выравнивание полных последовательностей были добавлены веса:

pfw -m out.ali > out.weighted.ali

По выравниванию целых последовательностей с весами был построен профиль:

pfmake -m out.weighted.ali /usr/share/pftools23/blosum45.cmp > myprofile.txt

В результате нормировки получили новый профиль :

autoscale -m myprofile.prf > myprofile.scaled.prf

Профили отличаются значениями SCORE в поле "CUT_OFF". Порог, полученный при построении ненормированного профиля (SCORE в профиле myprofile.prf), повышается при нормировании его с использованием некой линейной функции. Коэффициенты данной линейной функции задаются в поле "NORMALIZATION" переменными R1 и R2.Значение нового порога рассчитывается по формуле: SCORE2=SCORE1*R1+R2.

Поиск гомологов по профилю, выбор порогового значения веса

С помощью программы pfsearch был проведен поиск гомологичных белков отдельно для альфапотеобактерий и для гаммапротеобактерий. Для поиска использовался нормированный вариант профиля. Каждый поиск проводился с разными порогами. Изначально это были пороги 5.0, 10.0. Так как уже с пороговым значением 10.0 не было найдено ни 1 находни ни в одной из двух исследуемых групп бактерий, стало очевидно, что испытывать порог 30.0 не имеет смысла, а стоит рассмотреть значения порога в интервале [5.0; 10.0].

Результаты поисков приведены в таблице ниже.

Результаты поиска по двум группам бактерий с разными значениями порога

Alphaproteobacteria Gammaproteodacteria
Порог Общее количество находок с онтологией GO "C:" с GO идентификатором "рибосома"(0005840) Общее количество находок с онтологией GO "C:" с GO идентификатором "рибосома"(0005840)
5 202 140 65 494 294 59
6 44 40 40 24 14 13
7 8 8 8 1 1 1
8 0 0 0 0 0 0
6.2 35 34 34 15 9 9
Таким образом, видим, что при пороге 5.0 находится слишком много лишних последовательностей. При пороге 6.0 в Alphaproteobacteria находится 4 последовательности, для которых нет ни одного идентификатора GO из онтологии "клеточный компонент". В Gammaproteodacteria 10 последовательностей, не проаннотированных в GO по клеточному компоненту, плюс одна последовательность аннотирована по клеточному компоненту, но не с идентификатором "рибосома". При пороге 7.0 все найденные последовательности имеют идентификатор GO "рибосома" из онтологии "клеточный компонент". Однако их слишком мало, судя по всему, профиль пропускает многие нужные последовательности.

Данная ситуация привела к тому, что перебирались дробные значения в промежутке от 6 до 7. Лучшие результаты получены при пороге 6.2. Число соответствующих находок приведено в таблице выше.

Анализ результатов

По нормированному профилю был проведен поиск с пороговым значением 6.2. По весам находок отдельно для
альфапротеобактерий и отдельно для гаммапротеобактерий с помощью средств Excel были построены гистограммы , приведенные на рисунке ниже.

Распределение нормированных весов находок в протеомах 2-х групп бактерий

Можно заметить, что на гистограмме распределение весов для альфабактерий близко по форме к плотности нормального распределения, чего нельзя сказать о распределении для гаммапротеобактерий.

Также видно, что для альфапротеобактерий центр масс находится в районе 6.5, в то время как сделать точный вывод о центре масс распределения для гамма бактерий невозможно, однако можно предположить, что он находится в области значения 6 или левее. Однако, даже если считать, что плотности смещены относительно друг друга примерно на 0.5, это не дает нам права делать какие-либо явно обоснованные выводы.

Визуально нельзя сравнить медианы выборок, поэтому целесообразно провести тест Вилкоксона.

Тест Вилкоксона

Для двух полученных выборок весов с помощью программы STADIA был проведен тест Вилкоксона для сравнения медиан выборок.

Результаты теста говорят об отсутствии различий между медианами выборок.

Таким образом, основываясь на результатах проведенного исследования, нельзя сказать о происхождении митохондриальных рибосомальных белков от рибосомальных белков одной или другой группы бактерий. Этот факт говорит о необходимости применения других методов, в частности филогенетического исследования.

Филенетический анализ

Была создана внешняя группа последовательностей рибосомальных белков из Firmicutes, имеющих то же название, что и заданнй белок. Также были получены файлы с последовательностями из альфа- и гаммапротеобактерий, отобранными с выбранным порогом. Было построено объединенное выравнивание митохондриальных белков и белков из рибосом альфа-, гаммапротеобактерий и фирмикут.

Методом максимального правдоподобия было построено филогенетическое дерево:

Красным овалом на дереве обозначена клада митохондриальных белков эукариот, желтыми - альфабактерий, синими - гаммабактерий, а зеленым - фирамикут.

Если считать фирмикут корнем, то видно, что сначала происходит разделение на альфапротеобактерий и гаммапротеобактерий, а затем от альфабактерий отделяется группа митохондриальных белков эукариот.

Отсюда можно сделать вывод о том, что митохондриальные белки эукариот эволюционно ближе к альфапротеобактериям. Ближе всего исследованный белок эукариот к белку из организма Gluconacetobacter (A9H1M3 и Q5FU59). Это подтверждает гипотезу, сформулированную после построения гистограмм распределения весов.

Для контроля гипотезы были определены попарные эволюционные расстояния по матрице JTT с помощью программы protdist пакета EMBOSS и построены гистограммы распределения попарных расстояний между митохондриальными белками и белками из альфа- и гаммапротеобактерий.

Рабочий файл Exel можно посмотреть здесь . Однако, полученная гистограмма не дает нам возможности сделать опреденные выводы, так как расстояния митохондриальных белков как от альфапротеобактерий, так и от гаммапротеобактерий сконцентрированы примерно в области от 2.5 до 3.5. То есть явного различия мы не наблюдаем.

Общий анализ результатов

Исследования, проведенные данными методами,не дают четкого ответа на вопрос: к какой же группе бактерий ближе митохондриальные белки эукариот. Однако, некий приоритет в сторону альфапротеобактерий наблюдается: в частности в смещении медианы распределения весов и безусловно в относительном расположении клад митохондриальных белков, альфапротеобактерий и гаммапротеобактерий.

<<Обратно на главную страницу

<<Обратно на четвертый семестр


©Мария Баранова,2008