Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~manyashka/Term4/ribosom_evolution.html
Дата изменения: Tue May 19 17:47:06 2009 Дата индексирования: Tue Oct 2 15:09:38 2012 Кодировка: Windows-1251 |
> Description - L9
> Description - S39
> Taxonomy - eukaryota
В результате была получена выборка из 11 белков. Два белка из данной выборки (с AC B4DDZ7 и B4DUJ1) проаннотированы как "similar to 39S ribosomal protein L9", их мы тоже решили учитывать в построении профиля.
Была рассмотрена доменная организация полученных белков. У всех последовательностей выборки нашелся одинаковый домен - N-terminal domain (идентификатор Pfam - PF01281). На рисунке ниже приведено изображение домена (на примере рибосомального белка L9 из организма челвека).
Было построено два выравнивания полученных последовательностей:
1) полных последовательностей с помощью программы muscle; 2) последовательностей домена с помощью Pfam. Что касается сравнения полученных выравниваний, то выравнивание полных последовательностей в области домена совпадает с выравниванием Pfam. Из чего был сделан вывод о достаточно хорошем качестве общего выравнивания, сделанного с помощью muscle.
Следующим шагом в выравнивание полных последовательностей были добавлены веса:
pfw -m out.ali > out.weighted.ali
По выравниванию целых последовательностей с весами был построен профиль:
pfmake -m out.weighted.ali /usr/share/pftools23/blosum45.cmp > myprofile.txt
В результате нормировки получили новый профиль :
autoscale -m myprofile.prf > myprofile.scaled.prf
Профили отличаются значениями SCORE в поле "CUT_OFF". Порог, полученный при построении ненормированного профиля (SCORE в профиле myprofile.prf), повышается при нормировании его с использованием некой линейной функции.
Коэффициенты данной линейной функции задаются в поле "NORMALIZATION" переменными R1 и R2.Значение нового порога рассчитывается по формуле: SCORE2=SCORE1*R1+R2.
Результаты поисков приведены в таблице ниже.
Поиск гомологов по профилю, выбор порогового значения веса
С помощью программы pfsearch был проведен поиск гомологичных белков отдельно для альфапотеобактерий и для гаммапротеобактерий.
Для поиска использовался нормированный вариант профиля. Каждый поиск проводился с разными порогами. Изначально это были пороги 5.0, 10.0. Так как уже с пороговым значением 10.0 не было найдено ни 1 находни ни в одной из двух исследуемых групп бактерий, стало очевидно, что испытывать порог 30.0 не имеет смысла, а стоит рассмотреть значения порога в интервале [5.0; 10.0].Результаты поиска по двум группам бактерий с разными значениями порога
Alphaproteobacteria | Gammaproteodacteria | |||||
Порог | Общее количество находок | с онтологией GO "C:" | с GO идентификатором "рибосома"(0005840) | Общее количество находок | с онтологией GO "C:" | с GO идентификатором "рибосома"(0005840) |
5 | 202 | 140 | 65 | 494 | 294 | 59 |
6 | 44 | 40 | 40 | 24 | 14 | 13 |
7 | 8 | 8 | 8 | 1 | 1 | 1 |
8 | 0 | 0 | 0 | 0 | 0 | 0 |
6.2 | 35 | 34 | 34 | 15 | 9 | 9 |
Данная ситуация привела к тому, что перебирались дробные значения в промежутке от 6 до 7. Лучшие результаты получены при пороге 6.2. Число соответствующих находок приведено в таблице выше.
Можно заметить, что на гистограмме распределение весов для альфабактерий близко по форме к плотности нормального распределения, чего нельзя сказать о распределении для гаммапротеобактерий.
Также видно, что для альфапротеобактерий центр масс находится в районе 6.5, в то время как сделать точный вывод о центре масс распределения для гамма бактерий невозможно, однако можно предположить, что он находится в области значения 6 или левее. Однако, даже если считать, что плотности смещены относительно друг друга примерно на 0.5, это не дает нам права делать какие-либо явно обоснованные выводы.
Визуально нельзя сравнить медианы выборок, поэтому целесообразно провести тест Вилкоксона.
Результаты теста говорят об отсутствии различий между медианами выборок.
Таким образом, основываясь на результатах проведенного исследования, нельзя сказать о происхождении митохондриальных рибосомальных белков от рибосомальных белков одной или другой группы бактерий. Этот факт говорит о необходимости применения других методов, в частности филогенетического исследования.
Методом максимального правдоподобия было построено филогенетическое дерево:
Красным овалом на дереве обозначена клада митохондриальных белков эукариот, желтыми - альфабактерий, синими - гаммабактерий, а зеленым - фирамикут.
Если считать фирмикут корнем, то видно, что сначала происходит разделение на альфапротеобактерий и гаммапротеобактерий, а затем от альфабактерий отделяется группа митохондриальных белков эукариот.
Отсюда можно сделать вывод о том, что митохондриальные белки эукариот эволюционно ближе к альфапротеобактериям. Ближе всего исследованный белок эукариот к белку из организма Gluconacetobacter (A9H1M3 и Q5FU59). Это подтверждает гипотезу, сформулированную после построения гистограмм распределения весов.
Для контроля гипотезы были определены попарные эволюционные расстояния по матрице JTT с помощью программы protdist пакета EMBOSS и построены гистограммы распределения попарных расстояний между митохондриальными белками и белками из альфа- и гаммапротеобактерий.
Рабочий файл Exel можно посмотреть здесь . Однако, полученная гистограмма не дает нам возможности сделать опреденные выводы, так как расстояния митохондриальных белков как от альфапротеобактерий, так и от гаммапротеобактерий сконцентрированы примерно в области от 2.5 до 3.5. То есть явного различия мы не наблюдаем.
<<Обратно на четвертый семестр