Задание 1.
Cхема из Pfam: домен Glyco_hydro_4 найден без С-конца (скорее всего это недостаток обнаруживающего метода) |
|||||
Пояснения к схеме |
|||||
? | Pfam AC | Pfam ID | Полное название семейства доменов (по-русски! и желательно с кратким пояснением) |
Положение в последовательности белка XXXX_BACSU | Клан |
1. | PF02056 | Glyco_hydro_4 | Семейство доменов названо по названию фермента 4-гликозилгиролазы. | 7–187 | Клан NADP_Rossmann (CL0063), содержит 154 семейства. |
2. | PF11975 | Glyco_hydro_4C | Семейство доменов названо по названию С-терминального домена фермента 4-гликозилгиролазы. | 191–417 | Клан LDH_C (CL0341), содержит всего 2 семейства. |
Задание 2. Описание домена Glyco_hydro_4C
- Мой домен входит в 4 разных архитектуры:
- Последовательность известна для 8 белков.
- Для 6 из этих белков определена пространственная структура.
- Выравнивание "seed" фрагментов белков, соответствующих домену
- Домен состоит из 5 консервативных участков, уовлетворяющих всем критериям, я думаю, с учетом этого можно говорить о гомологичности доменов данных белках.
Задание 3. Описание доменной структуры моего белка.
Таксон
|
Количество белков с доменом PF02056.
|
|
Эукариоты | Зеленые растения | 1 |
Грибы | 1 | |
Животные | 0 | |
Остальные эукариоты | 0 | |
Археи | 17(у 9 видов) | |
Бактерии | 1127(у 601 вида) | |
Вирусы | 0 |
Таксон
|
Количество белков с доменом PF11975.
|
|
Эукариоты | Зеленые растения | 0 |
Грибы | 1 | |
Животные | 0 | |
Остальные эукариоты | 0 | |
Археи | 17(у 9 видов) | |
Бактерии | 1125(у 597 видов) | |
Вирусы | 0 |
Как видно из таблиц, почти не встречаются у эукариот и архей. Также примечательно, что количество белков, в которых встречаются данные домены почти одинаково во всех царствах. Это наталкивает на мысль, что чаще всего они встречаются именно в этой архитектуре.
Задание 4.
? | PFAM ID | Bacillus subtilis |
1. | PF02056 | 4 белка |
2. | PF11975 | 4 белка |
Все четыре белка несут одинаковую архитектуру, состоящую только из
двух данных доменов (т.е. в обеих строках таблицы указаны одни и те же
4 белка.), мой белок так же соответствует данной архитектуре.
Картинки указывают,что белок D4G0A8_BACNA,в отличие от остальных, содержит
C-конец домена PF02056, но я полагаю отсутствие его у остальных трех недостатком
обнаруживающего метода, поэтому отношу все белки к одной архитектуре.
Задание 5.
Домены PF02056(Glyco_hydro_4) и PF11975(Glyco_hydro_4C) встречаются всего в 4 архитектурах,
причем чаще всего они "сцеплены" вместе:
AGAL_BACSU
Реже каждый из них может встретиться по одиночке:
A8S871_9FIRM
GLVG_ECOLI
В A4EAF7_9ACTN похоже произошла дупликация части домена PF11975(Glyco_hydro_4C):
А в D2DIQ1_9BACT оба домена с С-конца входят в состав очень сложной архитектуры:
Задание 6.
- Самый короткий мотив IPR001088 Glyco_hydro_4.Описан в Pfam и в PRINT. Тип распознающего правила Family.
- Самый длинный мотив IPR015955 Lactate_DH/Glyco_Ohase_4_C. Описан в Gene3D и в SuperFamily. Тип распознающего правила Domain.