Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~v.romashchenko/Term_5/prac13.html
Дата изменения: Fri Dec 24 12:34:50 2010
Дата индексирования: Tue Oct 2 14:27:43 2012
Кодировка: Windows-1251
SCOP and CATH

Учебный сайт
Ромащенко Валерии

SCOP и CATH

1. Определение классификации доменов вашей записи 1ОЕЕ согласно SCOP.


Для белка YodA был найден один домен.
a) домен находится на цепи А. Расположение домена находится межу 24 и 216 АК, длина домена 193 AK. Длина всего белка 216 АК.
b) классификация по SCOP:
класс - "all beta proteins"/относится к бета белкам
укладка - "barrel"/(укладка цилиндр)
суперсемейство - "lipocalins" / липокалинов
семейство - "Hypothetical protein YodA"/гипотетический белок YodA
c) в суперсемействе липокалинов находится 9 семейств
d) такая укладка есть только у одного данного суперсемейства

Для того, чтобы описать еще два домена я взяла запись PDB 1E94. Это белок HSLV_ECOLI является АТФ-зависимой протеазы . У него было обнаружено два домена:
Первый домен.
a) домен находится на цепи E и F. Длина доменов 449 АК
b) классификация по SCOP:
класс - " Alpha and beta proteins (a/b)"/относится к альфа и бета белкам
укладка - "3 layers: a/b/a, parallel or mixed beta-sheets of variable sizes"/укладка в три слоя, чередуются альфа/бета/альфа, бета слои либо параллельны друг другу, или наоборот - неупорядочены, так же они различного размера
суперсемейство - " P-loop containing nucleoside triphosphate hydrolases " / (нуклеозид трифосфат гидролаз, содержащих Р-петлю)
семейство - "Extended AAA-ATPase domain"/продолжительный ААА-АТФ-азный домен
c) в данном суперсемействе находится 24 семейства
d) такая укладка есть только у одного, данного, суперсемейства
Второй домен.
a) домен находиится на цепях A, B, C, D, его длина 174 АК. Начинается со второй АК, заканчивается - на последней
b) классификация по SCOP:
класс - " Alpha and beta proteins (a/b)"/относится к альфа и бета белкам)
укладка - "4 layers: alpha/beta/beta/alpha; has an unusual sheet-to-sheet packing"/ 4 слоя; есть чередование альфа/бета/альфа/бета; присутствует необычная уклажка бета-листов
суперсемейство - "N-terminal nucleophile aminohydrolases (Ntn hydrolases)" / Т-терминальных нуклеофильных аминогидролаз
семейство - "Proteasome subunits"/субединица протеосомы
c) в данном суперсемействе находится 7 семейств
d) такая укладка есть у двух суперсемейств: Ntn-гидролаз и у IMP циклогидролаз

2. Классификация доменов согласно CATH.

Домен для белка YodA
a) расположен на цепи А между 3 и 193 АК
b) классификация CATH 2.40.128.20.27.1.1.1.3
c) класс - 2 или "в основном бета"/"Mainly Beta"
архитектура - цилиндр
топология - липокалины
суперсемейство (гомологичное) - 2.40.128.20
семейство - 2.40.128.20.27
d) для данного суперсемейства нашлось 32 семейства
e) с такой топологией м.б. 8 суперсемейств

Домены для белка HSLV
Первый домен.

a) расположен на цепях A, B, C, D между 1 и 174 АК
b) классификация CATH: 3.60.20.10.25.1.3.1.1
3.60.20.10.25.1.3.1.2
3.60.20.10.25.1.3.1.3
3.60.20.10.25.1.3.1.4
c) класс - 3 или "альфа-бета"/"Alpha Beta"
архитектура - 4-х слойный бутерброт /"4-Layer Sandwich"
топология - глутамин фосфорибозилпиролфосфат / "Glutamine Phosphoribosylpyrophosphate"
суперсемейство (гомологичное) - глутамин фосфорибозилпиролфосфат
семейство - 3.60.20.10.25
d) для данного суперсемейства нашлось 30 семейств
e) с такой топологией м.б. 2 суперсемейства

Второй домен.

a) расположен на цепях E, F между 2 и 109 АК и 244-332; или 110-243 и 335-440
b) классификация CATH: 3.40.50.300.103.1.2.1.1
3.40.50.300.103.1.2.1.2
c) класс - 3 или "альфа-бета"/"Alpha Beta"
архитектура - 3-х слойный бутерброт /"3-Layer Sandwich"
топология - упаковка Россмана/"Rossmann fold"
суперсемейство (гомологичное) - нуклеозид трифосфат гидролаз, содержащих Р-петлю/ P-loop containing nucleoside triphosphate hydrolases
семейство - 3.60.20.10.25
d) для данного суперсемейства нашлось 30 семейств
e) с такой топологией м.б. 139 суперсемейства

3. SCOP и CATH.

Белок YodA в SCOP и CATH был классифицирован неодинаково. Различия существуют в определении координат домена в последовательности белка; CATH не дал название семейства домена; число семейств, входящих в супермейство липокалинов, выше в случае CATH . При этом укладка классифицирована в обоих случаях одинаково.
Белок HSLV_ECOLI. Для доменов, распоженных на цепях E и F, одинаково определено суперсемейство, хотя количество семейств, входящих в их состав дано разное. Для них одинаково определены классы. CATH не выдал названия семейства. Так же в CATH домены разделены на несколько частей.
Для доменов, расположенных на цепях A, B, C, D, одиниково определены: класс, упаковка/архитектура, нет различий в координатах. Суперсемейства определены по-разному.
Итог.
Возможно, такие различия существуют, прежде всего, из-за различной структурированности данных. В SCOP для разных PDB записей одного белка разделены данные о доменах, а в случае с CATH складывается ощущение, что вся информация (и повторяющаяся в том числе) хранится для белка вместе. Поэтому в выдаче появляется много повторений (м.б. это и есть причина того, что CATH всегда выдавал большее число семейств в одном суперсемействе).

4. Выравнивание двух доменов записей 1b2s цепи D и 1vqo цепи Y.

С помощью программ PDBeFOLD и Geometrical core я получила номера СА атомов. Я их использовала для создания выравнивания в PyMOL. Оно представлено ниже

Далее я выравнила данные цепи с помощью команд align и super (картинки показаны соответственно)
Для align значение RMSD 4.847, а для super - 2.111. Структуры мало похожи, и выровнена только одна альфа-спираль, что особой ценности для выравнивания не несет. Команда align выровняла структуры очень плохо и совершенно не так, как команда super. А она, в свою очередь, выравняла структуры так, как показала программа Geometrical core. Другими словами, эти две структуры не похожи друг на друга.


© Ромащенко 2008