Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~tregubova/projects/Term_4/block2/task9.html
Дата изменения: Sun May 23 13:48:39 2010
Дата индексирования: Sat Jun 26 02:32:08 2010
Кодировка: Windows-1251
Задание 9

Мембраные и траспортные белки

 
  

1.Cравнение нумераций остатков белкапрототипа в UniProt и PDB

Был выдан идентификатор PDB белка-прототипа:2QTS
На домашней страничке PDBsum было получено выравнивание последовательности из UniProt и последовательности из PDB:
Выравнивание в формате .msf

В базе данных PDB последовательность белка на 90 а.к.остатков меньше,чем в UniProt.С двух сторон получились обрезаны части поледовательности по 40 с небольшим а.к.остатков.

2.Глобальное выравнивание заданного белка и белка-прототипа

Мне достались белок ACC2C_DANRE и белок-прототип ACCN2_CHICK.
Полученные последовательности были отданы на вход программе needle:
>needle ACCN2_CHICK.fasta ACC2C_DANRE.fasta ac_ac.msf -aformat msf
На выходе получился файл ac_ac.msf

3.Создание разметки трансмембранных сегментов в белке-прототипе

Согласно классификации OPM, 2QTS имеет номер 1.1.42.01. Расшифровка:
1 - Трансмембранный белок
1.1 - Альфа-спиральный трансмембранный белок
1.1.42 - Эпителиальный натриевый канал
1.1.42.01 - Кислотно-чувствительный ионный канал
В записи 2QTS представлено 2 ассиметричных тримера.Рассмотрим цепь A(нумерация остатков приведена для UniProt):
из клетки 45-70
в клетку 427-452
Большая часть белка находится за пределами клетки.
Далее была получено выравнивание из упр.2,к коорому была добалена строка OPM,где отмечены позиции белка ACCN2_CHICK,относящиеся к транмембранным сегментам (Н),цитоплазматическим петлям (+),внеклеточным петлям (-).
Файл mark.msf.

Красным показана наружняя часть мембраны,синим-цитоплазматическая.

4.Предсказание топологии белка ACC2C_DANRE с помощью TMHMM

# uniprot_Q708S6_ACC2C_DANRE Length: 529
# uniprot_Q708S6_ACC2C_DANRE Number of predicted TMHs:  2
# uniprot_Q708S6_ACC2C_DANRE Exp number of AAs in TMHs: 63.86719
# uniprot_Q708S6_ACC2C_DANRE Exp number, first 60 AAs:  15.95047
# uniprot_Q708S6_ACC2C_DANRE Total prob of N-in:        0.64328
# uniprot_Q708S6_ACC2C_DANRE POSSIBLE N-term signal sequence
uniprot_Q708S6_ACC2C_DANRE	TMHMM2.0	inside	     1    45
uniprot_Q708S6_ACC2C_DANRE	TMHMM2.0	TMhelix	    46    68
uniprot_Q708S6_ACC2C_DANRE	TMHMM2.0	outside	    69   498
uniprot_Q708S6_ACC2C_DANRE	TMHMM2.0	TMhelix	   499   521
uniprot_Q708S6_ACC2C_DANRE	TMHMM2.0	inside	   522   529

Согласно предсказанию белок содержит 2 трансмембранных сегмента-46-68 и 499-521.Первый из них почти соотвсетвует истине-ошибка в неколько а.к.остатков,второй же находится совершенно в другом месте( правильный-427-452). Судя по картинке возможных вариантов для второго трансмембранного участка было два,один-правильный,второй-выбранный программой.Не угадала.
Зато верно предсказаны цитоплазматическая сторона мембраны и внешняя.
Общая разметка выравнивания:mark12.msf

5.Сравнение предсказаний.


Результаты предсказания топологии мембранного белка ACC2C_DANRE

  Число а.к. остатков
Всего а.к. остатков 529
Остатки, предсказанные как локализованные в мембране (всего) 68
Правильно предсказали (true positives, TP) 23
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 23
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 457
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 26
Чувствительность (sensivity) = TP / (TP+FN) 0,469
Специфичность (specificity) =  TN / (TN+FP)  0,952
Точность(precision) = TP /(TP+FP) 0,5
Сверхпредсказание = FP/ (FP+TP) 0,5
Недопредсказание = FN / (TN+FN) 0,05
Предсказание получилось не очень точным,из-за того,что один из двух трансмембранных сегментов был предсказан не там,где находится на саоммо деле.А это 23 в строчке "FP" и 26 в "FN",что отразилось на точности предсказания.