Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~knyaz/Term4/tm.html
Дата изменения: Sat Apr 14 16:03:52 2007
Дата индексирования: Tue Oct 2 06:19:10 2012
Кодировка: Windows-1251
tm
на главную страницу

Мембранные белки. Оценка качества предсказания.


  • Построение парного выравнивания исследуемого белка и заданного прототипа:
    Белок-прототип:PDB ID-1OKC, AC UniProt-P02722. Были взяты последовательности из соответствующих баз данных и сделано выравнивание с помощью программы needle. Результат тут. Последовательности отличаются только 1-й аминокислотой, поэтому процет идентичности равен 99.7%.
    Далее я сделал выравнивание последовательности исследуемого белка(AC UniProt-Q8JHI0) и белка-прототипа, взятой из PDB. Опять используем программу needle, все параметры ставим по умолчанию. Выравнивание-тут. Характеристики выравнивания:
    Длина:298
    Идентичность:262/298 (87.9%)
    Сходство:284/298 (95.3%)
    Гэпы:1/298 ( 0.3%)
    Вес:1408.0
    

    Потом это выравнивание было импортированно в GeneDoc в файл marking.msf
  • Разметка мембранных сегментов на выравнивании:
    По идентификатору PDB белка-прототипа было найдено описание ориентации белка в мембране в БД OPM (Orientations of Proteins in Membranes database). Результат тут. Далее в marking.msf была добавлена строчка с названием OPM, позиции мембранных сегментов отмечены "H", позиции цитоплазматических петель знаком "+", остальные - знаком "-". Все это находится в файле marking2.msf
  • Предсказание топологии заданного белка с помощью наиболее популярной программы (TMHMM):
    Результат предсказания топологии заданного белка тут. Это предсказание отмечно в файле marking3.msf. Также это выравнивание в формате Clustal W можно увидеть здесь.
  • Оценка качества предсказания:

    Результаты предсказания топологии мембранного белка....

      Число а.к. остатков
    Всего а.к. остатков 298
    Остатки, предсказанные как локализованные в мембране (всего) 66
    Правильно предсказали (true positives, TP) 44
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 2
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 150
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 102
    Чувствительность (sensivity) = TP / (TP+FN) 0.301
    Специфичность (specificity) = TN / (TN+FP) 0.987
    Точность (precision) = TP / (TP+FP) 0.956
    Сверхпредсказание = FP/ (FP+TP) 0.043
    Недопредсказание = FN / (TN+FN) 0.405

    Из 6 участков ТМ были предсказаны только 2, причем те,которые не предсказаны, имеют длину меньше 20 а.о. Как видно, точность и специфичность очень высоки, а вот чувствительность менее 50%. Также очень мало сверхпредсказаний и не много недопредсказаний.
    ©Демин Олег