Главная
Новости
Полезные ссылки
Контакты
Обо мне
Мои работы
|
Занятие 9. Транспортные белки
Обязательные задания
- Построение парного выравнивания исследуемого белка и заданного прототипа
Поиск последовательностей белка-прототипа я вел в БД PDB по идентификатору 1RC2 и в БД UniProt (с помощью SRS) по идентификатору P60844. В результате сравнения полученных последовательностей (см. выравнивание, сделенное программой needle) оказалось, что они идентичны.
Парное выравнивание последовательности заданного белка с AC UniProt A2WE20 и последовательности белка-прототипа из PDB также было построено программой needle (при Gap_penalty: 10.0 и Extend_penalty: 0.5). Его характеристики таковы:
# Length: 306
# Identity: 174/306 (56.9%)
# Similarity: 198/306 (64.7%)
# Gaps: 75/306 (24.5%)
# Score: 902.0
- Разметка мембранных сегментов на выравнивании
По идентификатору PDB белка-прототипа найдено описание ориентации белка в мембране в БД OPM. Согласно этому описанию, в файле marking.msf ниже последовательности прототипа добавлена последовательность с названием "OPM" и разметкой ТМ сегментов.
- Предсказание топологии заданного белка с помощью наиболее популярной программы (TMHMM)
Результат предсказания заданного белка с помощью сервера TMHMM (опции по умолчанию). К последовательностям в файле marking.msf добавлена еще одна искусственная последовательность "TMHMM", отражающая результаты данного предсказания.
Готовое выравнивание было экспортировано в формат HTML и Clustal. В первом случае красным отмечены идентичные или схожие остатки в двух последовательностях белков, а зеленым - позиции остатков, которые находятся в трансмембранных участках и по результатам OPM, и по результатам предсказания TMHMM.
- Оценка качества предсказания
Результаты предсказания топологии мембранного белка A2WE20
|
Число а.к. остатков |
Всего а.к. остатков |
306 |
Остатки, предсказанные как локализованные в мембране (всего) |
135 |
Правильно предсказали (true positives, TP) |
113 |
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) |
22 |
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) |
134 |
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) |
37 |
Чувствительность (sensivity) = TP / (TP+FN) |
0.75 |
Специфичность (specificity) = TN / (TN+FP) |
0.86 |
Точность
(precision) = TP /
(TP+FP)
|
0.84 |
Сверхпредсказание = FP/ (FP+TP) |
0.16 |
Недопредсказание
= FN /
(TN+FN)
|
0.22 |
Сервис TMHMM не обнаружил 2 трансмембранных участка, показанных на прототипе OPM, из-за чего в середине последовательности прототипа внутриклеточные участки были перепутаны с внеклеточными. Остальные участки были предсказаны достаточно хорошо, хотя границы их не всегда совпадали с данными OPM. В целом чувствительность, специфичность и точность довольно высоки, а сверхпредсказание и недопредсказание, напротив, низки, что свидительствует о хорошем качестве предсказания.
|