Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~bennigsen/term4/prac9.html
Дата изменения: Tue Apr 28 13:45:47 2009
Дата индексирования: Tue Oct 2 10:15:42 2012
Кодировка: Windows-1251
Yuri Pekov, Term 4, Practice 9

Учебный сайт студента ФББ МГУ Пекова Юрия

Главная
Новости
Полезные ссылки
Контакты
Обо мне
Мои работы

Занятие 9. Транспортные белки

Обязательные задания

  1. Построение парного выравнивания исследуемого белка и заданного прототипа
  2. Поиск последовательностей белка-прототипа я вел в БД PDB по идентификатору 1RC2 и в БД UniProt (с помощью SRS) по идентификатору P60844. В результате сравнения полученных последовательностей (см. выравнивание, сделенное программой needle) оказалось, что они идентичны.

    Парное выравнивание последовательности заданного белка с AC UniProt A2WE20 и последовательности белка-прототипа из PDB также было построено программой needle (при Gap_penalty: 10.0 и Extend_penalty: 0.5). Его характеристики таковы:
    # Length: 306
    # Identity:     174/306 (56.9%)
    # Similarity:   198/306 (64.7%)
    # Gaps:          75/306 (24.5%)
    # Score: 902.0
    

  3. Разметка мембранных сегментов на выравнивании
  4. По идентификатору PDB белка-прототипа найдено описание ориентации белка в мембране в БД OPM. Согласно этому описанию, в файле marking.msf ниже последовательности прототипа добавлена последовательность с названием "OPM" и разметкой ТМ сегментов.

  5. Предсказание топологии заданного белка с помощью наиболее популярной программы (TMHMM)
  6. Результат предсказания заданного белка с помощью сервера TMHMM (опции по умолчанию). К последовательностям в файле marking.msf добавлена еще одна искусственная последовательность "TMHMM", отражающая результаты данного предсказания.

    Готовое выравнивание было экспортировано в формат HTML и Clustal. В первом случае красным отмечены идентичные или схожие остатки в двух последовательностях белков, а зеленым - позиции остатков, которые находятся в трансмембранных участках и по результатам OPM, и по результатам предсказания TMHMM.

  7. Оценка качества предсказания
  8. Результаты предсказания топологии мембранного белка A2WE20

      Число а.к. остатков
    Всего а.к. остатков 306
    Остатки, предсказанные как локализованные в мембране (всего) 135
    Правильно предсказали (true positives, TP) 113
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 22
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 134
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 37
    Чувствительность (sensivity) = TP / (TP+FN) 0.75
    Специфичность (specificity) =  TN / (TN+FP)  0.86
    Точность (precision) = TP / (TP+FP)                        0.84
    Сверхпредсказание = FP/ (FP+TP)      0.16
    Недопредсказание = FN / (TN+FN)                                            0.22

    Сервис TMHMM не обнаружил 2 трансмембранных участка, показанных на прототипе OPM, из-за чего в середине последовательности прототипа внутриклеточные участки были перепутаны с внеклеточными. Остальные участки были предсказаны достаточно хорошо, хотя границы их не всегда совпадали с данными OPM. В целом чувствительность, специфичность и точность довольно высоки, а сверхпредсказание и недопредсказание, напротив, низки, что свидительствует о хорошем качестве предсказания.


©Пеков Юрий, 2007-2008