Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~desislava/Term4/task9.html
Дата изменения: Sat May 2 14:25:32 2009
Дата индексирования: Tue Oct 2 10:16:02 2012
Кодировка: Windows-1251
Task 9

На главную


Занятие 9. Транспортные белки

  1. Построение парного выравнивания исследуемого белка и заданного прототипа
  2. Последовательности белка-прототипа я искала по базе данных PDB (идентификатор 1RC2) и в базе данных UniProt (идентификатор P60844).

    Сравнение полученных последовательностей было сделано программой needle, оно показало, что они совершенно одинаковы.

    В БД UniProt нужной записи белка-прототипа (A0IR08) не было, проведя полнотекстовой поиск по всем белковым базам данных, я обнаружила запись в БД UNIPARC, из которой следовало, что из UniProt нужная мне запись была удалена. Тем не менее, последовательность в найденной записи была, и именно ее я и скопировала. Парное выравнивание этой последовательности заданного белка и последовательности белка-прототипа из PDB было построено программой needle (Gap_penalty: 10.0 и Extend_penalty: 0.5). Его основные характеристики таковы:
    # Length: 231
    # Identity:     185/231 (80.1%)
    # Similarity:   208/231 (90.0%)
    # Gaps:           0/231 ( 0.0%)
    # Score: 982.0
    

  3. Разметка мембранных сегментов на выравнивании
  4. По PDB-коду белка-прототипа я нашла описание ориентации белка в мембране по базе данных OPM. В соответствии с ним в файле marking.msf ниже последовательности прототипа добавлена последовательность с названием "OPM" и c разметкой ТМ сегментов.

  5. Предсказание топологии заданного белка с помощью наиболее популярной программы (TMHMM)
  6. Здесь лежит результат предсказания заданного белка с помощью сервера TMHMM. К последовательностям в файле marking.msf добавлена еще одна искусственная последовательность "TMHMM", отражающая результаты данного предсказания.

    Готовое выравнивание я предствила в форматах HTML (здесь голубым отмечены схожие остатки двух последовательностях, а оранжевым - позиции остатков, которые входят в трансмембранные участки как согласно данным OPM, так и согласно TMHMM) и Clustal.

  7. Оценка качества предсказания
  8. Результаты предсказания топологии мембранного белка A0IR08

      Число а.к. остатков
    Всего а.к. остатков 231
    Остатки, предсказанные как локализованные в мембране (всего) 138
    Правильно предсказали (true positives, TP) 124
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 14
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 67
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 26
    Чувствительность (sensivity) = TP / (TP+FN) 0.83
    Специфичность (specificity) =  TN / (TN+FP)  0.83
    Точность (precision) = TP / (TP+FP)                        0.9
    Сверхпредсказание = FP/ (FP+TP)      0.1
    Недопредсказание = FN / (TN+FN)                                            0.28

    TMHMM не смог найти 2 трансмембранных участка, которые были показаны OPM. Из-за этого в середине последовательности прототипа цитоплазматические петли были перепутаны с внеклеточными. Другие трансмембранные участки били предсказаны очень хорошо, даже их границы почти полностью совпадают с границами по данным OPM. Все основные параметры предсказания имеют хорошие значения, и поэтому само предсказание можно считать хорошим.

 



©Десислава Митева, 2007