Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~loontic/Term4/Block2/membr.html
Дата изменения: Sat Apr 25 21:49:18 2009
Дата индексирования: Tue Oct 2 17:53:57 2012
Кодировка: Windows-1251
Транспортные белки.

Транспортные белки.

Задача - предсказать топологию мембранного белка и сравнить предсказание с ориентированной в мембране 3D-структурой белка-прототипа.

Идентификаторы:

заданного белка Q7ZXY6 (AC UniProt)

белка-прототипа P04191 (AC UniProt), 1SU4 (PDB ID)

  1. Построение парного выравнивания исследуемого белка и заданного прототипа
  2. Нашли обе последовательности белка-прототипа (БД PDB и БД UniProt). Для того, чтобы сравнить их, необходимы однобуквенные аминокислотные последовательности белка из каждой БД. Для БД UniProt все просто - последовательность находится в самом конце страницы в разделе Sequence information. Для того, чтобы получить однобуквенную последовательность белка в БД PDB, выбрали в разделе Viev форму выдачи FastaSeqs.

    Затем обе последовательности скопировали в документы fasta и импортировали в GeneDoc.

    По выравниванию видно, что последовательности почти всюду одинаковы. Отличия есть в С-концевом участке: последовательность из БД UniProt длиннее на 7 аминокислот; последняя аминокислота последовательности из БД PDB (G) отличается от соответствующей ей аминокислоты последовательности из БД UniProt (D). Убедиться в этом можно, взглянув на выравнивание.

    По идентификатору UniProt получили последовательность заданного белка. Построили парное выравнивание этой последовательности и последовательности белка-прототипа из PDB.

    Выравнивание строилось с помощью программы needle на сервере kodomo. Характеристики:

     
    Aligned_sequences: 2            
    1: 1SU4_A                       
    2: Q7ZXY6_XENLA                 
    Matrix: EBLOSUM62               
    Gap_penalty: 10.0               
    Extend_penalty: 0.5             
                                    
    Length: 996                     
    Identity:     889/996 (89.3%)   
    Similarity:   962/996 (96.6%)   
    Gaps:           2/996 ( 0.2%)   
    Score: 4675.0
                      
    

  3. Разметка мембранных сегментов на выравнивании
  4. По идентификатору PDB белка-прототипа нашли описание ориентации белка в мембране в БД OPM (Orientations of Proteins in Membranes database)

    в программе GeneDoc к парному выравниванию заданного белка и прототипа добавили еще одна строку, где символами "H" обозначили позиции аминокислот мембранных сегментов, "+" - позиции цитоплазматических петель, "-" - остальные (то, что находится в периплазме).

  5. Предсказание топологии заданного белка с помощью наиболее популярной программы (TMHMM)
  6. C помощью сервера TMHMM была предсказана топология заданного белка (опции по умолчанию).

    Добавили к выравниванию в GeneDoc еще одну искусственную последовательность, отражающую результаты данного предсказания. Эту последовательность назвали "TMHMM".

    В готовом выравнивании покрашены:

    фиолетовым - выровненные последовательности белков;
    красным - позиции одинаково предсказанных мембранных аминокислот;
    зеленым - позиции одинаково предсказанных аминокислот цитоплазматических петель;
    желтым - позиции одинаково предсказаных остальных аминокислот.

    также выравнивание можно посмотреть в в виде текстового файла формата Clustal.

  7. Оценка качества предсказания
  8. Результаты предсказания топологии мембранного белка Q7ZXY6

      Число а.к. остатков
    Всего а.к. остатков  996
    Остатки, предсказанные как локализованные в мембране (всего)  174
    Правильно предсказали (true positives, TP)  136
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP)  38
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN)  767
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN)  55
    Чувствительность (sensivity) = TP / (TP+FN)  0.71
    Специфичность (specificity) =  TN / (TN+FP)   0.94
    Точность (precision) = TP / (TP+FP)                         0.78
    Сверхпредсказание = FP/ (FP+TP)       0.22
    Недопредсказание = FN / (TN+FN)                                             0.07

    Хотя сервис TMHMM и не обнаружил 2-х мембранных участков, показанных для белка-прототипа в OPM, основные мембранные участки белка предсказаны достаточно хорошо. Чувствительность, специфичность и точность предсказания имеют достаточно высокие значения. Напротив, сверхпредсказание и недопредсказание достаточно низки.

     


<Четвертый семестр

<<Главная страница


©ХАЧАТРЯН ЛУСИНЕ, 2009