Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~loontic/Term4/Block2/membr.html
Дата изменения: Sat Apr 25 21:49:18 2009 Дата индексирования: Tue Oct 2 17:53:57 2012 Кодировка: Windows-1251 |
заданного белка Q7ZXY6 (AC UniProt)
белка-прототипа P04191 (AC UniProt), 1SU4 (PDB ID)
Нашли обе последовательности белка-прототипа (БД PDB и БД UniProt). Для того, чтобы сравнить их, необходимы однобуквенные аминокислотные последовательности белка из каждой БД. Для БД UniProt все просто - последовательность находится в самом конце страницы в разделе Sequence information. Для того, чтобы получить однобуквенную последовательность белка в БД PDB, выбрали в разделе Viev форму выдачи FastaSeqs.
Затем обе последовательности скопировали в документы fasta и импортировали в GeneDoc.
По выравниванию видно, что последовательности почти всюду одинаковы. Отличия есть в С-концевом участке: последовательность из БД UniProt длиннее на 7 аминокислот; последняя аминокислота последовательности из БД PDB (G) отличается от соответствующей ей аминокислоты последовательности из БД UniProt (D). Убедиться в этом можно, взглянув на выравнивание.
По идентификатору UniProt получили последовательность заданного белка. Построили парное выравнивание этой последовательности и последовательности белка-прототипа из PDB.
Выравнивание строилось с помощью программы needle на сервере kodomo.
Характеристики:
Aligned_sequences: 2
1: 1SU4_A
2: Q7ZXY6_XENLA
Matrix: EBLOSUM62
Gap_penalty: 10.0
Extend_penalty: 0.5
Length: 996
Identity: 889/996 (89.3%)
Similarity: 962/996 (96.6%)
Gaps: 2/996 ( 0.2%)
Score: 4675.0
По идентификатору PDB белка-прототипа нашли описание ориентации белка в мембране в БД OPM (Orientations of Proteins in Membranes database)
в программе GeneDoc к парному выравниванию заданного белка и прототипа добавили еще одна строку, где символами "H" обозначили позиции аминокислот мембранных сегментов, "+" - позиции цитоплазматических петель, "-" - остальные (то, что находится в периплазме).Добавили к выравниванию в GeneDoc еще одну искусственную последовательность, отражающую результаты данного предсказания. Эту последовательность назвали "TMHMM".
В готовом выравнивании покрашены:Результаты предсказания топологии мембранного белка Q7ZXY6
Число а.к. остатков | |
Всего а.к. остатков | 996 |
Остатки, предсказанные как локализованные в мембране (всего) | 174 |
Правильно предсказали (true positives, TP) | 136 |
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) | 38 |
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) | 767 |
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) | 55 |
Чувствительность (sensivity) = TP / (TP+FN) | 0.71 |
Специфичность (specificity) = TN / (TN+FP) | 0.94 |
Точность (precision) = TP / (TP+FP) | 0.78 |
Сверхпредсказание = FP/ (FP+TP) | 0.22 |
Недопредсказание = FN / (TN+FN) | 0.07 |
Хотя сервис TMHMM и не обнаружил 2-х мембранных участков, показанных для белка-прототипа в OPM, основные мембранные участки белка предсказаны достаточно хорошо. Чувствительность, специфичность и точность предсказания имеют достаточно высокие значения. Напротив, сверхпредсказание и недопредсказание достаточно низки.