Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~kut/term4/practice8.html
Дата изменения: Thu Apr 26 19:53:36 2007
Дата индексирования: Tue Oct 2 08:03:20 2012
Кодировка: Windows-1251
Practice 8

Мембранные белки.

1)Построение парного выравнивания исследуемого белка и заданного прототипа.

Мое задание:
Белок для исследования
Белок-прототип
AC UniProt
AC UniProt
PDB ID
Q5RLI9
P29972 1H6I

Последовательности и нумерация остатков в БД PDB и БД UniProt могут различаться. Поэтому получил обе последовательности белка-прототипа.
Это оказался аквапорин-1 человека, белок, образующий водную пору. Такой канал обеспечивает плазматическую мембрану эритроцитов и проксимальных почечных канальцев высокой проницаемостью для воды, позволяя ей двигаться в направлении осмотического градиента.
Одну последовательность нашел в SRS по АС, другую получил, учитывая, что структура в PDB начинается с 9 остатка (LEU), а кончается 233 (PRO), но нумерация остатков в БД PDB и БД UniProt не отличаются. Построил выравнивание при помощи программы needle.
Cтраничка с выравниванием.

По идентификатору UniProt получил последовательность заданного белка. Им оказался аквапорин-1 из воробья. Построил парное выравнивание аквапоринов из человека и воробья при помощи программы needle.
Cтраничка с выравниванием.


Характеристики выравнивания:
Длина: 271
Процент идентичности: 226/271 (83.4%)
Процент сходства: 250/271 (92.3%)
Количество гэпов: 2/271 ( 0.7%)
Вес выравнивания: 1169.5

Выравнивание, импортированное в GeneDoc - marking.msf

2)Разметка мембранных сегментов на выравнивании.

По идентификатору PDB белка-прототипа нашел описание ориентации белка в мембране в БД OPM (Orientations of Proteins in Membranes database) В файле marking.msf ниже последовательности прототипа добавил последовательность с названием "OPM" и разметкой ТМ сегментов, отметил позиции мембранных сегментов буквой "Н", позиции цитоплазматических петель знаком "+", остальные - знаком "-".

3)Предсказание топологии заданного белка с помощью наиболее популярной программы (TMHMM).

Предсказал топологию заданного белка с помощью сервера TMHMM. (опции по умолчанию).
Страничка с результатом предсказания.
Добавил к последовательностям в файле marking.msf еще одну искусственную последовательность, отражающую результаты данного предсказания. Эту последовательность назвал "TMHMM". Готовое выравнивание экспортированное в формате HTML:

                                                                                                                                                                                         
                                            *                 2 0                   *                 4 0                   *                 6 0                   *                    
Q 5 R L I 9 _ P A S   :   M A I E F R K K I F W R A V V A E F L A M S L F I F I S I G S A L G F N F P V V A N K T S T R S Q D N V K V S L A F G L S I A T M A Q S V G H I S G   :     7 4
A Q P 1 _ H U M A N   :   M A S E F K K K L F W R A V V A E F L A T T L F V F I S I G S A L G F K Y P V G N N Q T A V - - Q D N V K V S L A F G L S I A T L A Q S V G H I S G   :     7 2
O P M                 :   + + + + + + + + + + H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H + + + +   :     4 0
T M H M M             :   + + + + + + + + + + + + H H H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H H   :     4 3
                                                                                                                                                                      h                  
                                                                                                                                                                                         
                                  8 0                   *               1 0 0                   *               1 2 0                   *               1 4 0                            
Q 5 R L I 9 _ P A S   :   A H L N P A V T L G L L L S C Q I S I F K A L M Y I L A Q C L G A V V A T A I L S G V T S S L P G N S L G L N A L S E G I N A G Q G L G I E I I A T   :   1 4 8
A Q P 1 _ H U M A N   :   A H L N P A V T L G L L L S C Q I S I F R A L M Y I I A Q C V G A I V A T A I L S G I T S S L T G N S L G R N D L A D G V N S G Q G L G I E I I G T   :   1 4 6
O P M                 :   + + + + H H H H H H H H H H H - - - - H H H H H H H H H H H H H H H H H H H H + + + + + + + + + + + + + + + + + + + + + + + + + + + H H H H H H H H   :     7 9
T M H M M             :   H H H + + + + + + + + + + + + + + + + + + + + H H H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - H H H H H H H H H H H H H H   :     8 3
                            h                                                                                                                                                            
                                                                                                                                                                                         
                            *               1 6 0                   *               1 8 0                   *               2 0 0                   *               2 2 0                
Q 5 R L I 9 _ P A S   :   F Q L V L C V L A T T D R R R N D V S G S A P L A I G L S V A L G H L L A I D Y T G C G I N P A R S F G S A L I A N N F E N H W I F W V G P I I G G   :   2 2 2
A Q P 1 _ H U M A N   :   L Q L V L C V L A T T D R R R R D L G G S A P L A I G L S V A L G H L L A I D Y T G C G I N P A R S F G S A V I T H N F S N H W I F W V G P F I G G   :   2 2 0
O P M                 :   H H H H H H H H H H - - - - - - - - - - - H H H H H H H H H H H H H H H H H + + + + + + + + H H H H H H H - - - - - - - - - - H H H H H H H H H H H   :   1 2 4
T M H M M             :   H H H H H H H H H + + + + + + + + + + + + H H H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H   :   1 2 6
                                                                                            H                                                                                            
                                                                                                                                       
                                        *               2 4 0                   *               2 6 0                   *              
Q 5 R L I 9 _ P A S   :   A S A A L I Y D F I L A P R T S D L T D R M K V W T S G Q V E E Y D L E G D D M N S R V E M K P K   :   2 7 1
A Q P 1 _ H U M A N   :   A L A V L I Y D F I L A P R S S D L T D R V K V W T S G Q V E E Y D L D A D D I N S R V E M K P K   :   2 6 9
O P M                 :   H H H H H H H H H H H + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +   :   1 3 5
T M H M M             :   H H H H H H H H H H H H + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +   :   1 3 8
                                                                                                                                       

Также сохранил выравнивание в в виде текстового файла формата Clustal.

4)Оценка качества предсказания.

Результаты предсказания топологии мембранного белка аквапорина-1 из воробья (Q5RLI9_PASDO)

  Число а.к. остатков
Всего а.к. остатков 271
Остатки, предсказанные как локализованные в мембране (всего) 138
Правильно предсказали (true positives, TP) 107
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 31
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 105
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 28
Чувствительность (sensivity) = TP / (TP+FN) 0,7925
Специфичность (specificity) = TN / (TN+FP) 0,772
Точность (precision) = TP / (TP+FP) 0,7753
Сверхпредсказание = FP/ (FP+TP) 0,2246
Недопредсказание = FN / (TN+FN) 0,2105

Таким образом, примерно 77 процентов аминокислотных остатков, предсказанных как локализованные в мембране, действительно являются таковыми. Не были предсказаны 2 трансмембранные спирали, следовательно предсказана неверная ориентация, поэтому предсказание нельзя назвать хорошим.

Дополнительные упражнения.

Проверьте, выполняется ли правило фон Хейне в структуре белка-прототипа (по данным ОРМ) и в топологии, предсказанной ТMHMM.

По данным ОРМ в структуре аквапорина-1 человека выполняется правило фон Хейне. Петли, обращенные в сторону цитоплазмы, содержат 4 остатка аргинина и 6 остатков лизина, обрашенные наружу клетки - 4 остатка аргинина и 1 остаток лизина.
В топологии, предсказанной ТMHMM правило фон Хейне также выполняется. Петли, обращенные в сторону цитоплазмы, содержат 8 остатков аргинина и 6 остатков лизина, обрашенные наружу клетки - 2 остатка аргинина и 2 остатка лизина.



На главную страницу четвертого семестра

На главную страницу


©Белошистов Роман