Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~marine/bb.html
Дата изменения: Wed May 27 17:30:04 2009
Дата индексирования: Mon Oct 1 21:37:13 2012
Кодировка: Windows-1251
Aznauryan's page

Программа BLASTP


Поиск гипотетических гомологов белка RimN_Ecoli в разных БД
  Поиск по БД Swiss-Prot Поиск по БД PDB Поиск по БД "nr"
1. Лучшая находка (в принципе должна соответствовать заданному белку)
Идентификатор БД  RimN_Ecoli  1HRU  NP_417741.1
E-value  9e-108  6e-106  1e-106
Вес (в битах)  388  378  388
% идентичности  100%  98%  100%
Найдены ли другие белки с теми же значениями E-value и веса в битах?
Если найдены, то укажите общее число и приведите один идентификатор (любой, но желательно Swiss-Prot ID)
 нет  нет  нет
2. Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний, Descriptions, с E-value < 1E-10)  119  4  972
2. "Худшая" находка (последняя в выдаче с E-value < 1)
Номер находки в списке описаний (Descriptions)  131  5  2027
Идентификатор БД  SYFB_THIDA  1JCU  ZP_03152030
E-value  0.82  1e-09  0.97
Вес (в битах)  33.1  58.9  37.0
% идентичности  28%  25%  26%
% сходства  44%  44%  47%
Длина выравнивания  781  208  348
Координаты выравнивания (номера первых и последних а.о.)  68-169 у RimN_Ecoli, 194-293 у SYFB_THIDA  3-108 у 1HRU, 9-181 у 1JCU  3-167 у NP_417741.1, 11-174 у ZP_03152030
% гэпов  7%  2%  8%


Подведем итоги:
Мне удалось найти белок RimN_Ecoli во всех трех БД. Различий между выравниваниями белка с самим собой нет.Так называемые "худшие" находки не совпадают, а самым хорошим среди них содержится в банке PDB. Хочу заметить, что банк PDB выдал значительно меньше находок, чем остальные банки. Объясняется это тем, что банк PDB содержит информацию лишь о тех белках, для которых известна 3D структура ( а их значительно меньше).

Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам
Задача - для изучаемого белка RimN_Ecoli найти лучшего гомолога в организмах таксона, филогенетически как можно более далекого от E_coli.
Такой гомолог был найден в таксоне Homo sapiens. Его ID - YRDC_HUMAN, E-value - 2e-05, вес (в битах) - 45.1, % идентичности - 28%, % сходства - 44%, длина выравнивания - 279, координаты выравнивания - 8-159 для RimN_Ecoli и 68-209 для YRDC_HUMAN, % гэпов -8%.

Поиск белка по его фрагменту


  Поиск по фрагменту Поиск по полной
последовательности
АС лучшей находки  A9N9G8  A9N9G8
E-value  3e-11  5e-106
Вес (в битах)  65.1  382
Найдены ли другие белки с теми же значениями E-value и веса в битах?
 да, найдены: RIMN_COXBN, RIMN_COXBU  нет

Полная последовательность белка A9N9G8 представлена здесь.
Поиск по фрагменту и по полной последовательности белка имеют разную задачу. При поиске по фрагменту, мы пытаемся найти какому белку ( или белкам) принадлежит этот фрагмент. А при поиске по полной последовательности белка мы хотим найти гомологичные данному белки. Хочу заметить, что те белки, в которых был обнаружен искомый фрагмент, не обязательно будут близкими гомологами белку с полной последовательностью.
Найдем выравнивание белка A9N9G8 с изучаемым белком RimN_Ecoli.
        
A9N9G8 7 SINDAVKCLRQGGVIAYPTEAVYGLGCDPFNHDAVAQLLTIKKRSIKKGFILIASEWKQV 66
+I A+ L + VIAYPTEAV+G+GCDP + AV +LL +K+R + KG ILIA+ ++Q+
RimN_Ecoli 9 AIAAAIDVLNEKRVIAYPTEAVFGVGCDPDSETAVMRLLELKQRPVDKGLILIAANYEQL 68

A9N9G8 67 EPLTEPIDPKALAR--VFDTWPGPFTWTFPASKEAPHWITGQHSTIAIRVTAHPLAKLLC 124
+P + + R +F WPGP T+ FPA P W+TG+ ++A+RVT HPL LC
RimN_Ecoli 69 KPYIDDTMLTDVQRETIFSCWPGPVTFVFPAPATTPRWLTGRFDSLAVRVTDHPLVVALC 128

A9N9G8 125 QRFAGPLISSSANQEGEPPIRDVKILRLVFGNKIDKTLEGPLGPTHRPTPIRDAITGEIL 184
Q + PL+S+SAN G PP R V +R FG + G G P+ IRDA+TGE+
RimN_Ecoli 129 QAYGKPLVSTSANLSGLPPCRTVDEVRAQFGAAF-PVVPGETGGRLNPSEIRDALTGELF 187

A9N9G8 185 R 185
R
RimN_Ecoli 188 R 188


E-value = 3e-38, score = 157 бит, длина выравнивания 190, процент идентичности 44%, процент сходства 61%, процент нэпов 1%.
Синим выделен фрагмент, который я выравнивала с помощью GeneDoc ( см. Пробные выравнивание).
Мной было предложено похожее выравнивание, однако имеется одно различие: положение гэпа.:



Сравнение выравниваний, выданных программой BLASTP, 
с оптимальными глобальным и локальным выравниваниями.


Сравним выравнивание, выданное BLASTP с:
а) с оптимальным глобальным выравниванием



        RimN_Ecoli         1 MNNNLQRDAIAAAIDVLNEERVIAYPTEAVFGVGCDPDSETAVMRLLELK     50 
                             |::..|  :|..|:..|.:..|||||||||:|:||||.:..||.:||.:|        
        RIMN_COXBR         1 MDDYTQ--SINDAVKCLRQGGVIAYPTEAVYGLGCDPFNHDAVAQLLTIK     48 
                                                                                       
        RimN_Ecoli        51 QRPVDKGLILIAANYEQLKPYIDDTMLTDVQRETIFSRWPGPVTFVFPAP    100 
                             :|.:.||.||||:.::|::|..:......:.|  :|..||||.|:.|||.        
        RIMN_COXBR        49 KRSIKKGFILIASEWKQVEPLTEPIDPKALAR--VFDTWPGPFTWTFPAS     96 
                                                                                       
        RimN_Ecoli       101 ATTPRWLTGRFDSLAVRVTDHPLVVALCQAYGKPLVSTSANLSGLPPCRT    150 
                             ...|.|:||:..::|:|||.|||...|||.:..||:|:|||..|.||.|.        
        RIMN_COXBR        97 KEAPHWITGQHSTIAIRVTAHPLAKLLCQRFAGPLISSSANQEGEPPIRD    146 
                                                                                       
        RimN_Ecoli       151 VDEVRAQFGAAF-PVVPGETGGRLNPSEIRDALTGELFRQG    190          
                             |..:|..||... ..:.|..|....|:.||||:|||:.|.                  
        RIMN_COXBR       147 VKILRLVFGNKIDKTLEGPLGPTHRPTPIRDAITGEILRL-    186          

           


Сравнивая выравнивание, выданное BLAST, и выравнивание needle, можно отметить разную длину выравниваний: у Blast - 180, а у needle 191.
Также различия имеются в положении гепов. У BLAST'а: между позициями 165-166 по RimN_Ecoli и 81-82 по RimN_Coxbr, а у needle: между позициями 162-163 по RimN_Ecoli и 6-7, 80-81 по RimN_Coxbr.

б) с оптимальным локальным выравниванием

        
RimN_Ecoli 9 AIAAAIDVLNEERVIAYPTEAVFGVGCDPDSETAVMRLLELKQRPVDKGL 58 :|..|:..|.:..|||||||||:|:||||.:..||.:||.:|:|.:.||. RIMN_COXBR 7 SINDAVKCLRQGGVIAYPTEAVYGLGCDPFNHDAVAQLLTIKKRSIKKGF 56 RimN_Ecoli 59 ILIAANYEQLKPYIDDTMLTDVQRETIFSRWPGPVTFVFPAPATTPRWLT 108 ||||:.::|::|..:......:.| :|..||||.|:.|||....|.|:| RIMN_COXBR 57 ILIASEWKQVEPLTEPIDPKALAR--VFDTWPGPFTWTFPASKEAPHWIT 104 RimN_Ecoli 109 GRFDSLAVRVTDHPLVVALCQAYGKPLVSTSANLSGLPPCRTVDEVRAQF 158 |:..::|:|||.|||...|||.:..||:|:|||..|.||.|.|..:|..| RIMN_COXBR 105 GQHSTIAIRVTAHPLAKLLCQRFAGPLISSSANQEGEPPIRDVKILRLVF 154 RimN_Ecoli 159 GAAF-PVVPGETGGRLNPSEIRDALTGELFR 188 |... ..:.|..|....|:.||||:|||:.| RIMN_COXBR 155 GNKIDKTLEGPLGPTHRPTPIRDAITGEILR 185

Данное выравнивание и выравнивание, составленное программой BLAST, имеют небольшие различия. Во-первых, это длина выравниваний: у BLAST 180, а у water 189. Во-вторых, это положение одного из гэпов с координатами 80-81 по RimN_Coxbr.
Все три выравнивания сделаны с одинаковыми штрафами за гэп: 11 - за открытие гэпа и 1 за его длину.

© Азнаурян 2008 marina-91@list.ru