Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~igogo/Term2/BLAST.html
Дата изменения: Fri Apr 7 17:27:31 2006 Дата индексирования: Tue Oct 2 07:02:49 2012 Кодировка: Windows-1251 |
i) На сервере NCBI - http://www.ncbi.nlm.nih.gov/BLAST/ - проведен поиск последовательности ASPG2_ECOLI программой BLASTP в банке swissprot (используемая матрица замен а.о. - BLOSSUM62, штраф за открытие гэпа 11, за его продолжение 1). В выдаче программы найден искомый белок. Вот его 'характеристики':
Порядковый номер в выдаче | 1 |
Score | 655 bits (1690) |
E-value | 0.0 |
ii) Повторен поиск с той же входной последовательностью, но в качестве банка указан pdb.
Первая в списке находка - gi|29726729|pdb|1NNS|B (т.е. цепь B L-аспарагиназы E. Coli (димер) в разрешении 1.95 A).Для нее указано следующее:
Идентификатор PDB-кода | 1NNS |
Идентификаторы цепей | B (указана единственная цепь) |
Score | 615 bits (1586) |
E-value | 4e-177 ( 4*10-177) |
Начало и конец выравнивания во входной последовательности (Query) | 23-348 |
Начало и конец выравнивания в находке (Subject) | 1-326 |
Процент совпадений (Identity) | 326/326 (100%) |
Комментарии к увиденному:
Проведен поиск в банке swissprot программой BLASTP по входящей последовательности из файла Q8ZGB7_YERPE.fasta. В выдаче оказался 'мой белок' (ASPG2_ECOLI). Характеристики:
Порядковый номер | 1 |
Score | 471 bits (1212) |
E-value | 1e-132 (10-132) |
Начало и конец выравнивания во входной последовательности (Query) | 1-345 |
Начало и конец выравнивания в находке (Subject) | 1-348 |
Процент совпадений (Identity) | 73% |
Первая находка не является белком Q8ZGB7_YERPE (т.е. тем, чья последовательность была подана на вход). Как сделать белок, поданный на вход, первым из списка? Для этого нужно поменять тип банка с swissprot на nr. Объяснить это можно различиями баз данных nr и swissprot: первый включает в себя пересмотренный GenBank CDS+ PDB+SwissProt+PIR+PRF, а второй - SwissProt - последнее обновление; т.о., возможно отсутствие белка Q8ZGB7_YERPE в SwissProt, поэтому он не первый (точнее, в SwissProt-овском варианте его вовсе нет).
А белок с pdb-кодом 1NNS (см. пункт 1 данной работы) в базе данных nr оказывается 18м.
Информация о банках данных, используемых BLASTP на сервере NCBI - http://www.ncbi.nlm.nih.gov/blast/blast_databases.shtml.
Проведен поиск в банке swissprot программой BLASTP (матрица BLOSSUM62, штраф за открытие гэпа 11, за его продолжение 1) по входящей последовательности из файла thirdprot.fasta:
Порядковый номер | 1 |
Score | 37,7bits |
E-value | 0,008 |
Начало и конец выравнивания во входной последовательности (Query) | 1-24 |
Начало и конец выравнивания в находке (Subject) | 1-48 |
Процент совпадений (Identity) | 50% |
Порядковый номер | 1 |
Score | 62,6bits |
E-value | 10-10 |
Начало и конец выравнивания во входной последовательности (Query) | 1-24 |
Начало и конец выравнивания в находке (Subject) | 1-48 |
Процент совпадений (Identity) | 50% |
В общем, 'глобальный' вывод такой: при поиске белков по каким-либо критериям (по фрагментам его последовательности, по его полной последовательности, по его гомологу) нужно внимательно выбирать параметры поиска для получения оптимальных результатов в соответствие с поставленной задачей.
Повторяю задание 1 (поиск по входной последовательности белка ASPG2_ECOLI), пользуясь программой BLASTP на сервере EBI и на сервере Пастеровского института. Результаты получены 'сходящиеся'.
Мои впечатления:
Через SRS в БД Swiss-Prot найдена последовательность репрессора рибозного оперона RbsR из Bacillus subtilis (AC P36944). Для этого в соответствующих графах Gen Name, Organism Name было внесено RbsR и Bacillus subtilis. С помощью программы BLASTP (интерфейс EBI) проведен поиск по банку данных Swiss-Prot для найденного белка - здесь.
В первом приближении считаю ортологами те последовательности, в названии которых стоит слово RbsR. В числе первых 20 находок это: RBSR_BACSU, RBSR_BACHD, RBSR_LACLA , RBSR_PASMU, RBSR_SHIFL, RBSR_ECOLI (всего 6). Оставшиеся 14 находок, ортологами не яляются (исходя, хотя бы, из первого приближения); их последовательности сходны с последовательностью, поданной на вход, они близки по функциям. Что точно можно об этом сказать: в приведенный список входят гомологи (для этих целей BLAST является отличным инструментом); это могут быть как ортологи, так и паралоги. Значит использоваться BLAST для поиска ортологов может, но со значительными оговорками и дополнительными условиями (в рассматриваемом примере таким условием стало наличие RbsR в названии).
Здесь можно посмотреть исходную версию протокола.