Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~svit/term2/BLAST.htm
Дата изменения: Thu Apr 13 20:53:04 2006
Дата индексирования: Tue Oct 2 06:26:49 2012
Кодировка: Windows-1251
Работа с программой BLAST

На страницу II-ого семестра

Работа с программой BLAST

  1. Поиск белка по его последовательности.

    I. С помощью программы BLAST осуществили поиск последовательности P12996 в банке SwissProt. Ниже указанны результаты поиска для белка P12996:

    Порядковый номер: 1
    Score = 696 Bits (1796)
    E-value = 0

    II. Повторили поиск, произведенный в части I данного задания, только в качестве банка указали PDB. Для первой в списке находки ниже указаны результаты поиска:

    PDB ID: 1R30 (Chain B)
    Score: 694 Bits
    E-value: 0
    Начало выравнивания: Query 2 Subject 25
    Конец выравнивания: Query 346 Subject 369
    Identity: 100%

    В первом случае был найден в точности тот белок, который был задан в качестве запроса. А во втором случае первым в выдыче была несколько иная последовательность, длина которой больше нашей исходной последовательности. Несмотря на это, процент идентичности все равно 100%. Это произошло потому что программа строит локальное выравнивание и более короткая последовательность совпала на 100% с участком более длинной.

  2. Поиск белка по его гомологу.

    Провели поиск в банке swissprot программой BLASTP, подав на вход последовательность из файла Q66D67.fasta. Последовательности поданной на вход в результатах не оказалось. Первая из найденных последовательностей имеет только 89% совпадений с исходной. Разумно было бы предположить, что последовательность с Accession number (AC) Q66D67 отсутствует в банке SwissProt. Чтобы проверить это предположение, поискали эту последовательность напрямую в SwissProt. Действительно оказалось, что такой последовательности в банке нет! Хотя в TrEMBL такая последовательность оказалась найдена. Все это значит, что наша проблема очень просто решается: надо применять программу BLASTP для нескольких банков, среди которых есть TrEMBL (параметр nr). C таким новым параметром первой в выдаче оказалась последовательность с AC AAS61260, что есть в точности наша последовательность. Score = 696 bits; e-value = 0.

  3. Поиск белка по фрагментам его последовательности.

    Провели поиск в банке swissprot программой BLASTP, подав на вход последовательность из файла thirdprot.fasta. Программа выдала 2 находки. Причем первое выравнивание с последовательность BIOB_Ecoli (P12996), где выровнено 13 а.о. Для этого выравнивания Score = 27,7 bits; e-value = 7,6. Для такой короткой последовательности не может быть низкого e-value.
    Вторая последовательнсть представляет из себя последовательность гомологичную BIOB_Ecoli. Во второй последовательности выровнен тот же участок, что и в первом случае.

  4. (*) Разные пользовательские интерфейсы BLAST.

    Повторим первое задание, иcпользуя различные пользовательские интерфейсы программы BLAST, с различных сайтов.

    Сначала, поиск производился с помощью BLAST с сайта EBI. Надо заметить приятный дружелюбный интерфейс, который выгодно отличается от интерфейса на сайте NCBI. Также порадовала возможность получить результаты работы программы по e-mail, что является очень ценным свойством для данной программы. Очень симпатичная таблица выдачи результатов. В ней содержится больше информации, чем в выдачи результатов в NCBI, а также эта таблица более ориентирована на пользователя - информация выдана в более доступной форме. Результаты работы программы, касательно нашего задания, точно такие же, как и в BLAST на сайте NCBI. Из минусов данного интерфейса хочется заметить следующее. Во-первый, окошко в которое вводится последовательность, не рассчитана на стандартную длинну строки в fasta формате 60 а.о. Во-вторых, в таблице не нормированный вес, а вес выравнивания Ватермана-Смита. И самый важный недостаток этого интерфейса - очень маленькая скорость обработки запроса.

    Произведем поиск с помощью программы BLAST с сайта Пастеровского института. Следует заметить очень простой интерфейс программы на этом сайте. Функций минимум. Результат запроса можно получить, либо по e-mail, либо получить ссылку на результаты. Результат выполнения задания тот же самый, что и в предыдущих двух случаях. Но с этим интерфейсом работать гораздо менее приятно, чем с предыдущим. Достоинств у этого интерфейса я не заметил.

  5. (*) Является ли BLAST инструментом для поиска ортологов?

    С помощью поисковой системы SRS нашли репрессор рибозного оперона RbsR из организма Bacillus subtilis (AC P36944; P96734), получили его аминокислотныю последовательность в fasta формате. Далее с помощью программы BLASTP осуществили поиск по банку SwissProt для репрессора рибозного оперона RbsR из организма Bacillus subtilis.
    Среди первых 20 находок только 6 имеют в своем названии RbsR. Это RbsR_BACSU(исходная последовательность), RbsR_BACHD, RbsR_LACLA, RbsR_PASMU, RbsR_HAEIN, RbsR_SHIFL. Остальные (исходя из первого приближения) ортологами не являются. Оставшиеся последовательности являются гомологами, т.е. BLASTP позволяет определять гомологичные послодовательности. Из 20 первых гомологичных последовательностей, ортологами оказалось только 6, при том программа никак их не отделила их от паралогов, это пришлось делать вручную. Таким образом, программа BLASTP как таковая не является инструментом для поиска ортологов, их надо выбирать вручную из списка находок, пользуясь знаниями о том, что такое ортологи.


© Sedliarov Vitaliy