Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~marine/mnog2.html
Дата изменения: Mon May 25 17:09:33 2009
Дата индексирования: Mon Oct 1 23:10:02 2012
Кодировка: Windows-1251
Множественное выравнивание последовательностей
Задача - получить выравнивание вирусных белков, называемых "дельта-антигенами",
посредством программы muscle и посмотреть на него в GeneDoc.
Для начала получим файл с последовательностями дельта-антигенов в формате "fasta". Для
этого воспользуемся SRS. Как известно, все дельта-антигены происходят из рода вирусов
"Deltavirus" и имеют в описании слово "delta". Вводя в строку запроса "([swissprot-AllText:delta*] & [swissprot-AllText:deltavirus*])", получим 34 находки. Эти последовательности в fasta-формате представлены здесь). Импортируем файл в GeneDoc. И вот, что получилось:
Теперь построим множественное выравнивание посредством программы "muscle".Результаты выравнивания в fasta-фрмате
здесь. Обратим внимание, что в fasta-формате
эти последовательности ничем не отличаются от предыдущих, предложенных в первой ссылке!
Теперь импортируем файл с выровненными воследовательностями Genedoc.
И вот, что мы видим:
Делаем вывод - один и тот же файл в разных форматах выглядит по-разному, т.е., если
в fasta-формате этот файл ничем не отличался от обычных последовательностей, предложенных в fasta-формате, то в GeneDoc'е мы видим разницу между выровненными последовательностями и
невыровненными.
Теперь опробуем эту технологию на белке RimN_Ecoli и его гомологах.
Для этого, во-первых, отберем несколько гомологов данного белка. ( Постараемся выбрать
не самых близких гомологов, чтобы работа была интереснее:)
Итак, воспользовавших поисковой системой BLAST, я выбрала следующих гомологов:
RimN_Metca, RimN_Alcbs, RimN_Psep1, RimN_Sacd2 и и конечно же RimN_Ecoli.
Построим множественное выравнивание последовательностей этих белков, воспользуясь программой GeneDoc.
И вот, что получилось:
Рассмотрим структуру получившегося выравнивания. Мы видим, что имеются несколько участков с повышенной долей консервативных участков, а именно участки:
1. 25-40;
2. 59-64;
3. 117-121;
4. 138-144;
Также в этом выравнивании присутствуют участки, где оно недостоверно,т.е. скорее всего
не имеют биологического смысла. Это следующие участки: (координаты по строкам такие же, как и в консервативных участках
1. 66-87;
2. 158-170.