Программы построения выравниваний
Были подготовлены 3 файла с аминокислотными последовательностями:
- myprot.fasta - последовательность моего белка;
- secondprot.fasta - последовательность белка BLC3_SALTY;
- thirdprot.fasta - кусок последовательности моего белка.
Выравнивание последовательностей возможных гомологов.
Глобальное выравнивание последовательностей из файлов
myprot.fasta и secondprot.fasta
с помощью алгоритма Нидельмана-Вунша
находится в файле 1to2.needle.
Локальное выравнивание тех же последовательностей
с помощью алгоритма Смита-Ватермана
находится в файле
1to2.water.
Параметры, при которых проводилось выравнивание:
- матрица EBLOSUM62;
- штраф за открытие гэпа: 10;
- штраф за проболжение гэпа: 0,5.
Сравнение выравниваний:
- процент идентичности в локальном выравнивании выше;
- количество аминокислотных пар в глобальном выравнивании больше количества в локальном;
- количество гэпов в локальном выравнивании меньше;
- в остальном выравнивание куска из 1to2.water полностью совпадает с выравниванием того же куска из
файла 1to2.needle.
Выравнивание последовательностей, содержащих общие участки
Глобальное выравнивание последовательностей из файлов
myprot.fasta и thirdprot.fasta
содержится в файле 1to3.needle;
Локальное выравнивание тех же последовательностей с использованием алгоритма
Смита-Ватермана находится в файле
1to3.water;
3 локальных выравнивания с наибольшим весом, сделанные с помощью программы matcher,
находятся в файле 1to3.matcher.
Работа с программой matcher
В файле находятся сразу 3 выравнивания.
Первое из выравниваний имеет следующие характеристики:
- длина выравнивания: 13 а.о.;
- процент идентичности: 92,3%;
- количество гэпов: 0;
- вес выравнивания: 62.
Это соответствует выравниванию со вторым куском последовательности из файла thirdprot.fasta, однако оно не дало точного
совпадения. Первые аминокислоты в последовательностях различаются, однако остальная часть последовательности одинакова.
Получается выравнивание из 13 аминокислот.
Второе из выравниваний имеет следующие характеристики:
- длина выравнивания: 10 а.о.;
- процент идентичности: 100%;
- количество гэпов: 0;
- вес выравнивания: 51.
Это выравнивание в точности соответствует первому куску из ampC_ECOLI, который находится в файле thirdprot.fasta, что
объясняет 100% идентичность.
Третье из выравниваний имеет следующие характеристики:
- длина выравнивания: 6 а.о.;
- процент идентичности: 50%;
- количество гэпов: 0;
- вес выравнивания: 19.
Это выравнивание не является выравниванием, отображающим истинную гомологию последовательностей, т.к.
выравнивание не соответствует выбранным кускам, взятым из последовательности ampC_ECOLI для формирования последовательности thirdprot
Сравнение результатов:
Очевидно, что программы needle и water работают по другому принципу, нежели matcher.
Это можно заключить из внешнего вида выравниваний, а также из характеристик выравниваний.
Параметры программ построения выравниваний:
Мы сравниваем глобальные выравнивания последовательностей из
файлов myprot.fasta и thirdprot.fasta с использованием алгоритма Нидельмана-Вунша с разными параметрами штрафов за гэпы.
Чем меньше штраф за гэп, тем больше вес выравнивания: 73, 61 и 56 соответственно.
Ссылки на файлы:
- файл, содержащий выравнивание с параметрами:
- штраф за открытие гэпа: 1;
- штраф за продолжение гэпа: 1.
- файл, содержащий выравнивание с параметрами:
- штраф за открытие гэпа: 5;
- штраф за продолжение гэпа: 1.
- файл, содержащий выравнивание с параметрами:
- штраф за открытие гэпа: 10;
- штраф за продолжение гэпа: 1.
Различие между файлами небольшое:
В фале с штрафом за гэп 1, есть двойной гэп и после некоторого промежутка одинарный.
В файле же с штрафом в 5 и 10 за гэп такого разиения нет, а есть 1 гэп на 3 аминокислоты.
Вес выравнивания уменьшается с увеличением штрафа а гэп.
Карта локального сходства.
С помощью программы dotmatcher были построены карты локального сходства
последовательностей из файлов
myprot.fasta
и thirdprot.fasta с разными параметрами.
Каждая линия, отображенная на карте, соответствует локальному выравниванию
последовательностей.
Параметр "Порог" определяет минимальный вес выравнивания, необходимый для того,
чтобы оно отобразилось на карте.
При уменьшении параметра "Окно"
количество линий становится больше, а их длина - короче.
Ссылки на карты:
- карта 1
- карта 2
- карта 3
Сравним карты:
На первой карте мы видим 2 полосы.
На второй карте мы не видим ни одной полосы, т.к. поро очень высокий.
На третьей катре мы видим множество полос, т.к. порог очень низкий.
©Виктор Соколов