Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~kut/term2/7.html
Дата изменения: Wed May 31 16:31:44 2006
Дата индексирования: Tue Oct 2 05:59:44 2012
Кодировка: Windows-1251
|
Программы построения глобального и локального выравнивания.
Протокол занятия 7.
ыыыВ качестве последовательности myprot.fasta был взят мой белок (NIKR_ECOLI).
В качестве последовательности secondprot.fasta был взят белок NIKR_PSEPK.
В качестве последовательности thirdprot.fasta была взята искуственно созданная последовательность NIKR_COMBO,
склеенная из двух небольших участков аминокислотной последовательности моего белка (NIKR_ECOLI).
Задание1. Выравнивание последовательностей со схожей функцией (возможных гомологов).
1)Результаты глобального выравнивания последовательностей из myprot.fasta и secondprot.fasta с помощью программы needle:
Длина выравнивания (Length) - 138
Идентичность последовательностей (Identity) - 40.6% (56/138)
Сходство последовательностей (Similarity) - 62.3% (86/138)
Количество гэпов (Gaps) - 3.6% (5/138)
Вес выравнивания (Score) - 306
Выравнивание:
NIKR_ECOLI 1 MQRVTITLDDDLLETLDSLSQRRGYNNRSEAIRDILRSALAQEATQQHGT 50
|||:|||||::||:.:|.....:||..|||||||:||:.:.:........
NIKR_PSEPK 1 MQRITITLDEELLDVIDRRVATQGYQGRSEAIRDLLRAGMRESEALPDDA 50
NIKR_ECOLI 51 QGFAVLSYVYEHEKRDLASRIVSTQHHHHDLSVATLHVHINHDDCLEIAV 100
...||:||:|:|..|:|..|:..|.|.||||:.:|||||::...|||::|
NIKR_PSEPK 51 ACVAVVSYLYDHSTRELPRRLNQTLHAHHDLTRSTLHVHLDAGHCLEVSV 100
NIKR_ECOLI 101 LKGDMGDVQHFADDVIAQRGVRHGHLQCLPKED----- 133
|:|:.|.:...:..::.:|||.||.:|.:|...
NIKR_PSEPK 101 LQGESGRIGELSRQLMVERGVEHGQVQVIPAPGQPKVR 138
1to2.needle
2)Результаты локального выравнивание последовательностей из myprot.fasta и secondprot.fasta с помощью программы water:
Длина выравнивания (Length) - 130
Идентичность последовательностей (Identity) - 43.1% (56/130)
Сходство последовательностей (Similarity) - 66.2% (86/130)
Количество гэпов (Gaps) - 0% (0/130)
Вес выравнивания (Score) - 309
Выравнивание:
NIKR_ECOLI 1 MQRVTITLDDDLLETLDSLSQRRGYNNRSEAIRDILRSALAQEATQQHGT 50
|||:|||||::||:.:|.....:||..|||||||:||:.:.:........
NIKR_PSEPK 1 MQRITITLDEELLDVIDRRVATQGYQGRSEAIRDLLRAGMRESEALPDDA 50
NIKR_ECOLI 51 QGFAVLSYVYEHEKRDLASRIVSTQHHHHDLSVATLHVHINHDDCLEIAV 100
...||:||:|:|..|:|..|:..|.|.||||:.:|||||::...|||::|
NIKR_PSEPK 51 ACVAVVSYLYDHSTRELPRRLNQTLHAHHDLTRSTLHVHLDAGHCLEVSV 100
NIKR_ECOLI 101 LKGDMGDVQHFADDVIAQRGVRHGHLQCLP 130
|:|:.|.:...:..::.:|||.||.:|.:|
NIKR_PSEPK 101 LQGESGRIGELSRQLMVERGVEHGQVQVIP 130
1to2.water
Вес глобального выравнивания оказался равным 306, локального - 309. При построении глобального
выравнивания аминокислотные последовательности совмещаются на всем своем протяжении, несмотря
на то, что некоторые выравненные участки могут совсем не иметь сходства. В то время как задача
локального выравнивания отыскать в двух последовательностях участки, которые обладают наибольшей
гомологией, и совместить их. В локальном выравнивании непохожие участки не учитываются. Отличием весов локального и глобального выравниваний
является то, что участок из 3ех аминокислотных остатков стоящий в конце последовательности моего белка NIKR_ECOLI
не был учтен в локальном выравнивании.
Задание2. Выравнивание последовательностей, содержащих общие участки.
1)Результаты глобального выравнивания последовательностей из myprot.fasta и thirdprot.fasta с помощью программы needle:
Длина выравнивания (Length) - 133
Идентичность последовательностей (Identity) - 17.3% (23/133)
Сходство последовательностей (Similarity) - 17.3% (23/133)
Количество гэпов (Gaps) - 82.7% (110/133)
Вес выравнивания (Score) - 83
Выравнивание:
NIKR_ECOLI 1 MQRVTITLDDDLLETLDSLSQRRGYNNRSEAIRDILRSALAQEATQQHGT 50
||||||||||||
NIKR_COMBO 1 -----------LLETLDSLSQRR--------------------------- 12
NIKR_ECOLI 51 QGFAVLSYVYEHEKRDLASRIVSTQHHHHDLSVATLHVHINHDDCLEIAV 100
|||||||||||
NIKR_COMBO 13 ----------------------------------TLHVHINHDDC----- 23
NIKR_ECOLI 101 LKGDMGDVQHFADDVIAQRGVRHGHLQCLPKED 133
NIKR_COMBO 24 --------------------------------- 23
1to3.needle
2)Результаты локального выравнивания последовательностей из myprot.fasta и thirdprot.fasta с помощью программы water:
Длина выравнивания (Length) - 84
Идентичность последовательностей (Identity) - 27.4% (23/84)
Сходство последовательностей (Similarity) - 27.4% (23/84)
Количество гэпов (Gaps) - 72.6% (61/84)
Вес выравнивания (Score) - 83
Выравнивание:
NIKR_ECOLI 12 LLETLDSLSQRRGYNNRSEAIRDILRSALAQEATQQHGTQGFAVLSYVYE 61
||||||||||||
NIKR_COMBO 1 LLETLDSLSQRR-------------------------------------- 12
NIKR_ECOLI 62 HEKRDLASRIVSTQHHHHDLSVATLHVHINHDDC 95
|||||||||||
NIKR_COMBO 13 -----------------------TLHVHINHDDC 23
1to3.water
3)Результаты локального выравнивания последовательностей из myprot.fasta и thirdprot.fasta с помощью программы matcher:
Первое выравнивание:
Длина выравнивания (Length) - 11
Идентичность последовательностей (Identity) - 100% (11/11)
Сходство последовательностей (Similarity) - 100% (11/11)
Количество гэпов (Gaps) - 0% (0/11)
Вес выравнивания (Score) - 68
Выравнивание:
90
NIKR_E TLHVHINHDDC
:::::::::::
NIKR_C TLHVHINHDDC
20
Второе выравнивание:
Длина выравнивания (Length) - 12
Идентичность последовательностей (Identity) - 100% (12/12)
Сходство последовательностей (Similarity) - 100% (12/12)
Количество гэпов (Gaps) - 0% (0/12)
Вес выравнивания (Score) - 55
Выравнивание:
20
NIKR_E LLETLDSLSQRR
::::::::::::
NIKR_C LLETLDSLSQRR
10
Третье выравнивание:
Длина выравнивания (Length) - 13
Идентичность последовательностей (Identity) - 38.5% (5/13)
Сходство последовательностей (Similarity) - 61.5% (8/13)
Количество гэпов (Gaps) - 0% (0/13)
Вес выравнивания (Score) - 28
Выравнивание:
120
NIKR_E DVIAQRGVRHGHL
: ..:: : :.
NIKR_C DSLSQRRTLHVHI
10
1to3.matcher
В глобальном выравнивании, построенным программой needle, количество совпадений равно 23,
так как последовательность NIKR_COMBO была создана из двух небольших участков (длиной 11 и 12) аминокислотной
последовательности моего белка (NIKR_ECOLI).
Количество гэпов - 110, поскольку длина последовательности моего белка (NIKR_ECOLI) - 133, а длина искуственно
созданной последовательности (NIKR_COMBO) - 23.
В локальном выравнивании программой water были найдены оба участка на отрезке [12,95] аминокислотной последовательности
моего белка, и вес выранивания, соответственно, тоже равен 83.
Программа matcher нашла отдельно полностью второй участок, отдельно полностью первый участок, а также в списке
з-х лучших вариантов были результаты выравнивания, при котором была выровнена часть второго участка и часть первого участка, это выравнивание
является абсолютно бессмысленным и программа выдала нам его только потому, что в качества количества лучших выравниваний
мы установили параметр 3.
В первом случае вес выравнивания равен 55 при
11ти совпавших АО(из 11ти, составляющих участок совпадения), соответственно, процент идентичности равен 100%. Во
втором случае вес выравнивания равен 55 при 12ти совпавших АО (из 12ти, составляющих участок совпадения), соответственно,
процент идентичности равен 100%
Задание 3.Параметры программ построения выравниваний.
Результаты глобального выравнивания последовательностей из myprot.fasta и thirdprot.fasta с помощью программы needle:
Штраф за открытие гэпа - 10
Штраф за продолжение гэпа - 1
Файл результатов - 1to3_10_1.needle
Длина выравнивания (Length) - 133
Идентичность последовательностей (Identity) - 9.8% (13/133)
Сходство последовательностей (Similarity) - 10.5% (14/133)
Количество гэпов (Gaps) - 82.7% (110/133)
Вес выравнивания (Score) - 57
Штраф за открытие гэпа - 5
Штраф за продолжение гэпа - 1
Файл результатов - 1to3_5_1.needle
Длина выравнивания (Length) - 135
Идентичность последовательностей (Identity) - 11.1% (15/135)
Сходство последовательностей (Similarity) - 12.6% (17/135)
Количество гэпов (Gaps) - 84.4% (114/135)
Вес выравнивания (Score) - 67
Штраф за открытие гэпа - 1
Штраф за продолжение гэпа - 1
Файл результатов - 1to3_1_1.needle
Длина выравнивания (Length) - 135
Идентичность последовательностей (Identity) - 11.1% (15/135)
Сходство последовательностей (Similarity) - 12.6% (17/135)
Количество гэпов (Gaps) - 84.4% (114/135)
Вес выравнивания (Score) - 79
Все 3 выравнивания отличаются друг от друга только штрафом за открытие гэпа. Соответственно
кол-во гэпов одинаково - оно равно 114, а вес различен. Как и логично предположить, самый
большой вес выравнивания был высчитан при наименьшем штрафе за гэп. Следует также отметить
тот факт, что выравнивания 2 и 3(со штрафом за открытие гэпа 5 и 1 соответственно) не
отличаются друг от друга, в то время как первое (штраф за открытие гэпа 10) имеет много различий.
Например, в первом участке появляется больше гэпов
(то есть уменьшение штрафа за гэп стало причиной его появления в выравнивании).
1to3_10_1.needle
1to3_5_1.needle
1to3_1_1.needle
Карта локального сходства.(при стандартных параметрах)
При уменьшении (увеличении) размера окна соответственно уменьшается (увеличивается) длина
черты (кусочка выравниваемой последовательности).
При снижении порога на суммарный вес получается непонятная картина из множества черточек. А вот при увеличении порога практически ничего не меняется (показано только два выравнивания с наибольшим
весом, все остальные по-видимому не преодолели порог 23, но по идее число черточек должно уменьшаться, и действительно - при дальнейшем увеличении остается одно выранивание, но при очень большом пороге пропадает и оно.)
На главную страницу второго семестра
На главную страницу
©Белошистов Роман