Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~kut/term2/7.html
Дата изменения: Wed May 31 16:31:44 2006
Дата индексирования: Tue Oct 2 05:59:44 2012
Кодировка: Windows-1251
Программы построения глобального и локального выравнивания.

Программы построения глобального и локального выравнивания.

Протокол занятия 7.

ыыыВ качестве последовательности myprot.fasta был взят мой белок (NIKR_ECOLI).
В качестве последовательности secondprot.fasta был взят белок NIKR_PSEPK.
В качестве последовательности thirdprot.fasta была взята искуственно созданная последовательность NIKR_COMBO,
склеенная из двух небольших участков аминокислотной последовательности моего белка (NIKR_ECOLI).
Задание1. Выравнивание последовательностей со схожей функцией (возможных гомологов).

1)Результаты глобального выравнивания последовательностей из myprot.fasta и secondprot.fasta с помощью программы needle:
Длина выравнивания (Length) - 138
Идентичность последовательностей (Identity) - 40.6% (56/138)
Сходство последовательностей (Similarity) - 62.3% (86/138)
Количество гэпов (Gaps) - 3.6% (5/138)
Вес выравнивания (Score) - 306

Выравнивание:

NIKR_ECOLI         1 MQRVTITLDDDLLETLDSLSQRRGYNNRSEAIRDILRSALAQEATQQHGT     50
                     |||:|||||::||:.:|.....:||..|||||||:||:.:.:........
NIKR_PSEPK         1 MQRITITLDEELLDVIDRRVATQGYQGRSEAIRDLLRAGMRESEALPDDA     50

NIKR_ECOLI        51 QGFAVLSYVYEHEKRDLASRIVSTQHHHHDLSVATLHVHINHDDCLEIAV    100
                     ...||:||:|:|..|:|..|:..|.|.||||:.:|||||::...|||::|
NIKR_PSEPK        51 ACVAVVSYLYDHSTRELPRRLNQTLHAHHDLTRSTLHVHLDAGHCLEVSV    100

NIKR_ECOLI       101 LKGDMGDVQHFADDVIAQRGVRHGHLQCLPKED-----    133
                     |:|:.|.:...:..::.:|||.||.:|.:|...     
NIKR_PSEPK       101 LQGESGRIGELSRQLMVERGVEHGQVQVIPAPGQPKVR    138
1to2.needle

2)Результаты локального выравнивание последовательностей из myprot.fasta и secondprot.fasta с помощью программы water:
Длина выравнивания (Length) - 130
Идентичность последовательностей (Identity) - 43.1% (56/130)
Сходство последовательностей (Similarity) - 66.2% (86/130)
Количество гэпов (Gaps) - 0% (0/130)
Вес выравнивания (Score) - 309

Выравнивание:
NIKR_ECOLI         1 MQRVTITLDDDLLETLDSLSQRRGYNNRSEAIRDILRSALAQEATQQHGT     50
                     |||:|||||::||:.:|.....:||..|||||||:||:.:.:........
NIKR_PSEPK         1 MQRITITLDEELLDVIDRRVATQGYQGRSEAIRDLLRAGMRESEALPDDA     50

NIKR_ECOLI        51 QGFAVLSYVYEHEKRDLASRIVSTQHHHHDLSVATLHVHINHDDCLEIAV    100
                     ...||:||:|:|..|:|..|:..|.|.||||:.:|||||::...|||::|
NIKR_PSEPK        51 ACVAVVSYLYDHSTRELPRRLNQTLHAHHDLTRSTLHVHLDAGHCLEVSV    100

NIKR_ECOLI       101 LKGDMGDVQHFADDVIAQRGVRHGHLQCLP    130
                     |:|:.|.:...:..::.:|||.||.:|.:|
NIKR_PSEPK       101 LQGESGRIGELSRQLMVERGVEHGQVQVIP    130


1to2.water

Вес глобального выравнивания оказался равным 306, локального - 309. При построении глобального выравнивания аминокислотные последовательности совмещаются на всем своем протяжении, несмотря на то, что некоторые выравненные участки могут совсем не иметь сходства. В то время как задача локального выравнивания отыскать в двух последовательностях участки, которые обладают наибольшей гомологией, и совместить их. В локальном выравнивании непохожие участки не учитываются. Отличием весов локального и глобального выравниваний является то, что участок из 3ех аминокислотных остатков стоящий в конце последовательности моего белка NIKR_ECOLI не был учтен в локальном выравнивании.

Задание2. Выравнивание последовательностей, содержащих общие участки.

1)Результаты глобального выравнивания последовательностей из myprot.fasta и thirdprot.fasta с помощью программы needle:
Длина выравнивания (Length) - 133
Идентичность последовательностей (Identity) - 17.3% (23/133)
Сходство последовательностей (Similarity) - 17.3% (23/133)
Количество гэпов (Gaps) - 82.7% (110/133)
Вес выравнивания (Score) - 83

Выравнивание:
NIKR_ECOLI         1 MQRVTITLDDDLLETLDSLSQRRGYNNRSEAIRDILRSALAQEATQQHGT     50
                                ||||||||||||                           
NIKR_COMBO         1 -----------LLETLDSLSQRR---------------------------     12

NIKR_ECOLI        51 QGFAVLSYVYEHEKRDLASRIVSTQHHHHDLSVATLHVHINHDDCLEIAV    100
                                                       |||||||||||     
NIKR_COMBO        13 ----------------------------------TLHVHINHDDC-----     23

NIKR_ECOLI       101 LKGDMGDVQHFADDVIAQRGVRHGHLQCLPKED    133
                                                      
NIKR_COMBO        24 ---------------------------------     23


1to3.needle

2)Результаты локального выравнивания последовательностей из myprot.fasta и thirdprot.fasta с помощью программы water:
Длина выравнивания (Length) - 84
Идентичность последовательностей (Identity) - 27.4% (23/84)
Сходство последовательностей (Similarity) - 27.4% (23/84)
Количество гэпов (Gaps) - 72.6% (61/84)
Вес выравнивания (Score) - 83

Выравнивание:
NIKR_ECOLI        12 LLETLDSLSQRRGYNNRSEAIRDILRSALAQEATQQHGTQGFAVLSYVYE     61
                     ||||||||||||                                      
NIKR_COMBO         1 LLETLDSLSQRR--------------------------------------     12

NIKR_ECOLI        62 HEKRDLASRIVSTQHHHHDLSVATLHVHINHDDC     95
                                            |||||||||||
NIKR_COMBO        13 -----------------------TLHVHINHDDC     23
1to3.water

3)Результаты локального выравнивания последовательностей из myprot.fasta и thirdprot.fasta с помощью программы matcher:

Первое выравнивание:
Длина выравнивания (Length) - 11
Идентичность последовательностей (Identity) - 100% (11/11)
Сходство последовательностей (Similarity) - 100% (11/11)
Количество гэпов (Gaps) - 0% (0/11)
Вес выравнивания (Score) - 68

Выравнивание:

           90     
NIKR_E TLHVHINHDDC
       :::::::::::
NIKR_C TLHVHINHDDC
             20   


Второе выравнивание:
Длина выравнивания (Length) - 12
Идентичность последовательностей (Identity) - 100% (12/12)
Сходство последовательностей (Similarity) - 100% (12/12)
Количество гэпов (Gaps) - 0% (0/12)
Вес выравнивания (Score) - 55

Выравнивание:

              20   
NIKR_E LLETLDSLSQRR
       ::::::::::::
NIKR_C LLETLDSLSQRR
               10  


Третье выравнивание:
Длина выравнивания (Length) - 13
Идентичность последовательностей (Identity) - 38.5% (5/13)
Сходство последовательностей (Similarity) - 61.5% (8/13)
Количество гэпов (Gaps) - 0% (0/13)
Вес выравнивания (Score) - 28

Выравнивание:

           120      
NIKR_E DVIAQRGVRHGHL
       : ..::   : :.
NIKR_C DSLSQRRTLHVHI
          10        


1to3.matcher

В глобальном выравнивании, построенным программой needle, количество совпадений равно 23,
так как последовательность NIKR_COMBO была создана из двух небольших участков (длиной 11 и 12) аминокислотной
последовательности моего белка (NIKR_ECOLI).
Количество гэпов - 110, поскольку длина последовательности моего белка (NIKR_ECOLI) - 133, а длина искуственно
созданной последовательности (NIKR_COMBO) - 23.
В локальном выравнивании программой water были найдены оба участка на отрезке [12,95] аминокислотной последовательности
моего белка, и вес выранивания, соответственно, тоже равен 83.
Программа matcher нашла отдельно полностью второй участок, отдельно полностью первый участок, а также в списке з-х лучших вариантов были результаты выравнивания, при котором была выровнена часть второго участка и часть первого участка, это выравнивание является абсолютно бессмысленным и программа выдала нам его только потому, что в качества количества лучших выравниваний мы установили параметр 3. В первом случае вес выравнивания равен 55 при 11ти совпавших АО(из 11ти, составляющих участок совпадения), соответственно, процент идентичности равен 100%. Во втором случае вес выравнивания равен 55 при 12ти совпавших АО (из 12ти, составляющих участок совпадения), соответственно, процент идентичности равен 100%

Задание 3.Параметры программ построения выравниваний.

Результаты глобального выравнивания последовательностей из myprot.fasta и thirdprot.fasta с помощью программы needle:

Штраф за открытие гэпа - 10
Штраф за продолжение гэпа - 1
Файл результатов - 1to3_10_1.needle

Длина выравнивания (Length) - 133
Идентичность последовательностей (Identity) - 9.8% (13/133)
Сходство последовательностей (Similarity) - 10.5% (14/133)
Количество гэпов (Gaps) - 82.7% (110/133)
Вес выравнивания (Score) - 57


Штраф за открытие гэпа - 5
Штраф за продолжение гэпа - 1
Файл результатов - 1to3_5_1.needle

Длина выравнивания (Length) - 135
Идентичность последовательностей (Identity) - 11.1% (15/135)
Сходство последовательностей (Similarity) - 12.6% (17/135)
Количество гэпов (Gaps) - 84.4% (114/135)
Вес выравнивания (Score) - 67


Штраф за открытие гэпа - 1
Штраф за продолжение гэпа - 1
Файл результатов - 1to3_1_1.needle

Длина выравнивания (Length) - 135
Идентичность последовательностей (Identity) - 11.1% (15/135)
Сходство последовательностей (Similarity) - 12.6% (17/135)
Количество гэпов (Gaps) - 84.4% (114/135)
Вес выравнивания (Score) - 79

Все 3 выравнивания отличаются друг от друга только штрафом за открытие гэпа. Соответственно кол-во гэпов одинаково - оно равно 114, а вес различен. Как и логично предположить, самый большой вес выравнивания был высчитан при наименьшем штрафе за гэп. Следует также отметить тот факт, что выравнивания 2 и 3(со штрафом за открытие гэпа 5 и 1 соответственно) не отличаются друг от друга, в то время как первое (штраф за открытие гэпа 10) имеет много различий. Например, в первом участке появляется больше гэпов (то есть уменьшение штрафа за гэп стало причиной его появления в выравнивании).
1to3_10_1.needle

1to3_5_1.needle

1to3_1_1.needle

Карта локального сходства.(при стандартных параметрах)
При уменьшении (увеличении) размера окна соответственно уменьшается (увеличивается) длина черты (кусочка выравниваемой последовательности). При снижении порога на суммарный вес получается непонятная картина из множества черточек. А вот при увеличении порога практически ничего не меняется (показано только два выравнивания с наибольшим весом, все остальные по-видимому не преодолели порог 23, но по идее число черточек должно уменьшаться, и действительно - при дальнейшем увеличении остается одно выранивание, но при очень большом пороге пропадает и оно.)

На главную страницу второго семестра

На главную страницу


©Белошистов Роман