Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.su/FBB/year_07/term2/Dialog.doc
Дата изменения: Wed Apr 2 12:06:26 2008
Дата индексирования: Mon Oct 1 21:56:56 2012
Кодировка: koi8-r


Из переписки

---------- Original Message -----------

From: Мария Баранова

To: aba@belozersky.msu.ru

Sent: Tue, 01 Apr 2008 21:49:37 +0400

Subject: Зачетное задание. 1 курс.


> Здравствуйте, Андрей Владимирович!

> Уточните пожалуйста задание:"указать число и процент совпадающих

> остатков и функционально сходных остатков на биологически

> обоснованных участках выравнивания". Имеется ввиду посчитать число

> совпадающих остатков по всем биологически обоснованным участкам

> выравнивания суммарно или для каждого такого участка в отдельности?

> Процент считать от длины участка, суммарной длины всех участков или

> вообще от общей длины последовательности? Спасибо! Студенты 1 курса

------- End of Original Message -------

Дорогие студенты 1-го курса!


Пусть есть два участка биол.об.варавнивания, A - из 10 позиций (колонок) и

B - из 6 позиций. В A есть 5 консервативных позиций (одна и та же буква в

колонке), в B - 3. Тогда нужный процент консервативных остатков равен


(5+3)*100/(10+6).


Аналогично - для функционально консервативных позиций - тех, которые

закрашиваются в GenDoc если разрешены "Similarity groups" - не помню точно,

как в меню написано, но что-то вроде этого. Пусть их 7 на участке A (все

консервативные, конечно, входжят в эти 7) и 4 - на участке B. Тогда процент

ф.конс. поз-й равен (7+4)*100/(10+6).


На участках, где нету осмысленного выравнивания - вне A и B - считать

консервативные позиции бессмысленно! А правильной характеристикой

соотношения осмысленного выравнивания (A+B) и неосмысленного является

отношение суммы длин A и B к числу аминокисл. остатков в каждом из белков.

Другого ничего не придумаешь! (Это число я не просил, кажется, указать: в

ваших примерах взяты только фрагменты п.п.цепи, и оно не отражает сходства

белков в целом)


Успехов вам.


AAl


PS Неужели вы все - 33 - собрались вместе в одной комнате и ждете моего

ответа :) Я, кстати, уже ответил одн раз "всем студентам 1-го курса" - это

были вы, или какие-то другие студенты? Мне же не безразлично с кем я

переписываюсь: одному ответишь так, а другому - этак, все люди разные, и ко

всем - свой подход. А как перписываться со всеми сразу - я даже не понимаю

:((


---------- Original Message -----------
From: Мария Баранова
To: aba@belozersky.msu.ru
Sent: Tue, 01 Apr 2008 23:25:02 +0400
Subject: Зачетное задание. 1 курс.

> Спасибо большое, Андрей Владимирович,за столько быстрый ответ!
> Только вот еще вопрос. Разве в участок биолог.об. выравнивания
> входят не только консервативные и функционально консервативные
> позиции? или туда входит что-то еще? Т.е. если у нас учаток из 10
> позиций: в нем 5 консервативных и 7 функционально консервативных
> позиций, то на что приходятся еще 3 позиции?
> P.S.Нет, мы, конечно, не все 33 человека пишем Вам письма.=) Просто
> при обсуждении выполнения заданий иногда понимаем, что у нас
> возникают одинаковые вопросы, поэтому, чтобы Вам не приходило 33
> письма с одним и тем же вопросом, его пишет кто-то один.=)
------- End of Original Message -------



Мария!

> .письма с одним и тем же вопросом, его пишет кто-то один.=)
Так было бы правильно, чтобы письмо и подписал этот один :)

Участок биологически обоснованного выравнивания мы узнаем из совмещения
С_alpha атомов полипептидных цепей - с помощью Rasmol'a, скрипта ini.spt и
глаз (и мозги тоже не лишние) . На участке A 10 C-alpha из одной структуры
почти совпали с 10 C_alpha из другой. Значит, ВЫРАВНИВАНИЕ 10
СООТВЕТСТВУЮЩИХ АМИНОКИСЛОТНЫХ ОСТАТКОВ ОДНОГО БЕЛКА С 10 ОСТАТКАМИ ДРУГОГО
БИОЛОГИЧЕСКИ ОБОСНОВАНО - совпали полипептидные цепи! При этом мы же даже
не смотрели на то, какие боковые цепи у этих остатков. Поэтому, после
приведения выравнивания в соответствие с совпадением C_alpha на участке A в
некоторых колонках окажутся совпадающие или "сходные" буквы, а в других -
буквы будут разные и не сходные (т.е. аминокислоты не похожи по физико-
химическим свойствам). Это я еще пример привел простой, у некоторых из
студентов совпадающих букв на участке обоснованного выравнивания может
оказаться 3 из 10!

Еще раз главное.

Если есть структуры белков, то правильное - биологически обоснованное -
выравнивание строится по совмещению C_alpha атомов полипептидных цепей.
Выделяются участки обоснованного выравнивания - те, что C_alpha атомы
совпадают - и остальные, на которых полипептидные цепи лежат по-разному в
двух белках и никакого соответствия между C_alpha не выявляется. На этих
последних участках обоснованного выравнивания НЕТ.

Соответствие между совпадающими C_alpha определяет соответствие между
остатками и, стало быть, буквами в последовательности. Значит, можно
построить выравнивание последовательностей, в котором будут отмечены
участки где выравнивание биологически обосновано, и прочие, на которых
биологически обоснованного выравнивания нет. На участках биологически
обоснованного выравнивания оказываются как консервативные позиции, так и не
консервативные.

Факт жизни состоит в том, что на участках п.п.цепей, совпадающих при
совмещении структур, консервативных остатков всегда больше, чем при любом
другом совмещении. Этому наблюдению есть объяснение. Оно состоит в том, что
в процессе эволюции двух белков от общего предка на таких участках никогда
не было делеций/вставок. Поэтому совмещаемые в пространстве C_alpha
соответствуют остаткам, произошедшим от одного общего предка - остатка из
предкового белка. При этом замены некоторых остатков предка на другие у
потомков произошли. Наверное, потому, что боковая цепь этого остатка не
играла критической роли ни для функции белка, ни для его структуры. Все же
и у таких остатков есть общая важная роль: остов полипептидной цепи должен
сохранить свою длину и конформацию - положение в пространстве - чтобы
структура сохранилась! Другие же остатки не изменились именно потому, что
их боковые цепи важны для структуры или функции белка - как предка, так и
всех его потомков.

На практике приходится выравнивать последовательности не зная структур -
структура известна только для каждого сотого белка :(

Идея программ выравнивания основана на том, что наибольшее число
совпадающих букв как раз и окажется на участках биологически обоснованного
выравнивания, которое можно было бы построить, зная структуры, но увы,
обычно структуры неизвестны :( Поэтому и придуманы алгоритмы Смита-
Вотермана и Нидельмана-Вунша для выравнивания последовательностей. Часто
программы выравнивания последовательностей хорошо угадывают ответ -
построенное ими выравнивание совпадает с биологически обоснованным в случае
если структуры известны. Но не всегда! И, к сожалению, программы не
сообщают настолько ли хорошее выравнивание они построили, что оно может
соответствовать биологически обоснованному, или нет.

Совсем коротко.

ПРАВИЛЬНОЕ выравнивание последовательностей - то, которое соответствует
совпадению C_alpha при наложении структур. Оно сопровождается выделением
тех участков, на которых совпадение C_alpha есть. Вне таких участков
биологического смысла в выравнивании нет.

ПРОГРАММЫ выравнивания последовательностей пытаются угадать правильное
выравнивание (не зная ответа).

Чего-нибудь понятно стало?

Всего хорощего!

AAl

PS Нашу переписку включу в файл Cr_2.doc - она может быть полезна всем.