Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~maravilla/term2/nazvanie.html
Дата изменения: Mon May 25 18:47:15 2009
Дата индексирования: Tue Oct 2 12:21:35 2012
Кодировка: Windows-1251
Парные выравнивания
Парные выравнивания

Задание 1

Команда "ls" показывает папки и файлы, которые лежат в открытой директории. В моем случае это была директория "maravilla" на диске Н.
Команда "ls .." показывает папки и файлы, лежащие в директории выше.
C помощью команды "cd .." мы можем выполнить переход в директорию выше. А команда "ls" показывает папки и файлы, лежащие в этой директории. При неоднократном повторении этой процедуры мы поднимаемся до главной директори и там остаемся, поскольку дальше идти некуда. :)
Команда "pwd" отображает путь от главной директории до той, которая у нас открыта в данный момент.



Задание 2

Команда "seqret sw:p0AAJ3 -auto" создала в директории "maravilla" файл fdnh_ecoli.fasta, который содержит аминокислотную последовательность белка FDNH_ECOlI. Если мы затем выполним команду "ls", то увидим, что в текущей директории появился новый файл. Команда "more fdnh_ecoli" позволяет нам посмотреть содержимое файла. В данном случае, как уже говорилось, файл содержит последовательность аминоксилотных остатков.

Команда "entret sw:p00000 -auto" создала в той же директории файл fdnh_ecoli.entret, который содержит полную запись UniProt о белке FDNH_ECOLI, в чем мы убеждаемся, запустив команду "more fdnh_ecoli.entret".


Задание 3

Впечатления от нажимания клавиш "стрелка вверх" и "стрелка вниз" остались самые приятные: они позволяют выполнять команды, которые уже использовались ранее.
Команда "history" выводит список всех команд, которые использовались.
Команда "more S", а затем "Tab" автоматически вводят в командную строку название файла Student1.jpg, которые был заведен еще в первом семестре.


Задание 4 (Построение глобального выравнивания с помощью программы needle пакета EMBOSS

С помощью команды "needle seq.fasta fdnh_ecoli.fasta total.needle -auto" создаем файл total.needle в той же директории maravilla. (Файл seq.fasta содержит последовательность аминокислотных остатков родственного белка) Файл total.needle заключает в себе выравнивание последовательностей этих двух белков.
Создадим еще одно выравнивание ( total2.needle ), только в этот раз увеличим штрафы вдвое (если в первый раз gap_penalty равен 10.0 и extend_penalty равен 0.5, то во второй раз они равны по 20.0 и 1.0 соответственно).
Затем переведем эти выравнивания в формат *.msf* и откроем программой GeneDOc.


Первое выравнивание (стандартные штрафы)


Второе выравнивание (штрафы увеличены вдвое)


Нетрудно заметить, что во втором случае гэпов меньше (следствие увеличения штрафов). Кроме того, цена первого выравнивания (штрафы по умолчанию) равна 345, а цена второго выравнивания (штрафы увеличены вдвое) равна 289.
В этих выравниваниях можно найти множество примеров, когда одной и той же позиции сопоставляются разные позиции второй последовательности. Например, самый первый метионин в первом выравнивании находится на 30 позиции и ему сопоставляется валин. Во втором выравнивании тот же метионин находится на 28 позиции выравнивания и ему сопоставлен аланин. Или же (принципиально иной случай) в первом выравнивании валину в 231 позициив первой последовательности сопоставляется валин,следующий за глицином, в то время как во втором выравнивании тот же валин находится в 229 позиции и ему сопоставляется валин, следующий за гистидином, то есть не тот валин, который сопоставлялся ему в первом выравнивании.
Примеров того, чтобы в первом выравнивании какой-либо позиции соответствует другая позиция, а во втором выравнивании на этом месте пропуск, нет. Но зато встречаются примеры наоборот, так как в первом выравнивании пропусков больше. Также встретился случай, когда определенной позиции во второй последовательности сопоставлена позиция первой последовательности, а во втором выравнивании на месте соответствующей позиции первой последовательности стоит пропуск. (Тот же валин второй последовательности в 231 позиции и в 224 позиции в первом и втором выравниваниях соответственно.
Как мы видим, белок FDHB_DESGI намного короче FDNH_ECOLI, причем "не хватает" 29 аминокислот и примерно столько же в конце. Поэтому логичным было предположить, что эти части в процессе эволюции были утеряны в результате делеции.


Задание 5 (Построение локального (частичного) оптимального выравнивания тех же последовательностей с помощью программы water пакета EMBOSS)

Используя программу water, строим выравнивания тех же последовательностей тех же белков.

В этом задании мы строим выравнивания со штрафами как по умолчанию, так и в два раза больше и меньше. Получаем три файла: katuka.water , katuka2.water , katuka3.water . Затем мы их опять же переводим в формат *.msf* и смотрим с помощью программы GeneDoc.

Первое выравнивание (штрафы по умолчанию)


Второе выравнивание (штрафы увеличены вдвое)


Третье выравнивание (штрафы уменьшены вдвое)


Bсе эти три выравнивания различны. Третье (с наименьшими штрафами) получилось самым длинным.

Примеров того, как какой-либо позиции в первой последовательности первого выравнивания сопоставляется другая позиция, а в другом случае этого нет, опять же масса. Те же самые валины. В первом выравнивании в первой последовательности на 190 позиции последовательности валин сопоставляется валину на 186 позиции последовательности, который следует за глицином. Во втором выравнивании тому же валину на 190 позиции последовательности сопоставлен валин на 191 позиции последовательности, который следует за гистидином. Также в третьем выравнивании в первой последовательности тирозину в 114 позиции последовательности соответствует тирозин из второй последовательности. А вот во втором выравнивании тому же тирозину в 108 позиции сопоставлен глицин.
Если же сравнивать просто номера позиций выравнивания, то тут тоже соответствия мало. Например, первые 6 позиций третьего выравнивания никак не связаны с текми же позициями первых двух выравниваний. Видимо, программа просто выбросила их в первых двух выравниваниях, поскольку ее интересовали локальные сходства, а в этих двух выравниваниях в связи с большими штрафами за гэпы сходство двух аминокислотных остатков не окупало гэпа.
Также встречаются и пропуски, которые в других выравниваниях занимали какие-то аминокислоты. Например, во втором выравнивании на 76 позиции выравнивания лизин сопоставлен лейцину. В первом выравнивании на этой же 76 позиции выравнивания в первой последовательности стоит пропуск, лейцину ничего не сопоставляется.



Задание 6 (Построение карты локального сходства заданных последовательностей с помощью программы dotmatcher пакета EMBOSS
Используя команду "dotmatcher seq.fasta fdnh_ecoli.fastа dotmatcher.ps", получаем файл с картой локального сходства тех же последовательностей тех же белков.





Файл лежит тут