Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.fbb.msu.ru/FBB/year_09/term2/task10_10.html
Дата изменения: Fri Apr 16 12:51:47 2010
Дата индексирования: Tue Oct 2 10:35:57 2012
Кодировка: Windows-1251
Task 10 (patterns), 2010

Самый простой способ создать отчет в формате HTML — это скопировать страничку задания, а затем ее отредактировать!

Занятие 10. Паттерны и банк Prosite

Ваша рабочая директория — H:\Term2\Practice10, в ней храните все рабочие файлы.
Формат отчета — HTML-страничка со ссылкой со страницы второго семестра (подробнее см. внизу этой страницы).
Срок — утро дня следующего занятия.

Упражнение 1. Создать паттерны по множественному выравниванию и провести поиск по паттернам в банке данных Swiss-Prot

Рассмотрите в GeneDoc множественное выравнивание, полученное при выполнении упражнения 2 прошлого занятия (то есть выравнивание вашего белка и его родственников). Выберите фрагмент выравнивания длиной 8–20 а.о. для дальнейшего исследования. Желательно, чтобы от трети до половины колонок фрагмента были консервативны на 70–100%, будет поучительно, если попадется пропуск ближе к одному из концов фрагмента.

Картинку с изображением выбранного фрагмента выравнивания прикрепите к отчету (см. указания).

Рассмотрите выбранный фрагмент множественного выравнивания. Создайте 3 паттерна, запишите их в таблицу, см. ниже.

  1. Первый паттерн в точности является фрагментом последовательности вашего белка (то есть только одной из последовательностей выравнивания).
  2. Второй ("сильный") паттерн надо постараться построить так, чтобы он распознавал все белки вашей выборки, и только их (другой вопрос, что паттерн будет находить в действительности:).
  3. Третий ("слабый") паттерн надо создать на основе второго, сделав требования к последовательности более мягкими. Стремиться надо к тому, чтобы паттерн находил всех близких родственников вашего белка и не находил неродственные белки.
    Мы не ждем от вас, что эта цель будет достигнута! Разве что повезет. Тем не менее усилия в данном направлении будут оцениваться.
В этом упражнении надо показать умение использовать основные элемента синтаксиса паттернов:
[ALK] — в данной позиции разрешены только те остатки, которые перечислены в квадратных скобках;
x(3) — интервал в 3 любых остатка;
возможный вариант: x(2,5) — интервал от двух до пяти любых остатков.

Подробнее о правилах написания патернов см. Pattern syntax rules. Как "усилить" или "ослабить" паттерн см. в подсказке.

Проведите поиск последовательностей банка Swiss-Prot, включающих мотивы, соответствующие каждому из полученных паттернов, см. подсказку.

По результатам упражнения заполните табличку следующего вида:

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности      
Сильный      
Слабый      

 

Упражнение 2. Найти и описать все мотивы в Вашем белке (по данным БД PROSITE)

Найдите в последовательности вашего белка все мотивы, описанные в PROSITE, в том числе неспецифичные (часто встречающиеся). По результатам поиска составьте следующую таблицу.

Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
Например,
PS00008 MYRISTYL Сайт N-миристоилирования паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 12
             
             

 


Формат отчета

Формат — HTML-страничка, названная "Паттерны и профили".
  1. Заголовок "Создание паттернов аминокислотных последовательностей"
    • Ссылка на картинку, полученную из GeneDoc и изображающую выбранный фрагмент выравнивания, по которому строились паттерны. Названия последовательностей должны представлять собой ID белков!
    • Таблица к упр. 1 (таблица должна иметь заголовок)
    • Краткий комментарий к таблице, в котором объясняется, что и зачем делалось, а также описаны возможные наблюдения. Например, указано, нашлись ли последовательности с названием, явно отличающимся от названия Вашего белка; если да, то с каким? Любые другие интересные наблюдения (в частности, сравнение с выдачей программмы BLAST) будут оценены по достоинству.
  2. Заголовок "Все описанные в PROSITE мотивы в заданном белке XXXX_BACSU"
    • Таблица к упр. 2