Подсказки к занятию 10 "Паттерны и профили"
- Как с помощью GeneDoc получить картинку с изображением выбранного
фрагмента выравнивания
GeneDoc позволяет сохранить в виде картинки только целый блок
выравнивания (блоком в GeneDoc называется один из кусков,
на которые разбивается выравнивания, чтобы оно помещалось по ширине в окне).
Ширину блоков можно регулировать либо изменением ширины окна программы,
либо выбрав в меню Project → Configure (<Ctrl+G>) "Fixed"
в разделе "Seq Block Sizing".
Подберите ширину блока так, чтобы выбранный фрагмент был примерно в середине
какого-нибудь блока. Пометьте как-нибудь границы выбранного фрагмента.
Например, можно
выбрать в меню Shade "Manual shade mode", затем нажать на "Back" или
"Text" и выбрать какой-нибудь яркий цвет, после чего, щелкая
по буквам на границе фрагмента, вы будете их перекрашивать соответствующим образом.
Можно также вписать звездочки или другие символы в строку консенсуса
(ниже выравнивания) или в строку нумерации (выше выравнивания), отметив таким
образом колонки, не входящие (или, наоборот, входящие) во фрагмент.
Желательно все же, чтобы нумерация фрагмента при этом не пропала. Чтобы
писать в эти строки, достаточно сделать двойной щелчок в нужное место.
Не забудьте указать в отчете, как именно выделен ваш фрагмент!
Чтобы сохранить полученное изображение,
в меню Edit выберите "Select blocks to copy" и
ткните мышкой в нужный блок. Теперь можно взять картинку в буфер
(Edit → "Copy selected blocks to MetaFile"),
выложить картинку из буфера (<Ctrl+V>), например, в программу Paint,
и сохранить в формате JPEG, GIF или PNG. Другой вариант: в меню Edit
выбрать "Copy selected blocks to HTML" и создать HTML-файл (или его фрагмент)
с изображением выравнивания.
- Синтаксис паттерна
См. Pattern syntax rules
на сайте PROSITE.
То же другими словами можно прочитать, выполнив (на kodomo-count)
команду fuzzpro -help.
- Как "усилить" или "ослабить" паттерн? (советы, а не инструкции)
В сильный паттерн имеет смысл включить все позиции выбранного
фрагмента выравнивания, а в каждой позиции
(кроме, разумеется, тех, в которых оказались гэпы)
разрешить все буквы, встретившиеся в этой позиции, и только их.
При создании слабого паттерна можно
пользоваться (одновременно или по отдельности) следующими приемами:
в позициях,
в которых все 5 букв оказались разными, заменить 5 букв в квадратных скобках
буквой X;
сократить паттерн,
убрав по 23 позиции с каждого из концов;
модифицировать паттерн, исходя из ваших знаний
о родстве аминокислот, например, вместо [IL] можно попробовать написать
[ILMV], вместо [NS] [NST] и т.п.
иногда можно вместо, например, [RKYW] написать {AG}
(то есть если Вы видите, что в вашей выборке
все остатки в данной позиции обладают большой боковой цепью,
то вместо перечисления всех встретившихся букв напишите запрет
на маленькие остатки)
если выбранный фрагмент содержит пропуск,
то можно ослабить условия на него, например, вместо x(2,3) написать x(1,5)
и т.п.
- Как искать последовательности по паттерну?
Первый способ (online)
Откройте главную страничку базы данных
PROSITE.
Перейдите по гиперссылке "ScanProsite" (в разделе
"Tools for PROSITE"). На открывшейся странице введите
Ваш паттерн в правое окошко и проверьте, что поиск будет идти по SwissProt.
Ниже в выпадающем меню имеет смысл выбрать в качестве формата
выдачи результатов формат "Plain text tabular". Щелкните по кнопке
"START THE SCAN" (слева внизу). Ждите результата.
Второй способ (на машине kodomo-count)
Выполните команду:
fuzzpro -pattern XXXXXX
(вместо XXXXXX вставьте свой паттерн).
Указание: в программе Putty одновременное нажатие
правой и левой кнопок мыши копирует содержимое буфера обмена в командную
строку.
На вопрос "Input sequences" ответьте "sw:*"
(что означает все последовательности банка Swiss-Prot). На вопрос
о допустимом числе несовпадений ("Number of mismatches")
ответьте по умолчанию (т.е., 0), на вопрос о выходном файле - как хотите.
- Как искать в данной последовательности мотивы, описанные
в банке PROSITE?
Откройте главную страничку PROSITE.
Введите в нужное окошко AC, ID или последовательность Вашего белка.
Нажмите кнопку "Quick Scan".
Обращайте внимание на чекбокс "Exclude patterns with a high probability
of occurrence". Если в нем стоит галочка, то будут выданы только
"специфичные" мотивы — те, которые отвечают семействам белков
(один-два, а часто — ни одного).
В противном случае будут выданы также "неспецифичные", часто встречающиеся мотивы
(такие, как возможный сайт N-гликозилирования).
|