Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.fbb.msu.ru/FBB/year_09/term4/task11.html
Дата изменения: Fri May 13 01:36:39 2011 Дата индексирования: Tue Oct 2 08:23:52 2012 Кодировка: Windows-1251 |
Создайте файл, содержащий тот участок выравнивания рибосомальных белков
из выбранного вами таксона, по которому вы строили паттерн
(для этого надо удалить из выравнивания часть колонок и
контрольные последовательности, после чего сохранить полученное
частичное выравнивание в файл с новым именем).
Запустите на kodomo программу profit и в ответ на вопрос о файле
с профилем укажите имя файла, созданного программой prophecy,
а на вопрос о входных последовательностях - имя файла с
бактериальными белками.
Далее будем работать со всеми находками, если их менее 10000. Если же получилось, что их больше, то в дальнейшей работе следует ограничиться лишь находками со счетом более 40 (если вдруг и их больше 10000, то поднимите порог еще выше).
Грубо говоря, чем выше расположена эта кривая, тем лучше наш профиль. См. также http://en.wikipedia.org/wiki/ROC_curve, там описан немного другой вариант ROC-кривой, который в нашем случае менее удобен.
Сам график имеет смысл строить в Excel, данные можно готовить как в Excel, так и написав подходящий скрипт.