- Работа с программой getorf пакета EMBOSS
С помощью программы getorf нужно получить набор трансляций всех открытых
рамок последовательности D89965 длинной более 30 нуклеотидов, считая
открытой рамкой последовательность триплетов, начинающуюся со старт-кодона
и заканчивающуюся стоп-кодоном, при использовании бактериального кода.
Командная строка:
getorf -minsize 30 -find 1 -table 11
В результате получаем файл D89965.orf
Анализируя результат, получаем, что 5 открытая рамка соответствует CDS,
рамка соответствующая записи Swiss-Prot, на которую ссылается данная
запись EMBL: 13-ая.
- Поиск некодирующих последовательностей программой BLASTN
Имеем последовательности всех тРНК, проаннотированных в полном геноме
E.coli K12. Задача - определить, сколько гомологов каждой из тРНК находит
программа BLASTN в геноме родственной бактерии Pasteurella multocida.
Для этого:
- Поиск некодирующих последовательностей программой megablast
Проделаем ту же процедуру, что и в предыдущем задании, но вместо blastn используем прогамму
megablast:
"megablast -d pm -i trna_ecoli.fasta -o megablast_trna.out -m 9"
В результате получим файл megablast_trna.out.
Теперь воспользуемся программой "discontigous" megablast:
"megablast -d pm -i trna_ecoli.fasta -o megablast_trna.out -m 9 -D 2 -t 18 -W 11 -N 1"
-D - тип выдачи;
-t - длина последовательности с учетом разрывов;
-W - длина слова;
-N - тип последовательности.
В итоге получен выходной файл megablast_trna2.out.
Результатом является файл results2.xls.
- Анализ результатов
Рассмотрим последовательность leuV из tRNA E.coli. Как видно из результатов предыдущих заданий,
программа BLASTN находит эту последовательность, а MEGABLAST - нет.
Это произошло из-за того, что megablast, в отличие от blastn, ищет последовательности большей длины.
Сравним эту последовательность с гомологичной из родственной бактерии
Pasteurella multocida ( AE006055).
Построим выравнивание этих двух последовыательностей программой needle ( здесь):
Length = 10811
Score = 44.1 bits (22), Expect = 9e-06
Identities = 56/66 (84%), Gaps = 1/66 (1%)
Strand = Plus / Plus
leuV 1 gcgaaggtggcggaattggtagacgcgctagcttcaggtgttagtgtcct 50
|||||.|||||||||||||.|||||.|||.|||.|.||||||||.
AE006055 1 -----ggtggtggaattggtagacacgctatcttgagggggtagtgtcca 45
leuV 51 tacggacgtgggggttcaagtcccccccctcgcacca 87
| ||||||||.|.||||||||
AE006055 46 t-cggacgtgcgagttcaagt---------------- 65
А здесь представлено выравнивание, сделанное программой BLASTN:
leuV: 6 ggtggcggaattggtagacgcgctagcttcaggtgttagtgtccttacggacgtgggggt 65
||||| ||||||||||||| ||||| ||| ||| | |||||||| | |||||||| | ||
AE006055: 3824 ggtggtggaattggtagacacgctatcttgagggggtagtgtccat-cggacgtgcgagt 3882
leuV: 66 tcaagt 71
||||||
AE006055: 3883 tcaagt 3888
Запись этого фрагмента в EMBL: AE004439, координаты: 234402.....234466.
Данный франмент в записи EMBL не проаннотирован.
© Азнаурян 2008
marina-91@list.ru