Я запустил программу getorf на последовательности из записи
D89965 банка EMBL так, чтобы получить набор трансляций всех открытых
рамок данной последовательности длиной более 30 нуклеотидов, считая открытой
рамкой последовательность триплетов, начинающуюся со старт-кодона и
заканчивающуюся стоп-кодоном, при использовании бактериального кода.
Для этого я использовал команду:
getorf -table 11 -minsize 31 -find 1После этого программа предложила ввезти имена входного и выходного файлов.
В результате был получен файл d89965.orf c рамками. С помощью программ BLAST я обнаружил, что записи в банке EMBL соответсвует рамка ?5, а записи в Swiss-Prot, на которую ссылается данная запись банка EMBL, соответсвует рамка ?13.
Поиск некодирующих последовательностей
С помощью программ blastn и megablast был выполнен поиск гомологов для всех тРНК из
E.coli в геноме бактерии Salmonella typhimurium.
Команды для программы megablast:
megablast -d st -i trna_ecoli.fasta -o trna_ecoli.mblast -m 8 megablast -d st -i trna_ecoli.fasta -o trna_ecoli.mblast -m 8 -N 0 -W 11 -t 16
Анализ результатов
Среди всех пар находок в предыдущих упражнениях я выбрал одну из тех, которые находились программой blastn, но не находились программой megablast. В описании программы megablast написано, что она оптимизирована для выравнивания последовательностей, отличающихся незначительно, например из-за ошибок в секвенировании и других похожих. Вероятно, по этой причине эта программа находит меньше последовательностей, чем программа blastn.
Я вырезал участок последовательности тРНК-ileV E.coli и гомологичный ему участок в бактерии Salmonella typhimurium, поместил их в отдельные файлы и выровнял с помощью программы needle.
Характеристики выравнивания:
# Length: 29 # Identity: 27/29 (93.1%) # Similarity: 27/29 (93.1%) # Gaps: 0/29 ( 0.0%) # Score: 127.0В банке EMBL этот участок в ДНК бактерии Salmonella typhimurium проаннотирован как тРНК для треонина.
FT gene complement(16948..17020) FT /gene="thrV" FT /note="synonym: STM3394" FT tRNA complement(16948..17020) FT /gene="thrV" FT /product="tRNA-Thr"Такое сходство говорит о том, что эта последовательность консервативна, и, похоже, важна для построения различных тРНК.