Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~kut/term3/MEGABLAST.html
Дата изменения: Wed Oct 4 15:24:36 2006
Дата индексирования: Tue Oct 2 07:59:37 2012
Кодировка: Windows-1251
MEGABLAST

Поиск сходных нуклеотидных последовательной, не кодирующих белки.



Поиск тРНК использованной рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи белка NIKR_ECOLI.


Определил, какой аминокислотный остаток находится в 4-ой позиции моего белка. Это Валин (V). Опредилил соответствующий ему кодон в гене моего белка. При записи кодона в таблицу использовал 'U' и правило 5'>3'. С помощью таблицы стандартного генетического кода определил возможную вырожденную позицию в данном кодоне. Выделил ее подчеркиванием. В поле "Идеальный антикодон" записал последовательность "идеального" (т.е. полностью комплементарного) антикодона, используя 'U' и правило 5'>3'. Подчеркнул вырожденную позицию. Скопировал в рабочую директорию файл с аннотированным геномом E.coli. С помощью команды grep нашел в этой записи строчки, в которых одновременно, но не подряд, встречаются слово codon и valine, перенаправил вывод в файл. Окончательный вариант команды:
grep -n "codon.*valine" ecoli.embl>result.txt

Определил, сколько разных тРНК использует E.coli для данного аминокислотного остатка. Выбрал из них ту тРНК, которая подходит в моем случае(с кодоном GUY и антикодоном GAC) и получил ее последовательность с помощью программы seqret пакета EMBOSS, установленного на kodomo-count, используя команду:
seqret -sask ecoli.embl*
* Программа потребовала номера первого и последнего оснований извлекаемого участка и название выходного файла.

Таблица 1. Выбор т-РНК.

Аминокислотный остаток в 4-ой позиции белка NIKR_ECOLI V
Соответствующий кодон в гене nikR 5'-GUC-3'
Идеальный антикодон 5'-GAC-3'
Сколько можно было бы ожидать разных тРНК для остатка V, если опираться на генетический код? 4
Сколько разных тРНК для остатка V аннотировано в геноме кишечной палочки? 2
Характеристика выбранной для дальнейшего изучения тРНК:
имя гена valW
локализация гена в геноме Локус b1665. 1744540..1744616
распознаваемый кодон 5'-GUY-3'
антикодон 5'-GAC-3'

Результат поиска всех валиновых тРНК у Escherichia coli K-12:

17785:FT                   /note="codons recognized: GUD; anticodon: UAC valine tRNA1;
17809:FT                   /note="codons recognized: GUD; anticodon: UAC valine tRNA1;
39399:FT                   /note="codons recognized: GUY; anticodon: GAC valine
39411:FT                   /note="codons recognized: GUY; anticodon: GAC valine
56939:FT                   /note="codons recognized: GUD; anticodon: UAC valine tRNA1;
56951:FT                   /note="codons recognized: GUD; anticodon: UAC valine tRNA1;
56963:FT                   /note="codons recognized: GUD; anticodon: UAC valine tRNA1;

Поиск гомологичных тРНК в родственном геноме.

Поставленная задача - найти в геноме Bacillus subtilis последовательность, наиболее похожую на последовательность тРНК из E.coli, выбранную в упр. 1. Поиск надо провести с помощью 4-х разных программ для быстрого поиска сходных нуклеотидных последоватльнстей - FASTA, BLASTN, MegaBLAST, discontiguous MegaBLAST.

Создал три индексных файла при помощи команды
formatdb -i bs_genome.fasta -n bs -p F


Таблица 2. Поиск гомологичной т-РНК.

Программа FASTA BLASTN MegaBLAST discontiguous MegaBLAST
Длина якоря 6 нуклеотидов 11 нуклеотидов 28 нуклеотидов 11 или 12 нуклеотидов
Результаты поиска Приведено 4 выравнивания
fresult.txt
Приведено 23 выравнивания
bnresult.txt
Нет результатов
mbresult.txt
Приведено 6 выравниваний
dmbresult.txt
Число находок с E-value < 0,01 1 7 Нет результатов 2
Характеристика лучшей находки:
      E-value 4.4*10-14 10-5
(2 выравнивания с таким значением)
Нет результатов 2*10-4
(2 выравнивания с таким значением)
      длина выравнивания 77 нуклеотидов 22 нуклеотида
(у обоих выравниваний)
Нет результатов 54 нуклеотида
(у обоих выравниваний)
      вес выравнивания 65.1 44.1
(у обоих выравниваний)
Нет результатов 40.1
(у обоих выравниваний)
      координаты в геноме 11462-11538 31975-31996 Нет результатов 3172439-3172389
165964-166014
Аннотация лучшей находки по записи EMBL:
      имя гена trnO-Ile 1)trnA-Ile
2)trnO-Ile
Нет результатов 1)Не удалось найти
2)trnI-Gly
      это тРНК? Да Да Нет результатов 1)Нет
2)Да
это тоже валиновая тРНК? Нет Нет Нет результатов Нет

Использованные команды:

Поиск с помощью BLAST:
blastall -p blastn -d bs -i valW.fasta -o bsresult.txt

Поиск с помощью FASTA:
fasta34 valW.fasta bs_genome.fasta 6

Поиск с помощью megaBLAST:
megablast -d bs -i valW.fasta -D 2 -o mbresult.txt

Поиск с помощью discontiguous MegaBLAST:
megablast -d bs -i valW.fasta -D 2 -N 1 -W 11 -t 21 -o dmbresult.txt


Программа megaBLAST дала самый плохой результат, а точнее его отсутсвие. Это связано с тем что она имеет самый длинный якорь - 28 нуклеотидов. А вероятность того что на протяжении 28 нуклеотидов последовательности будут полностью идентичны очень низкая. Программа discontigous MegaBLAST тоже показала неудовлетворитель результаты. Нашла какой-то ген который не кодирует не тРНК. При поиске программой FASTA удалось получить только одну находку с E-value меньше 0.01. Найденный участок - кусочек гена кодирующего тРНК, но не валиновую. Лучший результат показала программа BLASTN, число находок при поиске с ее помошью, имеющих E-value меньше чем 0.01 - целых 7.
Ни одна из программ не нашла в геноме Bacillus subtilis гены, кодирующие валиновую тРНК.



На главную страницу третьего семестра

На главную страницу


©Белошистов Роман