Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~xedin/Term3/credit1.html
Дата изменения: Thu Oct 11 20:09:20 2007 Дата индексирования: Tue Oct 2 08:06:04 2012 Кодировка: Windows-1251 |
Дано: неаннотированный фрагмент генома бактерии Yersinia intermedia (AC EMBL: AALF01000001; координаты последовательности в записи [126001..133000]). Дан также протеом бактерии-прототипа Escherichia coli K-12 .
Задача: определить, кодирует ли заданный фрагмент что-либо, похожее на какой-либо белок из прототипного организма.
Был получен заданный фрагмент генома Yersinia intermedia длины 7000 нуклеотидов с помощью программы seqret. Чтобы определить, есть ли в этом фрагменте гены, похожие на гены бактерии-прототипа Escherichia coli K-12, было проведены следующие операции:
formatdb -i ecoli -p T -n ecoli
getorf -minsize 240 -table 11 -find 1Используется стандартный для бактерий (bacterial) генетический код, открытой рамкой считается последовательность, начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном.
blastall -p blastp -d ecoli -i bac -e 0.001 -o homologs
seqret bac:AALF01000001_1 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_2 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_3 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_4 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_5 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_6 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_7 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_8 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_9 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_10 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_11 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_12 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_13 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_14 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_15 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo; seqret bac:AALF01000001_16 stdout | blastall -p blastp -d ecoli -e 0.001 | grep -c ">" >> kolvo;где bac - файл, содержащий аминокислотные последовательности найденных ORF, AALF01000001_N - их идентификаторы, kolvo - файл, содержащий столбец чисел, каждое из которых равно количеству сходных последовательностей из E.coli для соответствующей ORF.
Гипотетические гены во фрагменте [126001..133000]
5'-[=> yoaE, 14-1087]--------------------------------------------------------------------[=> yoaH, 5398-5652]----------------------3' 3'---------------------[<=sdaA, 1262-2605]-------[<=yeaB, 3208-3783]-[<=pabB, 3841-5223]-----------------------[<=purT, 5746-6921]-5'
где значки => и <= обозначают прямую или комплементарную цепь ДНК соответственно, четырехсимвольный код - название самого сходного гена у E. coli, а координаты - местонахождение границ открытой рамки в данном фрагменте.
Расположение найденных генов у E. coli. на фрагменте [1880001..1950000]
3'-[<= yoaH, 12576-12755]-------------------------------------------------------------------------[<= yoaE, 18053-19609]-------------------------------------5' 5'-----------------------[=> pabB, 12829-14190]-[=> yeaB, 14194-14712]--[=> sdaA, 14956-16320]----------------------------------------[=> purT, 48905-50083]-3'