Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~solveig/Practice1/Protocol.html
Дата изменения: Wed Oct 10 20:24:48 2007
Дата индексирования: Tue Oct 2 13:18:18 2012
Кодировка: Windows-1251

Вариант 2

[На главную][Третий семестр]

Задание:

Получить заданный нам фрагмент генома Yersinia intermedia с помощью программы seqret. Определите, есть ли в этом фрагменте гены, похожие на гены бактерии-прототипа Escherichia coli K-12 .

*      Обоснование выбора программы и типа данных, по которым будет вестись поиск:

Нам необходимо выяснить, кодирует ли определенный фрагмент прокариотного генома, какой-нибудь белок из прототипного организма. Исследуемым организмом соответственно является Yersinia intermedia , а прототипным -Escherichia coli. Далее следует выбрать последовательности какого типа (аминокислотные или нуклеотидные), мы будем сравнивать.

Выполнение предыдущих практикумов позволяет нам судить о том, что сравнение аминокислотных последовательностей все же удобней, так как с нуклеотидными возникает масса трудностей, связанных с проблемой вырожденности генетического кода, большей длиной нуклеотидных последовательностей по сравнению с белковыми и т.д. Как уже было указанно в Практикуме3 нуклеотидное выравнивание можно эффективно использовать лишь при поиске очень близких или одинаковых последовательностей.

Соответственно, далее нам следовало сделать выбор между программами пакета BLAST, работающими с аминокислотными последовательностями. Их как мы знаем 3. Но подходит нам только программа BLASTP, так как две остальные транслируют последовательности в шести рамках, но в нашем случае это излишне, т.к. мы сразу работаем с открытыми рамками считывания. Это определенные участки последовательности, начинающиеся со старт- и оканчивающиеся стоп-кодоном, внутри которых других стоп-кодонов нет. Все имеющиеся на нашем участке открытые рамки были предоставлены командой getorf (см. ниже).

*      Как был получен отчетный скрипт:

 

*      Извлечение полного протеома Escherichia coli K-12 в виде файла в fasta-формате для создания базы поиска.

seqret sw:*_ECOLI -auto
 
(результат ecoli.fasta)

*      Создание индексных файлов для поиска по аминокислотным последовательностям полученного протеома.

formatdb -p T -n ec -i ecoli.fasta ( где T - аминокислотная последовательность)
 

(результат ec.phr; ec.psq ; ec.pin)

*      Получение заданного фрагмента последовательности генома Yersinia intermedia :

seqret AALF01000001.embl -sask (где в качестве ответа на вопросы вставили предложенные нам данные c 133001 до 140001 (7000))

 

(результат yer1.fasta)

 
 

*      Получение открытых рамок изучаемого фрагмента. Использована программа getorf из пакета EMBOSS. Были изучены такие параметры программы, как find, table и minsize, и им были присвоены следующие значения:

getorf -minsize 240 -table 11 -find 1

(результат здесь)

*      Далее был создан список ORF-ов исследуемого фрагмента:

grep '>' yer1.orf > yerorfs.txt

(результат здесь)

Полученный документ импортировали в Excel.

*      Создание скрипта, позволяющего подсчитать количество находок, сделанных BLASTP в протеоме E.coli для каждой исследуемой ORF. Отдельная команда скрипта выглядит так:

seqret yer1.orf:AALF01000001_х stdout |blastall -p blastp -d ec -e 0.001 | grep -c '>' > oli.txt (где х - число от 1 до 16, а символ '>' в последующих строчках скрипта заменен на '>>', так как нужно новые данные нужно было дописать в уже существующий файл)

(Скрипт и файл с результатом его работы)

*      Как видно, результатом работы скрипта стали 6 найденных сходных последовательностей. Далее присвоим генам их имена (имена соответствующих генов в Е.coli) , для этого создадим еще один скрипт и воспользуемся возможностями SRS. Результатами работы стали следующие 6 фаилов:

1.      blastp2.txt

2.      blastp3.txt

3.      blastp4.txt

4.      blastp5.txt

5.      blastp7.txt

6.      blastp10.txt

 

*      Описание взаимного расположения предполагаемых генов (т.е., открытых рамок, для которых нашелся сходный участок генома/протеома E. coli) в заданном фрагменте.

Гипотетические гены во фрагменте 1-7000

 

3'----[<= ген dbpA 2-1576]---[<= ген yebG 1686-2003]---[<=ген yqfB 2028-2351]---[<=ген yebF 2432-2812]---- [<=ген ptrB 3038-5101]---- 5'

5'----------------------------------------------------------------------------------------------------------------------------------------------------------------[=>ген exoX 5817-5122]-3'

*   Далее следует вспомнить что на самом деле, предложенный нам для изучения фрагмент имел координаты с 133001 до 140001 и следовательно в описание взаимного расположения предполагаемых генов следует ввести пересчитанные координаты:

3'----[<= ген dbpA 133003-134577]---[<= ген yebG 134687-135004]---[<=ген yqfB 135029-135352]---[<=ген yebF 135433-135813]---- [<=ген ptrB 136039-138102]----5'

5'-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------[=>ген exoX 138818-138123]-3'

 

 

 

Cопоставим вышеприведенную схему со схемой взаимного расположения сходных аннотированных генов E. Coli:

 

3'----[<= ген dbpA 1411225..1412598]--[<=ген exoX 1927834..1928496]-------------------------------------------------------------------------------------------------------------------------------------5'

5'-----------------------------------------------[=>ген ptrB 1928493..1930553]- [=>ген yebF 1931748..1932116 ]--- [=> ген yebG 1932171..1932461]--[=>ген yqfB3041968..3042279]-3'

 

Как видно у этих схем есть несколько общих моментов, во-первых в начале обоих схем на прямой цепи стоит ген dbpA.

Расстояния между генами в Yersinia intermedia, в целом, не очень значительно отличаются от расстояний в Escherichia coli K-12. Видно, что, как в первом, так и втором случаях, гены yebF и yebG распологаются на одной цепи и достаточно близко, а у E.coli даже входят в один оперон. Ген ptrB в обоих случаях расположена между генами exoX и yebF, и вообще последовательности генов расположенных после гена dbpA на обоих схемах выглядят отраженными относительно друг друга, если не считать перестановки генов yqfB и yebG на схеме Yersinia intermedia. Но как известно, для прокариот, такие случаи перестановок возможны. Поэтому можно считать результаты проведенной работы удовлетворительными.

 

 


Спивак Ольга