Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~v.romashchenko/Term_3/practice9.html
Дата изменения: Tue Dec 15 19:04:04 2009
Дата индексирования: Tue Oct 2 14:56:29 2012
Кодировка: Windows-1251

Поисковые слова: m 8
Romashchenko Valeriya

Учебный сайт
Ромащенко Валерии

Программы пакета BLAST (продолжение).

1. Работа с программой getorf пакета EMBOSS.

Набор трансляций всех открытых рамок данной последовательности длиной более 30 нуклеотидов, считая открытой рамкой последовательность триплетов, начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном, при использовании бактериального кода, был полечен с помощью команды:

 getorf -sequence d89965.entret -table 11 -find 1 -minsize 30 d89965.orf 
В записи CDS приведена открытая рамка, соответствующая открытой рамке, а точнее, той ее части, которая выделена жирным.
>D89965_5 [19 - 432] Rattus norvegicus mRNA for RSS, complete cds.
MVFWLHHVTVTGDDKRCSFIRDCQQCFKFAQHAIGTPVFCQLNGGFDQMALMHFQFTFKQ
FEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHMAVTAYAYYSCHE
LTPWLRIQSTNPVQKYGA

Записи SwissProt P0A7B8 соответствует открытая рамка считывания -

>D89965_13 [375 - 1] (REVERSE SENSE) Rattus norvegicus mRNA for RSS, complete cds.
MTTIVSVRRNGHVVIAGDGQATLGNTVMKGNVKKVRRLYNDKVIAGFAGGTADAFTLFEL
FERKLEMHQGHLVKAAVELAKDWRTDRMLRKLEALLAVADETASLIITGNGDVVQPENDL
IAIGS

2. Поиск некодирующих последовательностей программой BLASTN.

C помощью команды :
                 blastall -p blastn -i trna_ecoli.fasta -d st -o trna_bn -m 8
             
был получен файл содержащий возможные кодирующие последовательности в геноме Salmonella typhimurium.
Команда
                  grep -с ' ileV' trna_bn
               
сообщила мне о том, что таких последовательностей найдено 8 штук.
Далее, использовава комаду grep , я извлекла название всех найденных последовательностей в файл trna.txt, а потом импортировала информацию в Excel. Таким образом, у меня получился файл trna.xls, в котором представлено так же количество находок для каждой из последовательностей. Это было найдено спомощью специального скрипта .
В данном Excel файле дана информация о количестве находок с помощью программы blastn с E-value, равным 0.001. Соответствуящая команда:
               blastall -p blastn -i trna_ecoli.fasta -d st -o trna_bln -e 0.001 -m 8 
           

3. Поиск некодирующих последовательностей программой megablast.

Для поиска некодирующих последовательностей с использованием megablast была сформулирована команда:
               megablast -i trna_ecoli.fasta -d st -o trna_mega -m 8 
            
В упомянутом выше файле trna.xls так же было подсчитано количесво находок с помощью данного скрипта .
При использовании разавного megablast была задана команда :
               megablast -i trna_ecoli.fasta -d st -o trna_dismega -m 8 -t 16 -W 11 -N 1 
            
Количество находок представлено в отчетном Excel файле. Оно получено с помощью данного скрипта .

4. Анализ результатов

Для выравнивания я выбрала последовательность hisR и ей гомологичную AE008893 . Полученное с помощью программы needle выравнивание имеет такой вид:

              Aligned_sequences: 2         
              1: AE008893                  
              2: hisR                      
              Matrix: EDNAFULL             
              Gap_penalty: 10.0            
              Extend_penalty: 0.5          
                                           
              Length: 77                   
              Identity:      20/77 (26.0%) 
              Similarity:    20/77 (26.0%) 
              Gaps:          57/77 (74.0%) 
              Score: 100.0                 
             
             
              AE008893           1 ------tatagctcagttggtagagc------------------------     20      
                                         ||||||||||||||||||||                                  
              hisR               1 ggtggctatagctcagttggtagagccctggattgtgattccagttgtcg     50
                                                                                            
              AE008893          20 ---------------------------     20                       
                                                                                            
              hisR              51 tgggttcgaatcccattagccacccca     77                       
          
          
              FT   gene            4154730..4154805       
              FT                   /gene="hisR"           
              FT                   /locus_tag="STM14_4730"
              FT   tRNA            4154730..4154805       
              FT                   /gene="hisR"           
              FT                   /locus_tag="STM14_4730"
              FT                   /product="tRNA-His"    
          
Программа megablast настроена на посик последовательностей, только немного отличающихся друг от друга. Для megablast выравнивание, которое нашел blastn c e-value 3e-04, кажется плохим, и поэтому он его не находит.


© Ромащенко 2008