Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~marine/blast2.html
Дата изменения: Tue Dec 29 11:29:57 2009
Дата индексирования: Mon Oct 1 23:53:10 2012
Кодировка: Windows-1251
Aznauryan's page

Продолжение 


  1.  Работа с программой getorf пакета EMBOSS

    С помощью программы getorf нужно получить набор трансляций всех открытых рамок последовательности D89965 длинной более 30 нуклеотидов, считая открытой рамкой последовательность триплетов, начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном, при использовании бактериального кода. Командная строка:
    getorf -minsize 30 -find 1 -table 11
    В результате получаем файл D89965.orf
    Анализируя результат, получаем, что 5 открытая рамка соответствует CDS, рамка соответствующая записи Swiss-Prot, на которую ссылается данная запись EMBL: 13-ая.
  2.  Поиск некодирующих последовательностей программой BLASTN

    Имеем последовательности всех тРНК, проаннотированных в полном геноме E.coli K12. Задача - определить, сколько гомологов каждой из тРНК находит программа BLASTN в геноме родственной бактерии Pasteurella multocida.

    Для этого:

    • запустим программу blastn, указав в качестве последовательностей для поиска файл trna_ecoli.fasta, в качестве банка - отформатированный при выполнении задания 8 геном бактерии Pasteurella multocida. В результате получим файл trna.out.
    • создадим колонку из названий входных последовательностей командой
      grep ">" trna_ecoli.fasta
    • создадим скрипт из команд, выдающих число находок для каждой последовательности (trna_linux.scr).
      В результате был получен файл (word.txt), содержащий количество находок.
      Таким же способом напишем второй скрипт (trna2_linux.scr) и получим его результат (word2.txt).
      Сравним результаты: (results.xls).
  3.  Поиск некодирующих последовательностей программой megablast

    Проделаем ту же процедуру, что и в предыдущем задании, но вместо blastn используем прогамму megablast:

    "megablast -d pm -i trna_ecoli.fasta -o megablast_trna.out -m 9"

    В результате получим файл megablast_trna.out.
    Теперь воспользуемся программой "discontigous" megablast:

    "megablast -d pm -i trna_ecoli.fasta -o megablast_trna.out -m 9 -D 2 -t 18 -W 11 -N 1"

    -D - тип выдачи;
    -t - длина последовательности с учетом разрывов;
    -W - длина слова;
    -N - тип последовательности.
    В итоге получен выходной файл megablast_trna2.out.
    Результатом является файл results2.xls.
  4.   Анализ результатов

    Рассмотрим последовательность leuV из tRNA E.coli. Как видно из результатов предыдущих заданий, программа BLASTN находит эту последовательность, а MEGABLAST - нет. Это произошло из-за того, что megablast, в отличие от blastn, ищет последовательности большей длины.
    Сравним эту последовательность с гомологичной из родственной бактерии Pasteurella multocida ( AE006055).
    Построим выравнивание этих двух последовыательностей программой needle ( здесь):

                      Length = 10811                   
                                                               
                     Score = 44.1 bits (22), Expect = 9e-06    
                     Identities = 56/66 (84%), Gaps = 1/66 (1%)
                     Strand = Plus / Plus                      
    
    
    
                     leuV               1 gcgaaggtggcggaattggtagacgcgctagcttcaggtgttagtgtcct     50
                                               |||||.|||||||||||||.|||||.|||.|||.|.||||||||.
                     AE006055           1 -----ggtggtggaattggtagacacgctatcttgagggggtagtgtcca     45
    
                     leuV              51 tacggacgtgggggttcaagtcccccccctcgcacca     87
                                          | ||||||||.|.||||||||                
                     AE006055          46 t-cggacgtgcgagttcaagt----------------     65
    
                    
    А здесь представлено выравнивание, сделанное программой BLASTN:

                    leuV:      6    ggtggcggaattggtagacgcgctagcttcaggtgttagtgtccttacggacgtgggggt 65     
                                    ||||| ||||||||||||| ||||| ||| ||| | |||||||| | |||||||| | ||        
                    AE006055:  3824 ggtggtggaattggtagacacgctatcttgagggggtagtgtccat-cggacgtgcgagt 3882   
                                                                                    
                                                                                    
                    leuV:     66   tcaagt 71                                                           
                                   ||||||                                                              
                    AE006055: 3883 tcaagt 3888                                                         
                    
    Запись этого фрагмента в EMBL: AE004439, координаты: 234402.....234466.
    Данный франмент в записи EMBL не проаннотирован.


© Азнаурян 2008 marina-91@list.ru