|
Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~anuta_al/Practice_9.html
Дата изменения: Wed Jan 20 04:36:23 2010 Дата индексирования: Tue Oct 2 03:31:56 2012 Кодировка: Windows-1251 |
Запустим программу getorf так, чтобы получить
набор трансляций всех открытых рамок данной последовательности
длиной более 30
нуклеотидов, считая открытой рамкой последовательность триплетов,
начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном,
при использовании бактериального кода.
Командную строку: getorf -minsize 31 -table 11 -find 1
В результате был получен файл: D89965.orf
Из найденных открытых рамок соответствует приведенной в записи CDS (163-435) следующая рамка:
>D89965_5 [19 - 432] Rattus norvegicus mRNA for RSS, complete cds. MVFWLHHVTVTGDDKRCSFIRDCQQCFKFAQHAIGTPVFCQLNGGFDQMALMHFQFTFKQ FEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHMAVTAYAYYSCHE LTPWLRIQSTNPVQKYGA
>dbj|D89965.1| Geo Rattus norvegicus mRNA for RSS, complete cds
Length=448
Score = 289 bits (739), Expect = 2e-76, Method: Compositional matrix adjust.
Identities = 137/138 (99%), Positives = 138/138 (100%), Gaps = 0/138 (0%)
Frame = +1
Query 1 MVFWLHHVTVTGDDKRCSFIRDCQQCFKFAQHAIGTPVFCQLNGGFDQMALMHFQFTFKQ 60
+VFWLHHVTVTGDDKRCSFIRDCQQCFKFAQHAIGTPVFCQLNGGFDQMALMHFQFTFKQ
Sbjct 19 IVFWLHHVTVTGDDKRCSFIRDCQQCFKFAQHAIGTPVFCQLNGGFDQMALMHFQFTFKQ 198
Query 61 FEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHMAVTAYAYYSCHE 120
FEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHMAVTAYAYYSCHE
Sbjct 199 FEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHMAVTAYAYYSCHE 378
Query 121 LTPWLRIQSTNPVQKYGA 138
LTPWLRIQSTNPVQKYGA
Sbjct 379 LTPWLRIQSTNPVQKYGA 432
>sp|P0A7B8.2|HSLV_ECOLI RecName: Full=ATP-dependent protease hslV; AltName: Full=Heat
shock protein hslV
Score = 253 bits (647), Expect = 2e-67, Method: Compositional matrix adjust.
Identities = 125/125 (100%), Positives = 125/125 (100%), Gaps = 0/125 (0%)
Query 1 MTTIVSVRRNGHVVIAGDGQATLGNTVMKGNVKKVRRLYNDKVIAGFAGGTADAFTLFEL 60
MTTIVSVRRNGHVVIAGDGQATLGNTVMKGNVKKVRRLYNDKVIAGFAGGTADAFTLFEL
Sbjct 1 MTTIVSVRRNGHVVIAGDGQATLGNTVMKGNVKKVRRLYNDKVIAGFAGGTADAFTLFEL 60
Query 61 FERKLEMHQGHLVKAAVELAKDWRTDRMLRKLEALLAVADETASLIITGNGDVVQPENDL 120
FERKLEMHQGHLVKAAVELAKDWRTDRMLRKLEALLAVADETASLIITGNGDVVQPENDL
Sbjct 61 FERKLEMHQGHLVKAAVELAKDWRTDRMLRKLEALLAVADETASLIITGNGDVVQPENDL 120
Query 121 IAIGS 125
IAIGS
Sbjct 121 IAIGS 125
>AE006104 Pasteurella multocida subsp. multocida str. Pm70 section 71
of 204 of the complete genome.
Length = 10192
Score = 42.1 bits (21), Expect = 3e-05
Identities = 21/21 (100%)
Strand = Plus / Minus
Query: 8 tagctcagttggttagagcac 28
|||||||||||||||||||||
Sbjct: 8747 tagctcagttggttagagcac 8727
|
#=======================================
#
# Aligned_sequences: 2
# 1: AE006104
# 2: valV
# Matrix: EDNAFULL
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 77
# Identity: 21/77 (27.3%)
# Similarity: 21/77 (27.3%)
# Gaps: 56/77 (72.7%)
# Score: 105.0
#
#
#=======================================
AE006104 1 -------tagctcagttggttagagcac---------------------- 21
|||||||||||||||||||||
valV 1 gcgttcatagctcagttggttagagcaccaccttgacatggtgggggtcg 50
AE006104 21 --------------------------- 21
valV 51 ttggttcgagtccaattgaacgcacca 77
#---------------------------------------
#---------------------------------------
|