Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~anuta_al/Practice_9.html
Дата изменения: Wed Jan 20 04:36:23 2010 Дата индексирования: Tue Oct 2 03:31:56 2012 Кодировка: Windows-1251 |
Запустим программу getorf так, чтобы получить
набор трансляций всех открытых рамок данной последовательности
длиной более 30
нуклеотидов, считая открытой рамкой последовательность триплетов,
начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном,
при использовании бактериального кода.
Командную строку: getorf -minsize 31 -table 11 -find 1
В результате был получен файл: D89965.orf
Из найденных открытых рамок соответствует приведенной в записи CDS (163-435) следующая рамка:
>D89965_5 [19 - 432] Rattus norvegicus mRNA for RSS, complete cds. MVFWLHHVTVTGDDKRCSFIRDCQQCFKFAQHAIGTPVFCQLNGGFDQMALMHFQFTFKQ FEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHMAVTAYAYYSCHE LTPWLRIQSTNPVQKYGA
>dbj|D89965.1| Geo Rattus norvegicus mRNA for RSS, complete cds Length=448 Score = 289 bits (739), Expect = 2e-76, Method: Compositional matrix adjust. Identities = 137/138 (99%), Positives = 138/138 (100%), Gaps = 0/138 (0%) Frame = +1 Query 1 MVFWLHHVTVTGDDKRCSFIRDCQQCFKFAQHAIGTPVFCQLNGGFDQMALMHFQFTFKQ 60 +VFWLHHVTVTGDDKRCSFIRDCQQCFKFAQHAIGTPVFCQLNGGFDQMALMHFQFTFKQ Sbjct 19 IVFWLHHVTVTGDDKRCSFIRDCQQCFKFAQHAIGTPVFCQLNGGFDQMALMHFQFTFKQ 198 Query 61 FEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHMAVTAYAYYSCHE 120 FEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHMAVTAYAYYSCHE Sbjct 199 FEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHMAVTAYAYYSCHE 378 Query 121 LTPWLRIQSTNPVQKYGA 138 LTPWLRIQSTNPVQKYGA Sbjct 379 LTPWLRIQSTNPVQKYGA 432
>sp|P0A7B8.2|HSLV_ECOLI RecName: Full=ATP-dependent protease hslV; AltName: Full=Heat shock protein hslV Score = 253 bits (647), Expect = 2e-67, Method: Compositional matrix adjust. Identities = 125/125 (100%), Positives = 125/125 (100%), Gaps = 0/125 (0%) Query 1 MTTIVSVRRNGHVVIAGDGQATLGNTVMKGNVKKVRRLYNDKVIAGFAGGTADAFTLFEL 60 MTTIVSVRRNGHVVIAGDGQATLGNTVMKGNVKKVRRLYNDKVIAGFAGGTADAFTLFEL Sbjct 1 MTTIVSVRRNGHVVIAGDGQATLGNTVMKGNVKKVRRLYNDKVIAGFAGGTADAFTLFEL 60 Query 61 FERKLEMHQGHLVKAAVELAKDWRTDRMLRKLEALLAVADETASLIITGNGDVVQPENDL 120 FERKLEMHQGHLVKAAVELAKDWRTDRMLRKLEALLAVADETASLIITGNGDVVQPENDL Sbjct 61 FERKLEMHQGHLVKAAVELAKDWRTDRMLRKLEALLAVADETASLIITGNGDVVQPENDL 120 Query 121 IAIGS 125 IAIGS Sbjct 121 IAIGS 125
>AE006104 Pasteurella multocida subsp. multocida str. Pm70 section 71 of 204 of the complete genome. Length = 10192 Score = 42.1 bits (21), Expect = 3e-05 Identities = 21/21 (100%) Strand = Plus / Minus Query: 8 tagctcagttggttagagcac 28 ||||||||||||||||||||| Sbjct: 8747 tagctcagttggttagagcac 8727 |
#======================================= # # Aligned_sequences: 2 # 1: AE006104 # 2: valV # Matrix: EDNAFULL # Gap_penalty: 10.0 # Extend_penalty: 0.5 # # Length: 77 # Identity: 21/77 (27.3%) # Similarity: 21/77 (27.3%) # Gaps: 56/77 (72.7%) # Score: 105.0 # # #======================================= AE006104 1 -------tagctcagttggttagagcac---------------------- 21 ||||||||||||||||||||| valV 1 gcgttcatagctcagttggttagagcaccaccttgacatggtgggggtcg 50 AE006104 21 --------------------------- 21 valV 51 ttggttcgagtccaattgaacgcacca 77 #--------------------------------------- #--------------------------------------- |