Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~Loukian/report78'term3.doc
Дата изменения: Thu Nov 17 20:06:00 2005
Дата индексирования: Tue Oct 2 04:14:48 2012
Кодировка: koi8-r

Отчет о результатах выполнения упражнений
занятия 7 и занятия 8

Занятие 7

Упражнение 2.

Посредством программы TBLASTN был проведён поиск ближайшего гомолога
гена белка FMT_ECOLI в геноме Vibrio cholerae:
|AC соответствующей записи EMBL | AE004095 |
|Координаты выравнивания в записи | 13569 - 14510 |
|Координаты соответствующего CDS | 13563..14510 |
|AC соответствующего белка в UniProt | Q9KVU4 |
|E-value этой находки | e-115 |

BLAST предлагает ещё один гомолог с E-value < 0,01:
|AC соответствующей записи EMBL | AE004294 |
|Координаты выравнивания в записи | 10442 - 10684 |
|Координаты соответствующего CDS | 10199..10837 |
|AC соответствующего белка в UniProt | Q9KPY5 |
|E-value этой находки | 1e-06 |

Упражнение 3.

Посредством программы TBLASTN был проведён поиск ближайших гомологов
гена белка FMT_ECOLI в совокупности трёх геномов: Vibrio cholerae,
Pseudomonas aeruginosa, Pasteurella multocida.
E-value находки из предыдущего пункта e-115.
Имеется 9 находок с E-value < 0,01:
embl|AE004095|AE004095 Vibrio cholerae O1 biovar eltor str. N169...
410 e-115
embl|AE006193|AE006193 Pasteurella multocida subsp. multocida st...
383 e-107
embl|AE004441|AE004441 Pseudomonas aeruginosa PAO1, section 2 of... 368
e-102
embl|AE004776|AE004776 Pseudomonas aeruginosa PAO1, section 337 ... 119
1e-27
embl|AE006035|AE006035 Pasteurella multocida subsp. multocida st...
52 2e-07
embl|AE004294|AE004294 Vibrio cholerae O1 biovar eltor str. N169...
48 3e-06
embl|AE004528|AE004528 Pseudomonas aeruginosa PAO1, section 89 o... 46
2e-05
embl|AE004848|AE004848 Pseudomonas aeruginosa PAO1, section 409 ... 43
1e-04
embl|AE004954|AE004954 Pseudomonas aeruginosa PAO1, section 515 ... 37
0.006

Упражнение 4.

Посредством программы BLASTN был проведён поиск ближайших гомологов
гена белка FMT_ECOLI в совокупности трёх геномов: Vibrio cholerae,
Pseudomonas aeruginosa, Pasteurella multocida.
Имеется 2 находки с E-value < 0,01:
embl|AE004095|AE004095 Vibrio cholerae O1 biovar eltor str. N169...
52 3e-06
embl|AE004441|AE004441 Pseudomonas aeruginosa PAO1, section 2 of... 44
6e-04

|AC записи EMBL | AE004095 |
|Координаты выравнивания в записи |(13860-13883) + (14077-14198) +|
| | |
| |+ (14476-14503) (7197-7216) + |
| |(7401-7454) |
|Координаты соответствующего CDS | 13563..14510 |
|AC соответствующего белка в UniProt | Q9KVU4 |
|E-value этой находки | 3e-06 |


Занятие 8

Упражнение 1.

С помощью программы fasta34 был проведён поиск гомологов гена белка
FMT_ECOLI в геноме Vibrio cholerae.
E-value лучшей находки 2.5e-77. Нашёлся тот же самый ген, что и при
поиске программой TBLASTN. Границы выравнивания: 13579 - 14503 (по гену
Vibrio cholerae). Область выравнивания программой fasta34 содержится в
области выравнивания программой TBLASTN. Начало гена fmt E. coli выровнено
одинаково, как TBLASTN, так и fasta34, просто одинаковые аминокислотные
остатки на этом участке кодируются разными триплетами. В выравнивании
TBLASTN можно видеть совпавшие остатки, а в а в выравнивании fasta34 друг
под другом стоят разные кодоны, которые, несмотря на то что кодируют
одинаковые аминокислотные остатки, не отмечены двумя точками. А вот конец
гена fmt E. Сoli выровнен двумя программами немного по-разному: в
выравнивании fasta34 первый выровненный нуклеотидный остаток fmt E. сoli
стоит напротив 13562-го остатка участка генома Vibrio cholerae, а не 13569-
го, как это подразумевается программой TBLASTN; первый остаток Vibrio
cholerae, выровненный с fmt E. сoli - 1379-ый. В общем, выравнивания,
построенные fasta34 и TBLASTN, несколько различаются.

Упражнение 2.

Программа Megablast распознаёт гомологи только, если у них есть участок из
идущих подряд более, чем W остатков. По умолчанию W = 28. Если взять какой-
нибудь участок гена, изменить в нём каждый 28-й остаток и провести поиск
гомологов изменённой последовательности в BLAST-банке, содержащем исходную
последовательность, то исходная последовательность не будет найдена. Да и
вообще вряд ли будет найдена хотя бы одна последовательность, так как в
редких случаях, в генах очень близких организмов или в очень консервативных
генах (например, генах гистонов) остаются абсолютно неизменными такие
длинные участки.

Был взят фрагмент гена AE004095 Vibrio cholerae (13741 - 13860), в нём был
изменён каждый 28-ой остаток.

1 gctcgtgtttcaacacgcgcttgccaaaccttaatgctgttttctgctac 50
|||||||||||||||||||||||||||.||||||||||||||||||||||
1 gctcgtgtttcaacacgcgcttgccaagccttaatgctgttttctgctac 50

51 ttcaaaatggctcatcggccaaggattaaaggcacgaatacagcgctcaa 100
|||||.|||||||||||||||||||||||||||.||||||||||||||||
51 ttcaagatggctcatcggccaaggattaaaggctcgaatacagcgctcaa 100

101 tatgtgtcgctgcatcactc 120
|||||||||||.||||||||
101 tatgtgtcgctccatcactc 120

В BLAST-банке из трех геномов (Vibrio cholerae, Pseudomonas aeruginosa,
Pasteurella multocida) с помощью программы BLAST был проведён поиск
гомологов этой изменённой последовательности. Понятное дело, ничего не
нашлось.

Упражнение 3.

Возьмем длину слова поменьше и отрезок между гэпами тоже; будем искать
среди как кодирующих, так и некодирующих последовательностей.
последовательности: W 11 -t 16 -N 2. Результат - 88 находок.