Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~sds/term2/block3/benchmark_aln.html
Дата изменения: Wed May 3 22:31:12 2006 Дата индексирования: Tue Oct 2 19:04:59 2012 Кодировка: Windows-1251 |
В базе данных SMART по Accession number получено описание доменной структуры белка AAT_ECOLI
со схематичным изображением. Оказалось, что мой белок состоит только из одного домена, который называется Aminotran_1_2.
Как выяснилось, последний принадлежит базе данных Pfam.
Этот домен был взят для последующего рассмотрения по причине единственности. К сожалению, размер выбранного домена (366 а.о.) не соответствует желательному (50200 остатков), но другого варианта у нас нет.
Затем мы получили эталонное множественное выравнивание данного домена с его гомологами, и, используя возможности программы GeneDoc, оставили для дальнейшего исследования небольшой участок, постаравшись учесть все требования (длины, ширины, консервативности, непрерывности выравнивания и т.п.) Рассматриваются белки с разными названиями из разных организмов.
В результате получен участок множественного выравнивания следующего вида:
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   | 1 | 0 |   |   |   |   | * |   |   |   | 2 | 0 |   |   |   |   | * |   |   |   | 3 | 0 |   |   |   |   | * |   |   |   | 4 | 0 |   |   |   |   | * |   |   |   | 5 | 0 |   |   |   |   | * |   |   |   |   |   |
A | A | T | M | _ | B | O | V | I | N |   |   | 1 |   | : |   | I | L | L | H | A | C | A | H | N | P | T | G | V | D | P | R | P | E | Q | W | K | E | M | A | T | V | V | K | K | N | N | L | F | A | F | F | D | M | A | Y | Q | G | F | A | S | G | D | G | N | K | D | A | W | A | V |   | : |   | 5 | 5 | |
T | Y | R | B | _ | E | C | O | L | I |   |   | 1 |   | : |   | V | L | L | H | P | C | C | H | N | P | T | G | A | D | L | T | N | D | Q | W | D | A | V | I | E | I | L | K | A | R | E | L | I | P | F | L | D | I | A | Y | Q | G | F | G | A | G | - | M | E | E | D | A | Y | A | I |   | : |   | 5 | 4 | |
A | T | T | Y | _ | R | H | I | M | E |   |   | 1 |   | : |   | V | L | L | H | A | S | C | H | N | P | T | G | G | V | L | S | E | A | Q | W | M | E | I | A | A | L | V | A | E | R | G | L | L | P | L | V | D | L | A | Y | Q | G | F | G | R | G | - | L | D | Q | D | V | A | G | L |   | : |   | 5 | 4 | |
P | H | H | C | _ | P | S | E | A | E |   |   | 1 |   | : |   | V | L | L | H | A | C | C | H | N | P | T | G | F | D | L | S | H | D | D | W | R | R | V | L | D | V | V | R | R | R | E | L | L | P | L | I | D | F | A | Y | Q | G | F | G | D | G | - | L | E | E | D | A | W | A | V |   | : |   | 5 | 4 | |
A | A | T | _ | H | A | E | I | N | _ |   |   | 1 |   | : |   | V | L | L | H | G | C | C | H | N | P | T | G | I | D | P | T | P | E | Q | W | Q | E | L | A | A | L | S | A | K | N | G | W | L | P | L | F | D | F | A | Y | Q | G | L | A | N | G | - | L | D | E | D | A | Y | G | L |   | : |   | 5 | 4 | |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | v | L | L | H |   | c | c | H | N | P | T | G |   | d |   |   |   |   | q | W |   |   |   |   |   |   |   |   |   |   |   | l |   | p |   |   | D |   | A | Y | Q | G | f |   |   | G |   |   |   |   | D | a |   |   |   |   |   |   |   |   |
По идентификаторам пяти исследуемых белков(кстати, ни один ID не оказался устаревшим, и прибегать к помощи BLASTP не пришлось) с помощью поисковой системы SRS были найдены и сохранены в FASTA-формате последовательности.
   Для получения множественного выравнивания использовалась одна из реализаций ClustalWпрограмма emma. Поработав с ней, получили два файла: первый целевой в формате aln; второй в формате dnd (его назначение неясно).
   Данный aln-файл импортировали в GeneDoc, нашли в полученном выравнивании участок, соответствующий показанному выше и покрасили его "вручную" для удобства. Именно окрашенный фрагмент будет использоваться в дальнейшей работе.
В итоге получили такую картину:
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   | 1 | 9 | 0 |   |   |   |   | * |   |   | 2 | 0 | 0 |   |   |   |   | * |   |   | 2 | 1 | 0 |   |   |   |   | * |   |   | 2 | 2 | 0 |   |   |   |   | * |   |   | 2 | 3 | 0 |   |   |   |   | * |   |   | 2 | 4 | 0 |   |   |   |   |   |   |
A | A | T | M | _ | B | O | V | I | N |   | 1 | 8 | 0 |   | : |   | R | Y | Y | D | P | K | T | C | G | F | D | F | T | G | A | I | E | D | I | S | K | I | P | A | Q | S | V | I | L | L | H | A | C | A | H | N | P | T | G | V | D | P | R | P | E | Q | W | K | E | M | A | T | V | V | K | K | N | N | L | F |   | : |   | 2 | 3 | 9 |
T | Y | R | B | _ | E | C | O | L | I |   | 1 | 4 | 9 |   | : |   | P | W | Y | D | E | A | T | N | G | V | R | F | N | D | L | L | A | T | L | K | T | L | P | A | R | S | I | V | L | L | H | P | C | C | H | N | P | T | G | A | D | L | T | N | D | Q | W | D | A | V | I | E | I | L | K | A | R | E | L | I |   | : |   | 2 | 0 | 8 |
A | T | T | Y | _ | R | H | I | M | E |   | 1 | 4 | 4 |   | : |   | D | F | F | D | I | P | S | Q | S | V | I | F | D | N | L | V | S | A | L | E | G | A | A | S | G | D | A | V | L | L | H | A | S | C | H | N | P | T | G | G | V | L | S | E | A | Q | W | M | E | I | A | A | L | V | A | E | R | G | L | L |   | : |   | 2 | 0 | 3 |
P | H | H | C | _ | P | S | E | A | E |   | 1 | 5 | 0 |   | : |   | P | Y | V | S | A | D | N | - | R | L | D | V | E | A | M | L | A | G | L | E | R | I | P | Q | G | D | V | V | L | L | H | A | C | C | H | N | P | T | G | F | D | L | S | H | D | D | W | R | R | V | L | D | V | V | R | R | R | E | L | L |   | : |   | 2 | 0 | 8 |
A | A | T | _ | H | A | E | I | N |   |   | 1 | 4 | 8 |   | : |   | R | Y | Y | D | A | E | R | K | A | L | D | W | E | H | L | L | E | D | L | S | Q | A | S | E | G | D | V | V | L | L | H | G | C | C | H | N | P | T | G | I | D | P | T | P | E | Q | W | Q | E | L | A | A | L | S | A | K | N | G | W | L |   | : |   | 2 | 0 | 7 |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | 5 |   | d |   |   |   |   |   |   |   |   |   |   |   | 6 |   |   | 6 |   |   |   |   |   |   |   |   | 6 | L | L | H |   | c | c | H | N | P | T | G |   | d |   |   |   |   | q | W |   |   | 6 |   |   | 6 |   |   |   |   |   | l |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   | 2 | 5 | 0 |   |   |   |   | * |   |   | 2 | 6 | 0 |   |   |   |   | * |   |   | 2 | 7 | 0 |   |   |   |   | * |   |   | 2 | 8 | 0 |   |   |   |   | * |   |   | 2 | 9 | 0 |   |   |   |   | * |   |   | 3 | 0 | 0 |   |   |   |   |   |   |
A | A | T | M | _ | B | O | V | I | N |   | 2 | 4 | 0 |   | : |   | A | F | F | D | M | A | Y | Q | G | F | A | S | G | D | G | N | K | D | A | W | A | V | R | H | F | I | E | Q | G | I | N | V | C | L | C | Q | S | Y | A | K | N | M | G | L | Y | G | E | R | V | G | A | F | T | V | V | C | K | D | A | E |   | : |   | 2 | 9 | 9 |
T | Y | R | B | _ | E | C | O | L | I |   | 2 | 0 | 9 |   | : |   | P | F | L | D | I | A | Y | Q | G | F | G | A | G | - | M | E | E | D | A | Y | A | I | R | A | I | A | S | A | G | L | P | A | L | V | S | N | S | F | S | K | I | F | S | L | Y | G | E | R | V | G | G | L | S | V | M | C | E | D | A | E |   | : |   | 2 | 6 | 7 |
A | T | T | Y | _ | R | H | I | M | E |   | 2 | 0 | 4 |   | : |   | P | L | V | D | L | A | Y | Q | G | F | G | R | G | - | L | D | Q | D | V | A | G | L | R | H | L | L | G | V | V | P | E | A | L | V | A | V | S | C | S | K | S | F | G | L | Y | R | E | R | A | G | A | I | F | A | R | T | S | S | T | A |   | : |   | 2 | 6 | 2 |
P | H | H | C | _ | P | S | E | A | E |   | 2 | 0 | 9 |   | : |   | P | L | I | D | F | A | Y | Q | G | F | G | D | G | - | L | E | E | D | A | W | A | V | R | L | F | A | G | E | L | P | E | V | L | V | T | S | S | C | S | K | N | F | G | L | Y | R | D | R | V | G | A | L | I | V | C | A | Q | N | A | E |   | : |   | 2 | 6 | 7 |
A | A | T | _ | H | A | E | I | N |   |   | 2 | 0 | 8 |   | : |   | P | L | F | D | F | A | Y | Q | G | L | A | N | G | - | L | D | E | D | A | Y | G | L | R | A | F | A | A | N | H | K | E | L | L | V | A | S | S | F | S | K | N | F | G | L | Y | N | E | R | V | G | A | F | T | L | V | A | E | N | A | E |   | : |   | 2 | 6 | 6 |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | p |   |   | D |   | A | Y | Q | G | f |   |   | G |   |   |   |   | D | a |   |   | 6 | R |   |   |   |   |   |   |   |   |   | l | 6 |   |   | S |   | s | K |   | f | g | L | Y |   | e | R | v | G | a |   |   |   |   |   |   |   | a | e |   |   |   |   |   |   |