13.03.2008
Оценка давления отбора на ген (ilvA) заданного белка (THD1_ECOLI) в период, начиная с момента расхождения кишечной палочки и синегнойной палочки (или чумной палочки).
Подготовка данных:
- Скопировать последовательности заданного белка и его гена из Term3/Practice3 и переименовать:
- Найти гомолога заданного белка с ID около 60-80% в геноме синегнойной палочки (Pseudomonas aeruginosa) или чумной палочки (Yersinia pestis) [в крайнем случае бактерии - возбудителя тифа (Rickettsia prowazekii)].
- Online описание заданного белка: http://cn.expasy.org/uniprot/THD1_ECOLI
- Сверху справа кнопка: Quick BlastP search.
- Найти в полученном списке выравненных последовательностей первую из организма чумной палочки (_YERPE), с совпадающим описанием: Threonine deaminase (Dehydratase). Перейти по ссылке, левее названия.
- С полученной страницы скачать последовательность белка (в конце страницы): Q7CL02 in FASTA format
- В разделе Cross-references: Sequence databases: EMBL: [CoDingSequence]
Построение выравниваний:
- Генов:
needle ilvA.fasta YP_19831_21375.fasta EC_YP_gene.needle -auto
При построении нуклеотидного выравнивания изменение параметров needle со стандартных (10; 0.5) на (25; 10) приводит к построению выравнивания без гэпов:
needle ilvA.fasta YP_19831_21375.fasta EC_YP_gene_go25_ge10.needle -gapopen 25 -gapextend 10 -auto
- Белков:
needle THD1_ECOLI.fasta A6BWY2.fas EC_YP_prot.needle -auto
Для PAL2NAL:
needle THD1_ECOLI.fasta A6BWY2.fas EC_YP_prot.needle.fasta -aformat3 fasta -auto
Возможности PAL2NAL:
PAL2NAL преобразовывает выравнивание белковых последовательностей и соответствующие последовательности ДНК (или мРНК) в нуклеотидное выравнивание с разбивкой на кодоны (в спорных случаях на основе белкового выравнивания). Программа учитывает при работе и отмечает несоответсвия между белковым выравниванием и нуклеотидными последовательностями; сдвиги рамки считывания, наличие поли-А хвостов и 5' НТР.
На основе получаемых данных PAL2NAL также может рассчитывать значения Ка и Кs.
Построение нуклеотидного выравнивания с разбивкой на кодоны:
- Сервер PAL2NAL
- -*не работает*-
INPUT FILE 1: проще указать путь к файлу белкового выравнивания (EC_YP_prot.needle)
- INPUT FILE 1: проще указать путь к файлу белкового выравнивания (EC_YP_prot.needle.fasta)
- INPUT FILE 1: т.к. последовательности THD1_ECOLI.fasta и A6BWY2.fas полностью выравниваются программой needle, можно вставить содержимое этих файлов друг за другом
- INPUT FILE 2: вставить содержимое ilvA.fasta и YP_19831_21375.fasta
- Option setting: Output format: Codon with Amino acid
Получено выравнивание: pal2nal_01.html.
Примечание: в каждую выдачу PAL2NAL дописывает предупреждения (WARNING), в которых говорит о несоответствии аминокислоты кодону, хотя вроде у него нету на это оснований (в последовательностях все нормально, все соответствует). Эти же кодоны и ак он помечает красным цветом. ...?
Построенное выравнивание соответствует выравниваниям, построенным ранее программой needle. В нем в принципе удобнее искать различия в последовательностях, только жалко, что нету подкраски по цветам (синонимичные замены одним цветом, несинонимичные - другим).
Получение значения Ka/Ks для сравниваемых генов:
- Сохранив выдачу PAL2NAL, вернуться на предыдущую страницу.
- Option setting: Remove gaps, inframe stop codons: Yes,
Calculate KS and KA: Yes
- Output format: CLUSTAL
Получено выравнивание с подсчетом KA/KS: pal2nal_02.html.
KA/KS = 0.0508.
Вывод о силе и направлении отбора:
KA/KS << 1 => можно предположить, что на ген ilvA действует вполне существенный стабилизирующий отбор
с момента расхождения кишечной палочки и чумной палочки.
назад
|