Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~serge2006/RNA_structure/RNA_structure.html
Дата изменения: Mon Feb 4 17:09:57 2008
Дата индексирования: Tue Oct 2 15:20:52 2012
Кодировка: Windows-1251
RNA structure

Занятие 8. Структура тРНК

назад

1. Заданный PDB-код: 1efw.
Скачиваем из банка соответствующий PDB-файл: http://www.pdb.org/pdb/cgi/explore.cgi?pdbId=1EFW.
В данной записи PDB описана кристаллическая структура аспартил-тРНК синтетазы из Thermus thermophilus, совмещенная с аспартиловой тРНК из Escherichia coli.

PDB-код тРНК Организм Идентификаторы цепей Другие молекулы
1EFW Aspartyl-tRNA Escherichia Coli (Bacteria) Цепи: C,D - Аспартил-тРНК синтетаза (цепи: A,B)
- Вода

Аспартил-тРНК синтетаза (1EFW: цепи A, B) выполняет функции: nucleotide, nucleic acid и ATP binding; aminoacyl-tRNA ligase activity; aspartate-tRNA ligase activity и участвует в следующих биологических процессах: translation; tRNA aminoacylation for protein translation; aspartyl-tRNA aminoacylation.

Примечание: в исследуемой структуре содержится по 2 идентичных молекулы аспартил-тРНК синтетазы и тРНК.
Выбираем цепь C.
Создаем "уменьшенный" pdb:
открыть в RasMol исходный, restrict *:C, save 1EFW_c.pdb (создвнный файл будет называться 1EFW_C.PDB !!): 1EFW_c.pdb.

2;3. Последовательность тРНК:
В состав тРНК входят модифицированные основания:
  • 4SU - U 4-THIOURIDINE-5'-MONOPHOSPHATE
  • H2U - U 5,6-DIHYDROURIDINE-5'-MONOPHOSPHATE
  • QUO - G
  • 2MA - A 2-METHYLADENOSINE-5'-MONOPHOSPHATE
  • G7M - G N7-METHYL-GUANOSINE-5'-MONOPHOSPHATE
  • 5MU - U 5-METHYLURIDINE 5'-MONOPHOSPHATE
  • PSU - U PSEUDOURIDINE-5'-MONOPHOSPHATE
Анализ структуры программой find_pair: find_pair -t 1qrt.pdb stdout | analyze

Скрипт col_helices.scr написан для третичной структуры, а мы работаем со вторичной. Поэтому из него можно взять только сами пары связанных водородными связями нуклеотидов. На его основании, опираясь на визуальное отображение в RasMol (скрипт: 02_1.scr), красим разными цветами участки, входящие в разные спирали (всего 4 спирали):
[5'] (1) GGAGCGG 4SUA GUUCA GH2UCGGH2UH2U AGAAU ACCUGCC UQUOUC2MA CGCAGGG GG7MUC GCGGG 5MUPSUCGAGU CCCGPSU CCGUUCC (72) [3']
Примечание: данная раскраска не точна, по сравнению с "каноническим" устройством тРНК, например, как здесь: WikipediA.

Номер первого нуклеотида: 1. Номер последнего нуклеотида: 72. Но при этом их 73. Значит есть вставка. Здесь: http://www.pdb.org/pdb/explore/remediatedSequence.do?structureId=1EFW хорошо видна эта вставка между 20 (H2U) и 21 (A): в позиции 20A находится H2U. Это 5,6-дигидроуридин-5'-монофосфат. В 1EFW.pdb эта вставка не отражена нумерацией (то есть у второго H2U номер тоже 20, как и у первого), но ее можно отличить косвенно:
HETATM 414 P H2U C 20   и   HETATM 434 P H2U C 20. Двух атомов с одинаковыми "атомными именами" в одном нуклеотиде быть не может, значит здесь вставка.
Делеций не обнаружено.

4. Создть в RasMol картинку (в формате GIF) структуры выбранной цепи тРНК в остовной модели, где найденные спирали покрашены в разные цвета, а при атомах фосфора 5'-концевого и 3'-концевого нуклеотидов подписаны номера остатков.
Использованный скрипт: 02_2.scr. 2 картики с разных ракурсов:

5. Анализ структуры с использованием RasMol.
  • Примеры внеспирального стекинг-взаимодействия между основаниями:

  • Примеры водородных связей между основаниями, не сводящийся к Уотсон-Криковскому спариванию комплементарных оснований:
    Из 1EFW_C.out:
    Detailed H-bond information: atom-name pair and length [ON]
       1   (0.006) C:..38_:[..C]C-*---C[..C]:..32_:C (0.003)     |
       7   (0.010) C:..44_:[..G]Gx*---A[..A]:..26_:C (0.010)     |
       8   (0.020) C:..10_:[..G]G-*---U[..U]:..25_:C (0.018)     |
      12   (0.008) C:...8_:[4SU]ux**-xg[G7M]:..46_:C (0.009)     |
      13   (0.015) C:..14_:[..A]A-*--xA[..A]:..21_:C (0.033)     |
      18   (0.012) C:...4_:[..G]G-*---U[..U]:..69_:C (0.017)     |
      22   (0.009) C:..49_:[..G]G-*---P[PSU]:..65_:C (0.047)     |
      27   (0.011) C:..54_:[5MU]u-**-xA[..A]:..58_:C (0.018)     |
      28   (0.046) C:..55_:[PSU]Px**+xG[..G]:..18_:C (0.006)     x
    
Отступление: в данной структуре есть несколько отличий от остальных, содержащих тРНК: 1) Это ?димер? - цепи A,B полностью дублируют C,D. Только расположены в pdb структуре не одна на другой, а симметрично относительно некоторой плоскости.. 2) У тРНК: на ?большинстве? картинок в интернете у тРНК на 3' конце есть некомплементарный участок из 3-5 нуклеотидов. В данной структуре такого участка нету. 3' и 5' концы определены путем сравнения расположения некомплементарных учасков относительно комплементарных спиралей. Первый участок идет сразу после одной цепи первой спирали, а второй - между 3 и 4 спиралями. На картинке в Википедии такое расположение соответствует тому, что первая спираль начинается с 5' конца всей тРНК.

6. Найти возможные двуспиральные участки в последовательности исследуемой РНК. Сравнить результаты с набором спиралей, найденных в 3D структуре.
Программа einverted из пакета EMBOSS позволяет найти инвертированные последовательности в НК.
Примечание: einverted, как написано в ее описании, ищет инвертированные повторы в ДНК, но также автоматически заменчет U на T в последовательности, то есть может обрабатывать последовательность РНК без ручной конвертации.

Ссылка для получения полседовательности цепи C в fasta формате:
http://www.pdb.org/pdb/download/downloadFile.do?fileFormat=fastachain&compression=NO&structureId=1EFW&chainId=C. Скачается файл: 1EFW_C.fasta.txt. Переименовываем в 1EFW_C.fasta.
  • В полученном файле модифицированные основания заменены родственными.
    • Со стандартными параметрами (-gap 12 -threshold 50) программа ничего не находит:
      einverted -sequence 1EFW_C.fasta -outfile 1EFW_C_01.inv -outseq 1EFW_C_01.fasta -auto
    • При снижении Minimum score threshold до 17 появляется первый инвертированный участок (больше, чем наполовину совпадает с предсказанием в расмоле):
      einverted -sequence 1EFW_C.fasta -threshold 17 -outfile 1EFW_C_02.inv -outseq 1EFW_C_02.fasta -auto
    • При дальнейшем снижении до 12 появляется второй участок, короткий (4 нк), но полностью совпадающий:
      einverted -sequence 1EFW_C.fasta -threshold 12 -outfile 1EFW_C_03.inv -outseq 1EFW_C_03.fasta -auto
    • При дальнейшем снижении до 10 второй участок, становится полностью несовпадающим:
      einverted -sequence 1EFW_C.fasta -threshold 10 -outfile 1EFW_C_04.inv -outseq 1EFW_C_04.fasta -auto
    • Снижение до 6 добавляет 3ий участок, но так же несовпадающий:
      einverted -sequence 1EFW_C.fasta -threshold 6 -outfile 1EFW_C_05.inv -outseq 1EFW_C_05.fasta -auto
      Дальнейшее снижение до 0 не вносит изменений в выдачу...
    Лучший вариант: einverted -sequence 1EFW_C.fasta -threshold 12 -outfile 1EFW_C_03.inv -outseq 1EFW_C_03.fasta -auto

  • Заменим модифицированные основания универсальными "N": 1EFW_C2.fasta.
    • Со стандартными параметрами (-gap 12 -threshold 50) программа ничего не находит:
      einverted -sequence 1EFW_C2.fasta -outfile 1EFW_C2_01.inv -outseq 1EFW_C2_01.fasta -auto
    • При снижении Minimum score threshold до 15 появляется первый инвертированный участок (он полностью принадлежит предсказанному в расмоле, но меньше на 1 нк с каждого края):
      einverted -sequence 1EFW_C2.fasta -threshold 15 -outfile 1EFW_C2_02.inv -outseq 1EFW_C2_02.fasta -auto
    • При дальнейшем снижении до 12 появляется второй участок, короткий (4 нк), но полностью совпадающий:
      einverted -sequence 1EFW_C2.fasta -threshold 12 -outfile 1EFW_C2_03.inv -outseq 1EFW_C2_03.fasta -auto
    • При дальнейшем снижении до 9 второй участок, становится полностью несовпадающим:
      einverted -sequence 1EFW_C2.fasta -threshold 9 -outfile 1EFW_C2_04.inv -outseq 1EFW_C2_04.fasta -auto
      Дальнейшее снижение до 0 не вносит изменений в выдачу...
    Лучший вариант: einverted -sequence 1EFW_C2.fasta -threshold 12 -outfile 1EFW_C2_03.inv -outseq 1EFW_C2_03.fasta -auto

  • Примечание: попытка уменьшать также параметр -gap не привели к улучшению результата, хотя, видимо, это возможно.
  • Вывод: при использовании последовательности, в которой модифицированные основания заменены на универсальные ("N"), программа einverted более точно определяет инвертированные последовательности. Но все равно она нашла только 2 из 4, определенных в предыдущих заданиях.

7. Анализ последовательности тРНК программой mfold. Создание предсказания вторичной структуры, максимально близкого к реальности.
Ссылка для получения полседовательности цепи C в fasta формате:
http://www.pdb.org/pdb/download/downloadFile.do?fileFormat=fastachain&compression=NO&structureId=1EFW&chainId=C. Скачается файл: 1EFW_C.fasta.txt. Переименовываем в 1EFW_C.fasta.
Лучше создать подкаталог, например, mfold1, переместить 1EFW_C.fasta в него и запускать программу mfold уже из него, т.к. она выдает много "лишних" файлов.
Анализ тРНК программой mfold: mfold SEQ=1EFW_C.fasta.
Среди полученных файлов будут 1EFW_C.fasta_#.gif, где # - номер.
Наиболее правдоподобным я считаю третье изображение вторичные структуры данной тРНК:
Примечание: полученное изображение не отражает всех взаимодействий, т.к. они были потеряны из-за замены модифицированных оснований на родственные им немодифицированные, а в состав данной тРНК входит много модифицированных оснований (10 на 73, то есть ~ 14%).
Результат работы программы не особо информативен, т.к. учитываются взаимодействия (энергия) только пар оснований (к тому же без учета модифицированных), но не структуры в пространстве.
назад

© Serge I. Mitrofanov, 2007Последнее обновление: 02.02.2008