Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~sds/term4/block2/enzymes.html
Дата изменения: Mon Apr 2 23:28:36 2007
Дата индексирования: Tue Oct 2 17:21:00 2012
Кодировка: Windows-1251
Классификация функций. Работа с ферментами.

Ферменты и их коды.


  1. Расшифровка кода фермента.

    Работали с кодом фермента 2.4.2.4. На странице по номенклатуре ферментов совместной комиссии IUBMB-IUPAC по биохимической номенклатуре открывали ссылки, соответствующие номерам, последовательно указанным в коде фермента. Первая цифра кода 2 указывает на принадлежность фермента к классу трансфераз. Белки, относящиеся к данной группе, катализируют реакции переноса тех или иных функциональных групп от одного субстрата на другой (Кольман, Рем, 2004). Ферменты с первыми двумя цифрами кода 2.4. способствуют переносу остатков различных углеводов, это гликозилтрансферазы. В частности, пентозильные остатки переносят ферменты, обозначенные как 2.4.2.* (пентозилтрансферазы). Код (классификационный номер) EC 2.4.2.4. соответствует тимидинфосфорилазе (thymidine phosphorylase) – ферменту, катализирующему такую реакцию:

    thymidine + phosphate = thymine + 2-deoxy-α-D-ribose 1-phosphate

    То есть перенос остатка пентозы – дезоксирибозы – с тимидина на фосфат с образованием азотистого основания тимина и дезоксирибозофосфата.

    К поставленой задаче попробовали подойти с иной стороны. Чтобы узнать, что означает определенный код EC, какой фермент ему соответствует, нужно набрать код целиком в поле поиска здесь. Как результат поиска для кода 2.4.2.4 выводятся две ссылки, одна из которых ведет на страничку IUBMB Enzyme Nomenclature, где даны достаточно подробные сведения о ферменте, соответствующем введенному коду – в данном случае о тимидинфосфорилазе. В числе прочей информации интересно большое число синонимичных названий фермента (пиримидинфосфорилаза, эндотелиальный фактор роста, происходящий из кровяных телец и даже регулятор роста животных).

  2. Сравнение последовательности ферментов с одинаковым кодом из эволюционно далеких организмов.

    Как далекие организмы рассматривались

    1. Кишечная палочка (Escherichia coli), штамм K-12,
    2. Архея метанококк (Methanococcus jannaschii),
    3. Человек (Homo sapiens).

    В протеомах названных организмов с помощью поисковой системы SRS искали в UniProt все белки с заданной функцией (кодом фермента EC 2.4.2.4). Обязательным условием было наличие в записи имени гена либо имени локуса. Запрос к UniProt имел следующий вид: ((([uniprot-ID:*HUMAN] | [uniprot-ID:*ECOLI]) | [uniprot-ID:*METJA]) & [uniprot-ECNumber:2.4.2.4]). Галочка "Use wildcards" была убрана, чтобы не находились ферменты с кодами 2.4.2.4* (такие существуют. к примеру, 2.4.2.40). При выведении результатов визуализировали, кроме прочих, поля GeneName и OrderedLocus (чтобы исключить неподходящие записи – с обоими пустыми полями). По запросу было найдено четыре записи, одну из них отбраковали по указанной причине (нет ни имени гена, ни имени локуса). Оставшиеся записи 150 по одной по одной из каждого исследуемого организма: соответственно TYPH_ECOLI, TYPH_METJA и TYPH_HUMAN 150 использовали в дальнейшей работе.

    Сравнили доменную структуру найденных белков с помощью варианта просмотра результатов поиска SW_InterProMatches. При этом рассматривались только домены Pfam. Результаты сравнения смотрите в таблице.

    Таблица 1: сравнение доменной структуры белков с одинаковым кодом фермента 2.4.2.4. из эволюционно далеких организмов.

     
    UniProt ID
    UniProt AC
    Имя гена (локуса)
    Первый домен
    Второй домен
    Третий домен  
    Иденти -фикатор Pfam
    Положение в последова -тельности
    Иденти -фикатор Pfam
    Положение в последова -тельности
    Иденти -фикатор Pfam
    Положение в последова -тельности
    1 TYPH_ECOLI P07650
    Q2M5T5
    DEOA PF02885 3–68 PF00591 78–333 PF07831 350–424
    2 TYPH_METJA Q58081 MJ0667 PF02885 88–152 PF00591 157–414 PF07831 424–491
    3 TYPH_HUMAN P19971
    Q13390
    Q8WVB7
    ECGF1 PF02885 35–100 PF00591 109–363 PF07831 388–462

    Как видно из таблицы, все три фермента удивительно схожи по доменной структуре. Каждый из них имеет три домена с идентификаторами Pfam. При этом каждому домену в одном белке соответствует по одному домену с тем же идентификатором Pfam из двух других белков – в каждом из трех белков есть по одному домену с идентификаторами PF02885, PF00591 и PF07831. Расположение гомологичных доменов в последовательностях одинаково: домен с идентификатором PF02885 во всех трех ферментах расположен в начале (со стороны N-конца аминокислотной цепи), домен PF00591 – в середине и домен PF07831 – в конце (со стороны C-конца цепи). Размер гомологичных доменов незначительно варьирует от белка к белку (в случае PF02885 – не более, чем на один аминокислотный остаток при средней (между тремя белками) длине 65,5 остатков, PF00591 – не более чем на три при средней длине 256 остатков, PF07831 – не более чем на семь остатков при средней длине 72 аминокислотных остатков). Междоменные промежутки по длине тоже не слишком вариабельны. Следовательно, доменная структура тимидинфосфорилаз эволюционно весьма консервативна.

    Сравнили аминокислотные последовательности гомологичных доменов, используя программу множественного выравнивания emma, которая реализует алгоритм ClustalW. Для этого написали скрипт, пользуясь знанием AC UniProt всех исследуемых тимидинфосфорилаз. Текст скрипта можно увидеть, перейдя по ссылке. При его работе программа seqret извлекает из заданного документа UniProt фрагменты, соответствующие тому или иному домену (координаты доменов, известные из таблицы, при работе скрипта вводятся "вручную" для каждого из доменов), и сохраняет последовательности для каждой группы гомологичных доменов в отдельный fasta-файл. Такие файлы подаются на вход emma (с параметром -auto, то есть все по умолчанию). Результатом работы скрипта являются множественные выравнивания в формате fasta, которые с помощью GeneDoc были переведены в формат msf. Их (отдельно для каждого домена) можно увидеть, перейдя по ссылкам:

    1. Для PF02885
    2. Для PF00591
    3. Для PF07831

    В отличие от расположения в первичной структуре белка, аминокислотные последовательности доменов не столь схожи. Вот пример типичного выравнивания (домены PF02885):

                                                *                 2 0                   *                 4 0                   *                 6 0                      
    T Y P H _ E C O L I   :   L A Q E I I R K K R D G H A L S D E E I R F F I N G I R D N T I S E G Q I A A L A M T I F F H D M T M P E R V S L T M A M R D S G T   :   6 6
    T Y P H _ H U M A N   :   Q L P E L I R M K R D G G R L S E A D I R G F V A A V V N G S A Q G A Q I G A M L M A I R L R G M D L E E T S V L T Q A L A Q S G Q   :   6 6
    T Y P H _ M E T J A   :   - S L P Y I R K K M D G N K L K K E E I F E I I D E M V D G K L T N I E I S A F V T S L Y I N G M D M D E I E A M T I R M A E T G E   :   6 5
                                    e   I R k K r D G     L s   e e I r   f 6     6 v 1 g           2 I   A     m   6       g M d 6   E       6 T   a 6 a   3 G            

    Как видим, полностью консервативных позиций не так уж много.

    Кроме множественых выравниваний, сделали еще и попарные глобальные с помощью needle. Для этого написали еще один скрипт, который запускали в папке с уже полученными в результате работы предыдущего скрипта (последовательностями доменов в fasta-формате). В результате получили выравнивания с такими характеристиками Identity:

    Таблица 2. Процент сходства в попарных выравниваниях гомологичных доменов, %.

      PF02885 PF00591 PF07831
    палочка–архея 30.3 29.7 20.7
    палочка–человек 36,4 47.0 23.4
    человек–архея 30.3 29.0 18.6

    Обсуждение результатов.

    Как известно, доменный уровень структурной организации белков предполагает "наличие в белках четко выраженных глобулярных областей – структурных доменов" (Молекулярная биология, Коничев А.С.). Один или несколько структурных доменов могут могут образовывать функциональные домены. Последние идентифицируются по свойствам : по способности осуществлять ферментативную реакцию или присоединять какое-либо вещество (кофермент, антиген, связываться с ДНК и т.п.).

    Консервативное взаимное расположение трех доменов (с идентификаторами Pfam PF02885, PF00591 и PF07831) в структуре тимидинфосфорилаз из эволюционно далеких организмов говорит о небезразличности такого расположеия доменов для отправления функциональной активности белка – катализа реакции обратимого фосфоролиза пиримидиновых нуклеозидов. По данным Pfam, все три домена связаны с тимидинфосфорилазной активностью : для доменов PF02885, PF00591 прямо указана функция. Точнее говоря, указано к какому семейству доменов они принадлежат, и какими функциями обладает это семейство (PF02885 отностся к helical bundle domain семейства гликозилтрансфераз , PF00591 – к a/b доменам того же семейства). Ситуация с PF07831 очень интересна: не указана прямо принадлежность домена к семейству, однако отмечено, что он всегда встречается в различных фосфорилазах пиримидиновых нуклеотидов. Из данных Pfam и сравнения, проведенного нами выше, понятно, что присутствие всех трех доменов характерно для белков с тимидинфосфорилазной активностью, пичем подобные домены встречаются и у других гликозилирансфераз. При этом важно взаимное расположение доменов PF02885, PF00591 и PF07831 в последовательности белка: выше мы уже отмечали неизменность такого положения в эволюции, а в Pfam при описании домена указывается, в каком месте цепи он располагаются (С-концевой) и как он располагается относительно большого a/b домена (в нашем случае P00591), это означает, что иное расположение для таких доменов невозможно. Из этого можно сделать вывод, что не только наличие всех трех доменов, но и их взаимное расположение важно для осуществления тимидинфосфорилазной функции. Можно предположить, что все три структурных домена участвуют в образовании одного функционального, катализирующего тимидинфосфорилазную реакцию. В подтверждение нашего предположения приведем.

    Тем не менее, никто не ожидает, что аминокислотная структура гомологичных доменов будет сходна у столь далеких эволюционно организмов, как кишечная палочка, метанококк и человек. Известно, что третичная структура белков более инерционна и устойчива в процесс эволюции, чем первичная (вплоть до 25 процентов сходства в первичной структуре третичная меняется мало, заметим, что в таблице 2 почти все значения превышают 25%), то же можно сказать и о доменной структуре. При замене аминокислот на близкие по физико-химическим свойствам конформация. взаимное расположение в пространстве и в общем структура домена ожидаемо мало меняются. Однако, как показывают исследования, даже наличие неконсервативных позиций в выравнианиях гомологичных доменов не меняет ситуации. Для подтверждения высказанной мысли приведем эталонное выравнивание домена с идентификатором PF07831. Полностью консервативными в этом выравнивании являются только две позиции, можно предположить, что они важны для формирования активного центра фермента.

    Анализируя попарные выравнивания, можно сказть, что самый высокий процент сходства наблюдается в выравниваниях белков из палочки и человека, меньший – палочки и археи, самый маленький – человека и археи. Последний результа вполне объясним – человек и метанококк – очень далекие организмы, начиная с того, что первый относится к эукариотам, а второй к прокариотам. Однако в таком случае не очень понятны относительно высокие проценты сходства в выравниваниях домегов TYH_ECOLI и TYPH_HUMAN. Особенно интересен случай с домнов PF00591. Это самый длинный из исследуемых домен, и он выравниванется с Identity 47% (!) между белками E.coli и H.sapiens.


  3. Работа с Brenda.

    Brenda – "ферментная" база данных (The Comprehensive Enzyme Information System – Полная информационная система о ферментах). На ее главной странице находится поле для поиска, который можно вести по коду фермента (EC-Number), названию фермента или имени организма. Мы использовали первый вариант, и вводили в поле код 2.4.2.4. По такому запросу было найдено два фермента – с нужным кодом и с кодом 2.4.2.40 (при этом кавычки не воспринимаются поисковой системой Brenda как некое ограничение поиска, при их использовании выводится сообщение об ошибке). Для нашего фермента (тимидинфосфорилазы) как результат поиска получили одну строчку, в которой можно найти ссылки на схему ферментативной реакции, перечень всех последовательностей, связанных с кодом (ссылки в видке картинок) и полное описание фермента (ссылка в виде кода фермента). Перейдя по первой ссылке, получили такое изображение ферментативной реации:

    Перейдя по второй ссылке,можно получить информацию о последовательностях, асооциипованных с функцией, обозначенной кодом 2.4.2.4. В Brenda упоминаются 88 таких последовательностей, большинство из прокариотических орнанизмов. Однако гораздо больше информации можно получить, перейдя со траницы результатов поиска по третьей ссылке – к непосредствененому описанию. Здесь собран просто колоссальный объем данных по ферментам, имеющим отдельный классификационный номер, в нашем случае 2.4.2.4. Информация о кофакторах, последовательностях и четвертичной структуре белков из разных организмов, данные по катализируемыи реакциям, их вариантам, возможным ингибиторам ферментов и различным константам, связанным с ферментативной активностью, оптимальным условиям протекания катализируемой реакции, ссылки на другие базы данных (SwissProt, PDB, InterPro) – все это можно найти в БД Brenda. Вся информация рассредоточена по 7 разделам, по которым обеспечена удобная навигация. Пользуясь предоставленной информацией, мы ответили на интересующие нас вопросы:

    1. В базе данных Brenda есть информация о 88 последовательностях с функцией, описываемой кодом 2.4.2.4, большинство из прокариотических организмов. Однако есть данные о девяти ферментах, для котоых ссылки на последовательность нет (только ссылки на статьи). Следовательно, в общем счете в Brenda описаны 97 ферментов с кодом 2.4.2.4.
    2. Тимидинфосфорилаза – гомодимер; каждая субъединица включает в себя по два неодинаковых домена.
    3. Нет информациии о посттрансляционной модификации ферментов такого типа.
    4. Болезни человека, так или иначе связанные с ферментом: во-первых, фермент был выделен не только из здоровых органов человека, но и из опухолей (аденокарциномы, опухолей желудка, матки, яичников, пищевода, молочных желез и др.). Во-вторых, существуют заболевания, напрямую связанные с нарушениями функционирования тимидинфосфорилазы: это хронические ишемические заболевания сердца, болезни пищевода и ротоглотки. Напротив каждого упоминания заболевания в Brenda дана ссылка на соответствующую статью.

    5. Сравнение аннотации функций у 3-х ферментов из далеких организмов.

      Рассматирвались те же белки, что и во втором обязательном задании (см.пункт 2): TYPH_ECOLI, TYPH_METJA и TYPH_HUMAN – тимидинфосфорилазы (EC 2.4.2.4) соответственно из кишечной палочки, метанококка и человека.

      1) Сравнение аннотации функций в БД GOA.

      Поиск соответствующих аннотаций в БД GOA велся по AC UniProt (см. вторую колонку таблицы1) всех трех белков поочередно. Результаты поиска (аннотации из разных онтологий GO) приведены ниже в таблице.

      Таблица 3. Аннотации GO для тимидинфосфорилаз из трех эволюционно далеких организмов.

        TYPH_ECOLI TYPH_METJA TYPH_HUMAN
      Для чего фермент предназначен?
      (данные онтологии process)
      Метаболические процессы;
      Процессы метаболизма пиримидиновых оснований
      Метаболические процессы;
      Процессы метаболизма пиримидиновых оснований
      Метаболические процессы;
      Процессы метаболизма пиримидиновых оснований;
      Процессы метаболизма пиримидиновых нуклеотидов

      Ангиогенез;
      Хемотаксис;
      Передача сигнала от клетки к клетке;
      Развитие многоклеточных организмов;
      Дифференцировка клеток;
      Передача сигнала, опосредованная рецептором клеточной поверхности;

      Репликация ДНК;
      Поддержание митохондриального генома

      Каким образом фермент функционирует?
      (данные онтологии function)
      Трансферазная активность;
      Трансферазная активность, связанная с переносом гликозильных групп;
      Тимидинфосфорилазная активность;

      Соединение с белками

      Трансферазная активность;
      Трансферазная активность, связанная с переносом гликозильных групп;
      Тимидинфосфорилазная активность
      Трансферазная активность;
      Трансферазная активность, связанная с переносом гликозильных групп;
      Тимидинфосфорилазная активность;

      Активность ростового фактора;
      Связывание рецептора тромбоцитарного фактора роста

      Где в клетке встречается фермент?
      (данные онтологии component)
      Мембранная фракция Нет данных Внеклеточное пространство;
      растворимая фракция

      Наиболее обширно аннотирован белок из человека, наименее – белок из метанококка, что понятно: даже очень хорошо изученная археобактерия исследована в меньшей степени, чем человек (очевидно, что протеом человека аннотирован лучше ввиду большего количества путей применения результатов такого аннотирования). Как видно из аннотаций, относящихся к онтологиям process и function, для существует общий набор функций, активностей и механизмов, прямо связанных с тимидинфосфорилазной активностью (назовем такой набор базовым), которым обладает каждый белок из трех исследованных, в таблице соответствующие аннотации выделены подчеркиванием. Кроме того, с каждым из трех ферментов связаны аннотации, каких нет у остальных белков. Особо интересно с этой точки зрения рассмотреть фермент человека. Обилие его аннотаций из онтологий function и process вполне объяснимо: во-первых, как уже было сказано выше, этот белок, по видимому, исследован в большей степени, чем другие (что понятно: выполняя первое дополнительное задание, мы узнали, что с тимидинфосфорилазами у человека связаны различные заболевания, этим вполне может быть обусловлен интерес к данной группе ферментов у человека, в том числе к TYPH_ECOLI). Во-вторых, в отличие от палочки и метанококка, человек – мгногоклеточный организм, и, кроме базового набора активностей и процессов, у тимидинфосфорилазы человека появляется функции, которых не могло быть у ферментов одноклеточных. К примеру, функции, связанные с взаимодействием клеток между собой, с межклеточной сигнализацией. Подобные аннотации выделены в таблице курсивом, как видим, они ассоциированы в GOA только с ферментом человека. Нам кажется, что именно в связи с дополнительным набором функций межклеточной сигнализации TYPH_HUMAN локализуется во внеклеточном пространстве.

      Кроме охарактеризованных групп аннотаций, существуют еще несколько аннотаций, относящихся только к тому или иному ферменту. К примеру, белок TYPH_HUMAN каким-то образом связан с репликацией ДНК. Мы не уверены, можно ли эту функцию относить с высокой степенью достоверности к группе функций, связанных с межклеточными взаимодействиями. С одной стороны, репликация связана с дифференцировкой в развитии организма, а, судя по выделенным курсивом аннотациям, TYPH_HUMAN принимает участие и в дифференцировке, и в развитии многоклеточного организма в общем. С другой стороны, недостаточно информации, чтобы считать, что процесс репликации здесь имеется в виду именно с точки зрения развития организма. Еще один пример "индивидуальной" аннотации – "Соединение с белками" (онтология process) TYPH_ECOLI. Странно, что остальные ферменты не имеют подобной аннотации, ведь, как мы узнали, выполняя первое дополнительное задание (см. здесь), тимидинфосфорилаза имеет гомодимерную четвертичную структуру, то есть каждая полипептидная цепь белка соединяется с одной такой же. Поэтому мы ожидали, что все исследуемые белки будут обладать подобной функцией (соединение с белками). Оказалось, что только один из трех – TYPH_ECOLI.

      Интересными оказались некоторые различия в расположении ферментов из разных организмов в клетке. Насчет локализации TYPH_METJA GOA не сообщает никакой информации; о том, почему в человеческом организме белок с тимидинфосфорилазной активностью может располагаться во внеклеточном пространстве, мы уже говорили. Интересно, что в E.coli тимидинфосфорилаза – мембраносвязанный фермент, а у человека она относится к растворимой фракции клетки.

      2) Сравнение аннотаций GOA с аннотациями в UniProt

      Ожидалось, что UniProt даст менее подробную аннотацию, чем GOA, поскольку в БД GO собрана информация, основанная не только на данных UniProt, но и на многих других источниках информации (БД GO был задумана как обобщающая база данных, описывающая гены и их продукты).

      Для получения аннотации UniProt для наших тимидинфосфорилаз к названной БД через SRS был обращен следующий простой запрос: (([uniprot-ID:TYPH_ECOLI*] | [uniprot-ID:TYPH_HUMAN*]) | [uniprot-ID:TYPH_METJA*]) . Необходимые нам данные находятся в поле CC документа UniProt. Для визуализации содержимого этого поля, прежде чем отправить запрос, выберем в поле "Result Display Options" Create a View и "попросим" SRS показать нам данные поля ID и все необходимое из поля СС (Comment:ID; Comment:CommentType и Comment:Comment) каждого документа UniProt*. В результате описанных действий были получены необходимые нам аннотации (комментарии) каждого белка, которые мы привели в таблице ниже. Мы постарались использовать тот же план описания функции, что применялся при работе с GOA. Данные, касающиеся функции, в UniProt не столь структурированы, как данные GO, поэтому распределение информации по полям таблицы может показаться спорным.

      Таблица 4. Аннотация тимидинфосфорилаз из эволюционно далеких организмов по данным UniProt.

        TYPH_ECOLI TYPH_METJA TYPH_HUMAN
      Для чего фермент предназначен? Метаболизм пиримидиновых нуклеотидов, в том числе тимидина;
      Катализ реакции
      Thymidine + phosphate = thymine + 2-deoxy- CC alpha-D-ribose 1-phosphate
      (обратимого фосфоролиза пиримидиновых нуклеозидов);
      Деградация пиримидиновых нуклеозидов;
      Утилизация пиримидиновых нуклеозидов в качестве углерода, энергетических субстратов и материала для пиримидинового синтеза
      Катализ реакции
      Thymidine + phosphate = thymine + 2-deoxy- CC alpha-D-ribose 1-phosphate.
      Метаболизм пиримидиновых нуклеотидов, в том числе тимидина;
      Катализ реакции
      Thymidine + phosphate = thymine + 2-deoxy- CC alpha-D-ribose 1-phosphate
      (обратимого фосфоролиза пиримидиновых нуклеозидов);
      Утилизация пиримидиновых нуклеозидов в качестве углерода, энергетических субстратов и материала для пиримидинового синтеза

      Сохранение целостности кровеносных сосудов;
      Активность, способствующая росту клеток эндотелия;
      Ангиогенная активность (in vivo);
      Хемотаксическая активность (in vitro)

      Каким образом фермент функционирует? Где в клетке локализуется? Нет данных Нет данных Нет данных
      Четвертичная структура фермента Гомодимер Нет данных Гомодимер

      Примечание: для TYPH_HUMAN указаны также болезни, связанные с нарушениями его функционирования в организме человека.

      Кроме приведенных в таблице аннотаций, были рассмотрены ссылки на GO: в документах UniProt аннотация с помощью терминов GO оказалась далеко не столь полной, как в GOA. К примеру, вместо порядка десяти (см. таблицу 3) для TYPH_ECOLI дано всего две аннотации (ссылки на два термина) GO. Все эти аннотации мы уже рассматривали выше, поэтому повторяться не будем.

      Как видно из таблицы 4, аннотации UniProt для тимидинфосфорилаз также можно разделить на две группы: касающиеся функций, связанных с тимидинфосфорилазной активностью (соответствующие пункты в таблице 4 подчеркнуты) и касающиеся функций, связанных с взаимодействием клеток внутри организма (функции данной группы присущи только ферменту человека, выделены в таблице курсивом). В аннотации UniProt ничего не сказано о локализации белков в клетке, зато есть данные о гомодимерной четвертичной структуре, что косвенно говорит о наличии у всех белков функции с условным названием "соединение с белками". Из аннотации UniProt больше всего мы узнаем о тех свойствах белков, которые в GO были бы отнесены к онтологии processes и не узнаем о том, как работает тот или иной фермент.

      Заполняя таблицы 3 и 4, мы ничего не упоминали о достоверности указанных данных. С этой точки зрения аннотации GO более "прозрачны", поскольку каждая из них в обязательном порядке снабжена кодом данных, по которому можно судить о достоверности приведенной информации. В UniProt оценка достоверности более скудная; она скорее косвенная, к примеру, некоторые записи поля CC звучат не как утверждения, а как предположения (May have a role in maintaining the integrity of the CC blood vessels...). Безусловно, система оценка достоверности данных, принятая в GO, гораздо удобнее; в UniProt нет даже намека на подобную систему, особо нет и ссылок, по которым можно проверить те или иные заявленные в поле комментариев данные. В полях RA, RT и других документа UniProt есть ссылки на различные статьи, связанные с описываемым белком, однако точно проассоциировать эти ссылки с данными из коментариев невозможно

      Таким образом, как и ожидалось, UniProt дал менее подробную информацию насчер функции тимидинфосфорилаз из разных организмов, чем специализированный ресурс GO, к тому же достоверность аннотаций UniProt не поддается оценке. *Необходимые данные UniProt можно было получить еще одним путем: с помощью опции SRS Save сохранить три полных документа, и в них с помощью текстового поиска искать строки с идентификаторами СС (comments) и GO;.

    6. Cравнение cвойств 2-х ферментов с одним и тем же кодом из далеких организмов – человека и ахеобактерии.

      Сравниванили два фермента с тимидинфосфорилазной активеностью (EC 2.4.2.4) из разных организмов – человека (ID белка TYPH_HUMAN) и кишечной палочки (TYPH_ECOLI) Сравнение проводилось с помощью ресурсов ферментной БД Brenda (см. пункт третий) по следующим критериям: оптимуму рН действия ферментов, ингибиторам и активаторам данных ферментов. Для получения необходимых данных сначала в поле "Select one or more organisms in this record" выбрали Escherichia coli и Homo sapiens, нажали Submit. В отфильтрованной по этим двум организмам выдаче рассматривали таблицы "ACTIVATING COMPOUND", "INHIBITORS" и "pH OPTIMUM". Для каждого из гранизмов в этих таблицах имеются разные данные, при этом для каждого нового утвержедения есть ссылка на статью, подтверждающую данные. К сожалению, нет возможности быстро найти интересующие данные для конкретного белка (в нашем случае для TYPH_HUMAN и TYPH_ECOLI); в таблицах данные даются для тимидинфосфорилаз из определенных организмов (что вообще говоря, не то же самое). Уточнить, к какому конкретно белку относятся данные, думается, можно только перейдя по ссылке на статью (да и то не всегда – не в каждой статье дается ID исследуемого белка). В случае нашего фермента такая проблема стоит не очень остро (у каждого из исследуемых организмов, по данным UniProt, только по одному белку с функцией тимидинфосфорилазы), но, вообще говоря, для многих ферментов у некоторых организмов существуют изоферменты – различные белки, выполняющие одну и ту же функцию и несколько разнящиеся по последовательности и обысно по оптимальным условиям "работы". При исследовании, скажем, pH-оптимума таких белков с помощью Brenda может быть непонятно, к какому конкретно белку те или иные данные относятся. Кроме такой неопределенности, видно, что в таблице "pH OPTIMUM" для ферментов из одного и того же организма очень много значений (для тимидинфосфорилазы человека, – 7 разных значений, для тимидинфосфорилазы E.coli – 2 значения). Вероятно, некоторые из них означают pH оптимум при разных значениях температуры, но все же такое обилие значений оптимума pH не совсем ясно.

      В нашем случае мы считали, что везде, где в таблицах Brenda указан вид Homo sapiens, идет речь о белке TYPH_HUMAN, а где написано E.coli – о TYPH_ECOLI. По результатам сравнения составили таблицу:

      Таблица 5. Сравнение белков с тимидинфосфорилазной активностью из далеких организмов.

      Критерий TYPH_HUMAN TYPH_ECOLI
      Оптимум pH 10
      7.8
      7.5
      7.4
      6
      5.7
      6.3
      6.3
      7.1
      Активаторы Мочевина (в низких концентрациях) Нет данных
      Ингибиторы



©Ганчарова Ольга