Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~seferyan_m/projects/GO/GO.html
Дата изменения: Mon May 31 17:49:24 2010
Дата индексирования: Tue Oct 2 17:40:33 2012
Кодировка: Windows-1251
Функции. Онтологии базы данных GO.
Московский Государственный Университет имени М.В.Ломоносова

Факультет Биоинженерии и Биоинформатики

Учебный сайт Сеферяна Мелика

Главная

I Семестр

II Семестр

III Семестр

IV Семестр

Проекты

Официальный сайт ФББ

Официальный сайт МГУ

Полезные ссылки

Функции. Онтологии базы данных GO.

I. Знакомство с терминологией GO.

Описание функции белка RISA_Ecoli в соответствии с GO-аннотацией

  Онтология GO (название словаря) Количество разных ассоциированных терминов GO Функция белка
(краткое описание, близкое к тексту определения термина(ов) GO
Где?   0  
Зачем, для чего? Biological Process (биологический процесс) 1 1. Биосинтез рибофлавина - химические реакции и метаболические пути в результате которых образуется рибофлавин (витамин B2), предшественник коферментов флавинмононуклеотида (FMN) и флавинадениндинуклеотида (FAD)
Молекулярный механизм? Molecular Function (молекулярная функция) 2 1. Рибофлавинсинтазная активность - катализирует реакцию: 2 6,7-диметил-8-(1-D-рибитил)лумазин = рибофлавин + 4-(1-D-рибитиламино)-5-амино-2,6-дигидроксипиримидин.
2. Трансферазная активность - катализирует перенос химической группы с одной молекулы на другую. Трансфераза - название ферментов класса 2 по EC (международная классификация ферментов).
Специфичность?   0  


Описание терминов GO

GO ID выбранного термина Список синонимов Список ближайших родительских терминов GO с указанием типа связи Список ближайших дочерних терминов GO с указанием типа связи
GO:0009231 exact: riboflavin anabolism exact: riboflavin biosynthesis
exact: riboflavin formation
exact: riboflavin synthesis
exact: vitamin B2 biosynthesis
exact: vitamin B2 biosynthetic process
exact: vitamin G biosynthesis
exact: vitamin G biosynthetic process
1) GO:0044271 : cellular nitrogen compound biosynthetic process (is_a)
2) GO:0042727 : riboflavin and derivative biosynthetic process (is_a)
3) GO:0006771 : riboflavin metabolic process (is_a)
4) GO:0009231 : riboflavin biosynthetic process (is_a)
Дочерних терминов нет
GO:0004746 narrow: heavy riboflavin synthase
narrow: light riboflavin synthase
exact: 6,7-dimethyl-8-(1-D-ribityl)lumazine:6,7-dimethyl-8-(1-D-ribityl)lumazine 2,3-butanediyltransferase activity
exact: riboflavin synthetase activity
exact: riboflavine synthase activity
exact: riboflavine synthetase activity
exact: vitamin B2 synthase activity
broad: lumazine synthase activity
1) GO:0016765 : transferase activity, transferring alkyl or aryl (other than methyl) groups (is_a) Дочерних терминов нет
GO:0016740 синонимов нет 1) GO:0003824 : catalytic activity (is_a) 1) GO:0008665 : 2'-phosphotransferase activity (is_a)
2) GO:0008414 : CDP-alcohol phosphotransferase activity (is_a)
3) GO:0008820 : cobinamide phosphate guanylyltransferase activity (is_a)
4) GO:0042123 : glucanosyltransferase activity (is_a)
5) GO:0043842 : Kdo transferase activity (is_a)
6) GO:0000031 : mannosylphosphate transferase activity (is_a)
7) GO:0051075 : S-adenosylmethionine:tRNA ribosyltransferase-isomerase activity (is_a)
8) GO:0016746 : transferase activity, transferring acyl groups (is_a)
9) GO:0016744 : transferase activity, transferring aldehyde or ketonic groups (is_a)
10) GO:0016765 : transferase activity, transferring alkyl or aryl (other than methyl) groups (is_a)
11) GO:0016757 : transferase activity, transferring glycosyl groups (is_a)
12) GO:0016769 : transferase activity, transferring nitrogenous groups (is_a)
13) GO:0016741 : transferase activity, transferring one-carbon groups (is_a)
14) GO:0016772 : transferase activity, transferring phosphorus-containing groups (is_a)
15) GO:0016785 : transferase activity, transferring selenium-containing groups (is_a)
16) GO:0016782 : transferase activity, transferring sulfur-containing groups (is_a)


Графы родительских, дочерних терминов и терминов-сибсов: GO:0009231, GO:0004746, GO:0016740.

II. Оценка качества функциональной аннотации белков в UniProt.

1. Определение числа реальных и гипотетических белков пшеницы.

Русское название: пшеница
Английское название: wheat
Латинское название: triticum
Ранг таксона: род (genus)
NCBI_TaxID: 4564

Соотношение между реальными и гипотетическими белками пшеницы (по данным UniProt)

  Количество в UniProt
Существование белка доказано экспериментально 159
Известны только соответствующие транскрипты 2444
Гипотетический белок, предсказан по гомологии 723
Иные предсказанные гипотетические белки 3172


Как видно из таблицы, меньше всего - экспериментально доказанных белков, гораздо больше - доказательств на уровне транскрипта. Несмотря на это больше половины всех известных белков пшеницы - гипотетические.

2. Определение качества функциональной аннотации в UniProt

Задание: Определите с помощью одного запроса к SRS, сколько из реальных (см. выше) белков заданного таксона аннотированы по всем трем словарям GO и у которых встречается хотя бы один раз хотя бы один из кодов экспериментального доказательства функции
Запрос:
Organism name: Triticum
ProteinExistence: 1: evidence at protein level|2: evidence at transcript
DBxref_ : GO:&P:&F:&C:&(EXP:|IDA:|IPI:|IMP:|IGI:|IEP:)
Поиск не дал результатов. Таким образом функции многих, даже экспериментально полученных белков еще не вполне известны.

III. Использование GO для работы с массовыми данными.

1. Получение выборки последовательностей белков с заданной функцией.

Русское название функции: биосинтез пуринов
Английское название функции: purine biosynthesis
Выбранный GO_ID: GO:0006164 : (purine nucleotide biosynthetic process)
Словарь: biological process
Запрос: ([uniprot-Organism:Triticum*] & [uniprot-DBxref_:GO:0006164*])
По данному запросу была найдена всего одна запись в банке UniProt - O24396.
Последовательность этого белка сохранена в файле pura_wheat.fasta.

2. Определение главной функции в большом списке белков

В файле P0AFU8.txt находится список идентификаторов UniProt белков, полученных в результате массового эксперимента.

Программа GOstat позволяет определить, белки с какими функциями доминируют в этом списке.

Наиболее перепредставленные термины GO приведены в таблице:
GO ID P-value Онтология GO Термин
GO:0009231 8.1e-10 biological process биосинтез рибофлавина (riboflavin biosynthetic process)
GO:0042726 8.1e-10 biological process метаболизм рибофлавина и его производных (riboflavin and derivative metabolic process)
GO:0042727 8.1e-10 biological process биосинтез рибофлавина и его производных (riboflavin and derivative biosynthetic process)
GO:0006771 8.1e-10 biological process метаболизм рибофлавина (riboflavin metabolic process)
GO:0042364 8.34e-08 biological process биосинтез водорастворимых витаминов (water-soluble vitamin biosynthetic process)
GO:0009110 1.05e-07 biological process биосинтез витаминов (vitamin biosynthetic process)
GO:0006767 2.42e-07 biological process метаболизм водорастворимых витаминов (water-soluble vitamin metabolic process)
GO:0006766 3e-07 biological process метаболизм витаминов (vitamin metabolic process)
GO:0005886 3.02e-07 cellular component плазматическая мембрана(plasma membrane)

Таким образом большая часть заданных белков участвует в процессе биосинтеза рибофлавина.

© Сеферян Мелик, 2008 seferyan_m@mail.ru