Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~greyerg/go.html
Дата изменения: Fri May 28 02:15:40 2010
Дата индексирования: Mon Oct 1 21:55:19 2012
Кодировка: Windows-1251
Marakhovskaya's page

Функции. Онтологии базы данных GO

I. Знакомство с терминологией GO 1. Описание функции белка с помощью аннотации Gene Ontology

Описание функции белка DCEA_Ecoli в соответствии с GO-аннотацией

  Онтология GO (название словаря) Количество разных ассоциированных терминов GO Функция белка
(краткое описание, близкое к тексту определения термина(ов) GO
Где? Cellular component
Клеточный компонент
2 cytosol (цитозоль); membrane (мембрана);
Зачем, для чего? Biological Process
Биологический процесс
3 glutamate metabolic process (метаболизм глутамата);
intracellular pH elevation (повышение уровня внутриклеточного pH);
carboxilic acid metabolic process (метаболизм карбоновых кислот);
Молекулярный механизм? Molecular Function
Молекулярная функция
5 glutamate decarboxylase activity (глутамат декарбоксилазная активность);
catalytic activity (каталитическая активность);
pyridoxal phosphate binding (связывание пиридоксаль-5'-фосфата);
carboxy-lyase activity (карбокси-лиазная активность);
lyase activity (лиазная активность)
Специфичность? Molecular Function
Молекулярная функция
2 глутамат, пиридоксаль-5'-фосфат
2. Описание термина GO Для описания термина GO я выбрала три термина соответствующие трем онтологиям GO.

Описание терминов GO

GO ID выбранного термина Список синонимов Список ближайших родительских терминов GO с указанием типа связи Список ближайших дочерних терминов GO с указанием типа связи
GO:0016020(мембрана) (граф) нет GO:0044464 (is a) GO:0042734(is a); GO:0060342(part of); GO:0005628 (is a);GO:0034045 (is a); GO:0034357 (is a); GO:0042175 (is a);GO:0048475 (is a); GO:0019867 (is a); GO:0005886 (is a);GO:0045211 (is a); GO:0044425 (part of); GO:0031090 (is a);
GO:0051454(увелечение внутриклеточного pH) (граф) cell pH elevation (увелечение внутриклеточного pH); cellular alkalinization (клеточное защелачивание); elevation of cellular pH (увелечение внутриклеточного pH); intracellular alkalinization (внутриклеточное защелачивание); pH elevation in cell (увелечение pH внутри клетки); GO:0051453 (is a);GO:0045852 (is a); нет
GO:0016831(карбокси-лиазная активность) (граф) decarboxylase activity (декарбоксилазная активность) GO:0016831 GO:0047432;GO:0034879;GO:0018790;GO:0034853;GO:0018802;GO:0018795;GO:0018791;GO:0018794;GO:0034524; GO:0008683; GO:0034913;GO:0047556;GO:0018793;GO:0033982;GO:0047431;GO:0008694;GO:0050410; GO:0034854;GO:0018796;GO:0018803; GO:0047575;GO:0018799;GO:0043722;GO:0050546; GO:0047437;GO:0043727;GO:0047435;GO:0018800; GO:0047596; GO:0047602; GO:0047605;GO:0050476; GO:0047613; GO:0004014;GO:0047662;GO:0047662;GO:0008792;GO:0004058;GO:0047436;GO:0004068; GO:0047688;GO:0050695;GO:0018792;GO:0047433;GO:0047729;GO:0033981;GO:0047842;GO:0033983;GO:0008836;GO:0010298;GO:0047858; GO:0034782;GO:0004163;GO:0018798;GO:0008488;GO:0047923;GO:0018801;GO:0004351;GO:0004398;GO:0047990;GO:0047997;GO:0004425; GO:0047434;GO:0008923;GO:0034952;GO:0050080;GO:0050095;GO:0004492;GO:0050150;GO:0004586;GO:0004590;GO:0050159; GO:0046564;GO:0008948;GO:0008949;GO:0050167;GO:0034923;GO:0050174;GO:0050177;GO:0004609;GO:0004611;GO:0033980; GO:0004633;GO:0004638;GO:0050223;GO:0034941;GO:0004737;GO:0016984;GO:0050296;GO:0004782;GO:0050545;GO:0050319;GO:0009028; GO:0034947;GO:0048472;GO:0004837;GO:0050374;GO:0048040;GO:0050382;GO:0004853;GO:0050390;(is a) - для всех
II. Оценка качества функциональной аннотации белков в UniProt
Русское название:Орангутан;
Английский вариант:Orangutan;
Латинское название:Pongo;
Taxonomy ID (NCBI): 9599;
Rank: genus (род);
Индексирование поля ProteinExistence БД UniProt:
1: Evidence at protein level (доказательство существования белка)
2: Evidence at transcript level (доказательство существования транскрипта)
3: Inferred from homology (выведен через гомологичность)
4: Predicted (предсказанные по-другому)
5: Uncertain (существование под вопросом)

Соотношение между реальными и гипотетическими белками из Орангутана(по данным UniProt)

  Количество в UniProt
Существование белка доказано экспериментально 9
Известны только соответствующие транскрипты 3776
Гипотетический белок, предсказан по гомологии 506
Иные предсказанные гипотетические белки 821
Наибольшее количество белков обнаружено по соответствующим транскриптам, на втором месте негомологические предсказания, на третьем предсказания, связанные с гомологией.

2. В SRS был выполнен следующий запрос (нет скобочной формы, т.к. выдача оказалась пустой):
Taxonomy: pongo;
ProteinExistence: 1:|2:;
DBxref_: GO:&P:&F:&C:&(EXP:|IDA:|IPI:|IMP:|IGI:|IEP:);
Запрос не дал результатов, из чего можно сделать вывод о том, что среди белко в Pongo, проаннотированных в UniProt нет
с экспериментально подтвержденной функцией, либо они не проаннотированны по всем трем словарям GO.

III. Использование GO для работы с массовыми данными

1. Получение выборки последовательностей белков с заданной функцией
Был проведен следующий запрос в SRS по БД UniProt (нет скобочной формы, т.к. выдача оказалась пустой):
DBxref_:GO:0008652
Taxonomy: Pongo
Данный запрос не дал никаких результатов. В этом запросе использовался на мой взгляд наиболее общий термин:
cellular amino acid biosynthetic process. На всякий случай я проверила и другие, но и эти запросы не увенчались успехом.
Тогда я решила проверить какие вообще белки из Орангутана имеют какое-либо отношение к амино кислотам и провела след. запрос:
Taxonomy: Pongo;
Description: amino acid;
Было выведено 10 белков, один из которых оказался серин/треонин киназой, а остальные транспортеры аминокислот.
Таким образом в UniProt не проаннотированно ни одного белка функционально связанного с биосинтезом аминокислот и пренадлежащего Орангутану.
Всего по данному термину GO проаннотированно 6959 белков, из них 6257 из бактерий, а в млекопитающих ни одного.

2. Определение главной функции в большом списке белков
Выдача программы GOStat на белки из файла P69908.txt
ID (GO)	P-Value
GO:0005886    7.03e-52
GO:0006536	2.9e-19
GO:0019544	7.02e-12
GO:0005515	6.49e-11
GO:0009064	1.73e-10
GO:0009065	2.66e-08
GO:0019752	8.05e-08
GO:0006082	9.54e-08
GO:0016639	1.47e-07
GO:0006527	2.09e-07
GO:0006537	8.47e-07
GO:0005624	1.85e-06
GO:0000267	2.05e-06
GO:0006520	7.39e-06
GO:0009308	7.39e-06
GO:0009063	9.03e-06
GO:0006519	9.33e-06
GO:0009310	9.33e-06
GO:0044270	9.33e-06
GO:0006807	3.36e-05
GO:0016638	5.21e-05
GO:0009056	6e-05
GO:0009084	6.52e-05
GO:0044248	8.76e-05
GO:0006525	0.000118
GO:0000051	0.000118
GO:0042995	0.000206
GO:0046942	0.000382
GO:0015849	0.000382
GO:0004351	0.000725
Среди данных терминов GO достоверными будет считать первые два, так как между вторым и третьим
наблюдается наибольший скачок p-value, что ставит под сомнение достоверность термина:GO:0019544.
GO:0005886 (plasma membrane) относится к онтологии: клеточный компонент.
GO:0006536 (glutamate metabolic process) относится к онтологии: биологический процесс.
В 11 из 30 терминах присутствует мой белок.
В основном это белки так или иначе связанные либо с биосинтезом аминокислот, либо с их транспортом.

©Мараховская Александра,2010