Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~kut/term4/practice5.html
Дата изменения: Wed Apr 4 09:31:32 2007
Дата индексирования: Tue Oct 2 08:03:12 2012
Кодировка: Windows-1251
Practice 5

Функции генов и их продуктов. Онтологии, GO.

1)Поиск нужного термина в словарях GO.

Заданное мне описание локализации белка - хромосома.
Выбранный термин GO - chromosome, его идентификатор - GO:0005694.
Название онтологии GO - cellular component, его перевод на русский - клеточный компонент.
Определение термина:
A structure composed of a very long molecule of DNA and associated proteins (e.g. histones) that carries hereditary information.
[source: ISBN:0198547684]
Перевод на русский:
Структура, состоящая из очень длинной молекулы ДНК и связанных с ней белков (например гистонов), которая является носителем наследственной информации.
[источник: ISBN:0198547684]

2)Описание функции регулятора ответа клетки на никель NIKR_ECOLI с помощью GOA .

  Онтология GO (имя) Количество ассоциированных терминов GO Краткий ответ на вопрос
Где? component 0 -
Зачем, для чего? process 2 Транскрипция. Регуляция транскрипции, ДНК-зависимая (2 ссылки).
Молекулярный механизм? function 4 Связывание ДНК. Активность факторов транскрипции. Связывание белка (2 ссылки). Связывание иона метала.
Специфичность? function 1 Связывание иона никеля (2 ссылки).

3)Создание больших выборок белков с определенными функциями (поиск по идентификаторам GO в БД UniProt с помощью SRS).

Протеом Arabidopsis thaliana. Результаты поиска в UniProt, 21.03.2007
  Количество записей Запрос
Всего 50196 (([uniprot-Organism:Arabidopsis*] & [uniprot-Organism:thaliana*]) | [uniprot-Organism:Arabidopsis thaliana*])
С идентификаторами всех 3-х онтологий GO 5646 ((((([uniprot-Organism:Arabidopsis*] & [uniprot-Organism:thaliana*]) | [uniprot-Organism:Arabidopsis thaliana*]) & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*])
В том числе в хромосоме 43 ((([uniprot-Organism:Arabidopsis*] & [uniprot-Organism:thaliana*]) | [uniprot-Organism:Arabidopsis thaliana*]) & ((([uniprot-DBxref_:C:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:GO:0005694*]))
В том числе только с самыми хорошими доказательствами функции (коды только IDA или TAS) 0 (((([uniprot-Organism:Arabidopsis*] & [uniprot-Organism:thaliana*]) | [uniprot-Organism:Arabidopsis thaliana*]) & ((([uniprot-DBxref_:GO:0005694*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:C:*])) & ((((((((((([uniprot-DBxref_:IDA:*] | [uniprot-DBxref_:TAS:*]) ! [uniprot-DBxref_:IMP*]) ! [uniprot-DBxref_:IGI*]) ! [uniprot-DBxref_:IPI*]) ! [uniprot-DBxref_:RCA*]) ! [uniprot-DBxref_:ISS*]) ! [uniprot-DBxref_:IEP*]) ! [uniprot-DBxref_:NAS*]) ! [uniprot-DBxref_:IEA*]) ! [uniprot-DBxref_:IC*]) ! [uniprot-DBxref_:ND*]))
В том числе те, у которых встречается хотя бы один раз самое хорошее доказательство функции (коды только IDA или TAS) 0 (((([uniprot-Organism:Arabidopsis*] & [uniprot-Organism:thaliana*]) | [uniprot-Organism:Arabidopsis thaliana*]) & ((([uniprot-DBxref_:GO:0005694*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:C:*])) & ([uniprot-DBxref_:IDA*] | [uniprot-DBxref_:TAS*]))

Как видно из таблицы, только 11 процентов записей, относящихся к Arabidopsis thaliana имеют три идентификатора GO, тоесть для них определены ответы на вопросы "Где?" и "Для чего", а так же их моллекулярный механизм. Так же примечательно, что у Arabidopsis thaliana нет ни одной записи, у которой встречалось бы хоть один раз самое хорошее доказательство функции (коды только IDA или TAS) для белков, локализованных в хромосоме и имеющих три идентификатора GO.

Дополнительные упражнения

Описание связей между терминами в онтологиях GO.

Связь типа "is a":
Protein binding (связывание белка) - частный случай binding (связывание).


Cвязь типа "part of":
Regulation of cellular metabolic process (регуляция клеточного метаболлического процесса) - часть cellular metabolic process (клеточного метаболического процесса), но клеточный метаболический процесс не обязательно содержит регуляцию.

Описание функции белка в БД EcoCyc.

Данные EcoCyc:

  Онтология GO (имя) Количество ассоциированных терминов GO Краткий ответ на вопрос
Где? component 1 Цитоплазма
Зачем, для чего? process 1 Транскрипция.
Молекулярный механизм? function 1 Активность транскрипционного репресора.

Также в EcoCyc содержится следующая информация о моем белке: синонимичные названия, подробное описание функций белка, ссылка на ген, длина белка, его молекулярная масса, ссылки на Uniprot, PDB, PFAM, MODBASE и статьи в PubMed, указана реакция (NikR + Ni = NikR-Ni transcriptional repressor).



На главную страницу четвертого семестра

На главную страницу


©Белошистов Роман