Занятие 4. Функции генов и их продуктов. Онтологии, GO
- Общее знакомство со структурой GO
Выберите одно из ключевых слов в документе UniProt, соответствующим Вашему
белку. (Ключевое слово может состоять из 2-х слов).
Выбирайте наиболее интересные, наиболее подробно описывающие функцию Вашего
белка.
На главном сайте консорциума GO, http://www.geneontology.org,
проведите поиск выбранного термина среди терминов GO.
Результаты опишите на HTML-страничке по следующему плану:
Результаты упражнения 1
- Термин (по-русски и по-английски)
- Идентификатор GO как гиперссылка на страничку с результатом
- Количество синонимов.
- Определение термина (в переводе на русский)
- Количество родителей (отдельно указать число связей is_a и part_of)
- Количество дочерних терминов (отдельно указать число связей is_a
и part_of)
Поясните на конкретных примерах из полученного Вами графа, чем отличаются
связи типа is_a и типа part_of , см.
подсказку
При выполнении п.п. 56 советуем посмотреть на изображение графа.
Если число связей явно больше 5, можно их не считать, а указать">5"
- Создание выборок белков с определенными функциями
(поиск по идентификаторам GO в БД UniProt с помощью SRS)
Сначала потренируйтесь в поиске!
Отработайте структуру запроса
составьте 1 запрос в SRS для того, чтобы получить сразу 3 документа P15650,
P70618 и P51650.
Определите, в каком поле написаны идентификаторы GO.
Посмотрите, как в SRS проиндексированы
разные онтологии и разные способы аннотации функций.
Для самопроверки попробуйте найти среди 3-х указанных белков
- митохондриальные белки
- ядерные белки
- белки с самым низким качеством аннотации (все термины присвоены по ISS)
Если Вы довольны результатами, то приступайте к основному и зачетному заданию.
Зачетное задание
Ваша задача исследовать качество аннотации функции у конкретной
группы белков заданного организма.
Отчет представить в виде таблицы вида (HTML-формат) и краткого комментария (1-2
фразы).
Протеом .................... Результаты поиска в UniProt, хх.хх.2006 г.
|
Количество белков |
Запрос |
Всего |
|
|
С идентификаторами всех 3-х онтологий GO |
|
|
В том числе (укажите Вашу группу) |
|
|
В том числе только с самыми хорошими доказательствами функции |
|
|
В том числе только с самыми плохими доказательствами функции |
|
|
В этом задании Вы можете руководствоваться общепринятой
иерархией кодов доказательств, а можете предложить свою иерархию, но только
с обоснованием, см. подробная
расшифровка кодов.
Отчет желательно украсить изображением заданного организма, для этого проведите
поиск среди общих описаний геномных проектов на сайте NCBI.
- Дополнительно на бонусные баллы
Опишите функцию Вашего белка, используя ресурсы
EcoCyc. Не забудьте ответить
на главные вопросы: где, для чего, что и с чем делает.