|
EXProt a database for proteins
with an experimentally verified function |
Авторы проекта
Bjorn M. Ursing и Frank H.J. van Enckevort.
Общие сведения
EXProt новая не излишняя база данных, содержащая белковые последовательности у
которых функция экспериментально доказана. EXProt, Release 2.01 - содержит 6491
записей, составленных из Pseudomonas Community Annotation Project, E. coli
genome и proteome базы данных и из прокариотического отдела EMBL Nucleotide
Sequence Database.
Все записи в EXProt имеют уникальный ID и содержат информации о
организме, белковой последовательности, описание функции, ссылку на и
сходную базу данных и, если известно, название гена и ссылки на PubMed.
Составлена
В EXProt представляет собой коллекцию данных из других источников. Авторы не оценивали
достоверность исходных данных. Для проверки изучались абстракты соответствующих
статей (около 200,60% из них имели соответствующие заметки).
В данной белковой базе данных информация о том, как функция
определена/предсказана для специфического ORF не всегда присутствует.
Согласно статьям авторов, в основном поиск осуществлялся по полю
FT '/evidence=EXPERIMENTAL' в записях банка EMBL, имеющих поле CDS.
Нет прямых ссылок на биохимический эксперимент, подтверждающий функцию белка.
Авторы признают, что '/evidence=EXPERIMENTAL' может означать что
угодно: от сайтов связывания рибосом и сплайсинга, до кодирующей последовательности.
Организация, предоставляющая данный сервис
Centre for Molecular and Biomolecular Informatics
Radboud University
Стартовая страница
На главной странице ресурсы кратко написано о данной базе данных. Даны
ссылки на проекты, данные которых включены в базу данных или
вскоре будут включены. По ссылкам можно перейти на соответствующий
поисковай ресурс (BLAST, FASTA, SRS6 at CMBI). Ссылка ftp приводит на
папку с файлом данных EXProt. Дан контактный e-mail. Приведен
список литературы с соответствующими ссылками.
Поисковый инструмент
Написано, что поиск по EXProt может проводится с помощью BLAST или FASTA.
Оба алгоритма осуществлены на сервере Centre for Molecular and
Biomolecular Informatics. Сервис BLAST на сервере не работает и
по всей видимости работать не будет (The public BLAST server at
CMBI has been discontinued). Ссылка на предложенную альтернативу
приводит на несуществующую страницу.
Сервис FASTA открывается, но
при попытке поиска, страница не отображается (при любых параметрах).
Сервис не работает.
На главной странице написано, что возможен поиск по базе данных
с помощь SRS6 на CMBI. Ссылка приводит на страницу, написанную
не на английском языке без каких-либо поисковых средств. Ссылка
со страницы FASTA на SRS6 на CMBI не работает.
Степень заполнения базы
Недостаточная - всего 6491 записей.
Тестовый запрос
Из-за неработоспособности всех поисковых средств, на которые
ссылается база данных, осуществить его не удалось.
Польза базы данных
Одним из направлений биоинформатики является аннотация последовательностей,
полученных чтением открытых рамок. В данном случае сравнение предположительных
полипептидов производится с белками, чьи функции установлены экспериментальным
путем. Существавание такой базы данных облегчило бы анотирование аминокислотных
последовательностей.
Мнение о базе данных
Очень хорошая идея создать такую базу данных. Но она проведена
не очень успешно. База данных не обладает работоспособным поисковым
инструментом. Без поиска любой ресурс такого рода бесполезен.
Спасает этот проект только ссылка (рабочая!) на файл данных, который
представляет собой записи из EMBL. Поэтому возможно самостоятельное создание
индексных файлов и поиск с помощью BLAST.
© Тихонов Максим, Снегирев Александр, 2006
|