Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~Melli/term4/database.html
Дата изменения: Tue May 30 15:57:22 2006 Дата индексирования: Tue Oct 2 08:41:36 2012 Кодировка: Windows-1251 |
Анализ базы данных Secreted protein database (SPD)
Стартовая страница содержит такие разделы как:
Browse - позволяет искать белки в соответствии с положением в хромосоме или функциональной классификации.
Search - поиск белков по ID, ключевым словам, описанию или последовательности.
Download - позволяет загрузить различную информацию о белках . Есть несколько файлов. Например, spd.all.gz содержит все последовательности в fasta-формате, также в нем содержатся ID белков, если есть, то описание, видовая принадлежность, длина и т.д. spd.classes.domain.gz - файл, содержащий название белка, доменная структура (перечисление доменов), тип белка по их классификации.
Data statistics - статистические данные, представлена информация о том, в какой БД сколько содержится описанных белков в данном виде.
Help - ответы на наиболее часто задаваемые вопросы по БД.
Publication - в этом разделе представлены различные статьи, так или иначе связанные с БД (о самой БД,статьи, из которых берется информация и т.д.)
На стартовой странице имеется быстрый поиск для нахождения секретируемых белков или групп этих белков. В окно поиска можно написать название группы белков, ID номер, AC номер, вид организма, в котором найден этот белок или описание этого белка.
Страница поиска содержит несколько полей:
- Search terms:как оказалось, просто термин, по которому ведется поиск (это может быть и ID, и описание, и AC);
- Species: человек, крыса, мышь или все;
- Protein length: различают последовательности меньше 30, 30-100, 100-500, 500-1000, больше 1000 а.о. и любой длины.
- Source: к какой БД ищется белок - Swiss-Prot, Refseq, Ensembl, Trembl, все.
- Также можно искать по fasta-последовательности.
Чтобы изучить возможности этого ресурса, мы решили найти все фосфолипазы А2,
длина которых 100-500.
Запрос выглядел так: Search terms:PLA2; Protein length: 100;500; Species:Human
Выдались ссылки на файлы и описание находок.
Если нажать на названия нужного белка, то можно узнать его название, длину,
источник, даются ссылки на описание этого белка в различных БД.
Результат можно посмотреть по этой ссылке
Эта база данных составлена экспертами. Мы считаем, что такая БД могла бы быть полезной, но количество информации в ней явно не хватает, можно добавить данные по другим организмам кроме имеющихся. Эта база данных либо заброшена, либо очень редко обновляется, так как последнее обновление было сделано 30 ноября 2004 года, что, как мы считаем, очень давно, так как данная наука сейчас очень быстро развивается и за последнее время появилось много новой информации.
БД содержит описания около 18000 секреторных белков. Тут представленна в виде ссылок почти вся информация об этих белках. По идее, ресурс должен быть довольно мощным, но из-за странного интерфейса, странной системе поискаи использования непонятных терминов, кажется, что гораздо легче найти все это через SRS. И полученной информации будет не меньше, и удобнее все это понять и воспринять. В целом, единственная необычная опция - посмотреть какой белок находится в определенной позиции какой-нибудь хромосомы. Этого в SRS нет.
© Yuminova Alina aka Melli, 2006