|
Эта работа посвящена банку данных MedLine и системе работы
с ним PubMed. Medline - это сокращение от MEDlars onLINE. MEDLARS (MEDical
Literature Analysis and Retrieval System). Национальная медицинская библиотека США. Это самая крупная база данных
опубликованной медицинской информации в мире, охватывающая около 75 процентов
всех мировых изданий.Легкость получения нужной
информации
достигается при помощи индексирования, когда к любой записи можно
обратиться, основываясь на содержащейся в ней информации. Каждая запись
разделена на категории, называемые полями, которые содержат различные
виды данных.
Для Medline примерами полей могут быть название журнала, автор статьи,
заголовок, номер страницы, и т.п.
Все журнальные в Medline
проиндексированы по определенным ключевым словам или терминам, которые
включены в специальный словарь под названием "Medical Subject Headings"
(MESH). Использование такого подхода обеспечивает однообразие и
преемственность в иерархической структуризации биомедицинской литературы.
Термины MESH и древовидная структура их взаимоотношений пересматриваются
ежегодно. Подробней про MESH можно узнать на специальной странице
http://www.nlm.nih.gov/mesh/meshhome.html
Это активно используется системой PubMed.
По умолчанию, система автоматически производит так называемое картирование
терминов. Оно заключается в том, что сопоставляются термины введенные
пользователем со стандартными терминами из четырех справочников Medline:
индексом MESH, базой названий журналов, индексом фраз и авторов.
В том числе, например, система находит термин соответствующий указанному
разговорному названию и ищет его тоже.
Хотя кроме PubMed есть и другие системы для работы с этим банком данных,
PubMed разрабатывается в NCBI с целью создания интегрированного
доступа не только к MEDLINE, но и к ресурсам, предоставляемым издателями
журналов, цитируемых в MEDLINE. Кроме этого, PubMed предоставляет доступ
к тем же молекулярно-биологическим базам данных, что и Entrez.
Итак, используем
поисковую систему PubMed для выполнения некоторых задач.
-
Найдем ссылки на статьи, в которых упоминается полное название
выданного мне белка
белка.
Название белка - ybeY E.coli
Количество найденных статей - 1
Примечание: система проедлагает заменить прописные буквы на строчные,
и по-другому пишется название бактерии, так что поиск велся по запросу
"ybey e coli"
Примечание: эта статья упоминалась в документе из банка UniProt с описанием
белка, причем это последняя из указаных публикаций:
RX PubMed=16511207; DOI=10.1107/S1744309105031131;
RA Zhan C., Fedorov E.V., Shi W., Ramagopal U.A., Thirumuruhan R.,
RA Manjasetty B.A., Almo S.C., Fiser A., Chance M.R., Fedorov A.A.;
RT "The ybeY protein from Escherichia coli is a metalloprotein.";
RL Acta Crystallogr. F 61:959-963(2005).
А остальные две статьи, хоть и присутствуют в банке, не посвящены
непосредственно этому белку (хоть он в них и упоминается), а потому
и не были найдены.
-
Результат этого поиска сохранены в виде текста в файле
query1.txt
-
Выбрать из списка найденных статей одну было не сложно, благо выбор не
слишком велик. Аннотация этой статьи сохранена в файле
abstract.txt
Чтобы найти все публикации автора, я просто перешла по ссылке, кликнув на его
фамилии в списке. Всего у А.А. Федорова нашлось 130 публикаций (возможно
такое имя
и инициалы были не у одного человека). Затем к запросу добавим ограничение
по времени в три года с помощью закладки limits
и число статей сократилось до 31. Конечный результат поиска сохранен
в файле
query2.txt
-
Поищем ссылки на статьи об опоясывающем лишае (shingles). Первая страница
результатов поиска в виде последовательных аннотаций сохранена в файле
query3.txt
В него вошли аннотаци к первым 20-ти статьям, хотя всего было найдено
8267 публикаций.
Примечание: "разговорное" название "shingles" PubMed распознает как
("herpes zoster"[TIAB] NOT Medline[SB]) OR "herpes zoster"[MeSH Terms]
OR shingles[Text Word]
То есть эта система сама подбирает к общеупотребительному названию медицинский
термин, включая в поиск слова herpes zoster.
-
дополнительные задания
|