|
[ На предыдущий раздел]
2.2. Регистр химических структур
Химическая структура (ХС), не являясь материальным объектом, является элементом формализованного представления молекулярного строения объектов материальной химии, прежде всего выделяемых и синтезируемых химических веществ, продуктов, материалов и композиций. Существующие в настоящее время форматы молекулярных данных основаны на той или иной вариации представления ХС в виде графа. В рамках созданного регистра определение форматов записей ХС задается таблицами ( рис. 5) 'Элементы данных ХС' и 'Форматы представления ХС'.
Основанием для регистрации ХС является запись кода ее формализованного представления в таблице 'ХИО - ХС'. Дополнительные вычисляемые атрибуты - короткий хэш-код и код молекулярных дескрипторов - служат для повышения эффективности доступа к химико-структурным данным.
Реализованный в регистре формат кода ХС предусматривает регистрацию в этой таблице как традиционных молекулярных объектов, так и обобщенных ХС. Формат хранения Маркуш-структур соответствует стандартам MDL, предусматривающим внедрение линейного кода записи определений как отдельных радикалов, так и условий, налагаемых на структуру в целом. Обобщенная ХС, например, задаваемая формулой Маркуша, рассматривается как условие запроса/объявления (например, патента) на определяемую выборку и/или класс ХС. Для целей дополнительного учета таких ХС в регистре выделяется отдельная таблица 'Классы ХС /Формулы Маркуша'.
Для унифицированного представления элементов ХС, формирования англо-русских систематических названий регистрируемых химических веществ в регистре предусмотрена отдельная таблица определения различных типов структурных фрагментов. Стандартные типы фрагментов отвечают различным задачам установления структурно-подструктурного соответствия:
- по фрагментам структуры (возможные заместители фрагмента - любые);
- по обязательной (не варьируемой) части формулы Маркуша (только заместители по местам посадки радикалов - любые);
- по радикалам-заместителям (только заместители по местам присоединения радикала к ХС - любые).
Поиск-регистрация химических структур является ключевым этапом в распознавании и регистрации других ХИО в области материальной химии. Эта процедура включает следующие операции:
- экстракция химико-структурных данных в идентифицируемых форматах представления ХС и/или их формализация в рамках редактора структурных данных, включенного в программные средства пользовательского интерфейса БД регистров;
- определение кодов (массивов индексов) фрагментов ХС, вычисление кодов генерируемых дескрипторов ХС и хэш-кода;
- фильтрация ХС, установление структурного соответствия, а при необходимости и автоматизированный и/или ручной сопоставительный контроль качества графического (координатного) представления и стереодескрипторов совпадающих ХС;
- нахождение заданной ХС, обновление или создание новой записи ХС с обновлением или созданием релевантных записей в таблицах определений элементов данных, форматов и структурных фрагментов ХС;
- для обобщенного ХС - создание новой записи в соответствующей таблице.
Для всех зарегистрированных ХС устанавливается соотношение 'обобщенные ХС - ХС' - разметка регистра ХС путем генерации соответствующих записей в таблице 'Маркуш-классы - ХС'. Введение процедуры автоматической разметки БД регистра ХС позволяет на ее основе наиболее полно формализовать и использовать информацию по обобщенным соединениям в патентных и научно-методических документах как для решения задач поиска/классификации, так и восстановления пропущенных данных, верификации и синтеза информации.
Концептуальной основой создания регистра ХС, с одной стороны, явилось формирование определений для создания регистров других ХИО в области материальной и реакционной химии. С другой стороны, разработанный прототип регистра ХС имеет самостоятельное значение как для фундаментальных исследований в области химии, так и для прикладных информационно-аналитических и патентных исследований.
[ На следующий раздел] [На Содержание]
Copyright ї
|
|
|