咨询信息

我们的产品覆盖了化学信息学,生物信息学,以及实验室信息管理
针对您的研究需求

我们为您选择最适合您的产品
上传时间:2016-08-22 15:11:06
ChemCurator应用案例:从化学文献中提取化合物信息

化学或者制药行业的研发人员,经常要长篇累牍的阅读化学期刊或者专利文献。文献中有很多有价值的化合物及相关信息(如理化性质、生物活性数据等),需要提取出来进行分析和研究。但是提取这些信息是个十分艰难的过程。很多研发人员会借助一些化学领域的专业数据库,如Reaxys或者Scifinder,从中查找所需的文献和相关的数据。但是很多时候这些数据库并没有十分完整的提取到我们所需的数据,有时候从文献中自行提取化学结构和相关数据是无法避免的工作。
人工从文献中提取化学结构是费时费事的工作,一篇专利文献中经常包含有几百个化学结构。为了支持这个艰难的过程,ChemAxon 以Chemical Naming (Name to Structure)技术为基础开发了ChemCurator,按照我们从文献中提取关键信息的常规流程来对化学文献进行处理。
下面我们通过一个具体的实例来了解ChemCurator的具体工作流程。
 
1,首先我们将一篇需要处理的文献导入ChemCurator进行注解。 


Chemcurator会在文献导入的过程中对文献进行注解,将文献中所有的化合物名称和化学结构高亮显示出来。当鼠标点中某个高亮区域时,它所对应的化学结构就会在下方的对话框中显示出来。如下图所示,”3-(2-(methoxycarbonyl)acetylamino)pyridine-4-carboxylic acid “这样的IUPAC系统命名,或者”tyrosine”这样的化合物通用名,都能够被标记出来,对应的化学结构也能够在被鼠标点中时显示出来。

而文献中原本是图片格式的化学结构,也会被转化为可编辑的化学结构。


2,然后我们将注解出来的化合物提取到化合物列表中。
我们可以建立一个化合物列表,然后手动将所需的化合物拖放到化合物列表中。

另外我们也可以通过结构检索的方式将化学结构批量提取到列表中。例如我们通过如下的子结构进行提问,将所有包含此子结构的化合物都提取到列表中。

这样我们一次便提取了40个化学结构出来。


3,接下来我们可以对化合物的相关数据进行提取。
化合物列表中提取出来的化合物,是跟原始文献对应的文本(或者图片)直接关联的。点击列表中的某个化合物记录,左侧的文献窗口便会自动跳转到这个化合物被提取出来的位置。这样我们可以很方便的找到这个化合物上下文中是否有相关的理化性质或者生物活性数据。

然后我们可以在化合物列表中添加几个新的列,从原文中以复制、粘贴的方式将相关的数据提取到列表中。

4,最后我们可以将提取出来的化合物及相关数据进行共享。
共享的方式有多种。首先我们可以通过ChemCurator服务器将已经处理好的文献进行发布,其他的用户便可以下载此文献,查看提取出来的化合物和数据。
另外我们可以将提取的化合物和数据直接存入化合物数据库(如Instant JChem数据库)中进行共享。这样在研发人员阅读文献的过程中,处理过的文献数据便会在数据库中累积起来,同机构的研发人员可以随时以各种检索方式查询其中的化合物和数据,来支持构效关系分析和化合物设计的工作。

关于ChemAxon

ChemAxon公司是先进的化学信息学技术提供商,为生命科学以及其他R&D领域提供充分挖掘化学信息价值的化学信息学软件平台、应用和服务,业务领域也拓展到生物信息学。总部设在匈牙利布达佩斯,在美国设有办公室。

关于康昱盛信息科技有限公司

康昱盛是ChemAxon在中国地区的合作伙伴,为中国地区的客户提供ChemAxon软件的实施、开发以及技术支持服务。