咨询信息

我们的产品覆盖了化学信息学,生物信息学,以及实验室信息管理
针对您的研究需求

我们为您选择最适合您的产品
上传时间:2019-01-31 14:38:44
Sarah是一款基于统计学模型的化合物致突变性预测工具。此项目是与FDA合作进行的,原始数据由FDA提供。其目标是确认潜在遗传毒性杂质,以满足ICH M7建议指导原则。Sarah使用独一无二、高度透明的机器学习算法,从Ames突变实验数据出发,构建统计模型。这种算法使用了一种新颖的、自组织分级网络来训练模型。它通过碎片化输入结构使得模型具有更高的透明度,更易诠释预测结果,从而方便专家审核,以满足ICH M7指导原则要求。
  • 产品特性
  • 产品演示
  • 常见问题
  • Sarah采用的层级网络模型,不仅可以搜索匹配片段,还可以通过使用与目标化合物结构最相似的结构来优化结果。此方法保留那些可能具有更高毒性的片段,片段可以是各种大小,并且允许结构重叠,确保更高的预测精确度。Sarah总的预测结果来源每个假设片段对于阳性和阴性的贡献的总和,突出显示模型认为有意义的片段来实现预测结果的结构解释,给出的结果也会包含非常详细的信息,包括定义的毒性终点、应用域、相关示例化合物等(如下图所示)


    Sarah特性和优点
    ICH M7指导原则认可
    Sarah的预测结果能被执行ICH M7指导原则的监管机构认可。软件中M7预测能够让您同时使用Sarah和Derek对杂质的致突变性进行基于专家知识规则和基于统计学模型的预测,使得操作非常简便快捷。

    快速地致突变性评价
    Sarah能够极其快速地进行单个或多个的化合物致突变性预测。

    可扩展的化合物预测空间
    “Out of Domain”代表超过模型的预测能力,出现这种预测结果往往无法做进一步判断,使得毒理专家无法做出准确合理的决策。Sarah海量的、并且高质量的训练集能够保证最大程度地涵盖化学结构空间,尽量避免出现超出模型预测范围的情况。同时用户可以加入自己私有的训练集,极大地拓展了可预测的化学结构空间。

    极高的预测准确性
    Sarah已经经过大量的准确性验证,包括在私有未公开的数据集中进行验证,已经被证实有极佳的性能和准确度(Barber et al.2015)。

    可靠的数据来源
    Sarah是构建在海量的高质量数据上的,其后台数据是经过Lhasa的毒理专家审批的、高度可信的,并且去除了不一致性数据。因此您可以完全相信Sarah后台的可靠性和准确性。

    高透明度的预测
    Sarah的预测结果被清晰地展示,并且给出该预测的置信度打分。可能引起致突变性的怀疑片段被清晰地列出来,并且包含该片段的示例化合物按照与查询化合物的结构相似性进行排序展示。这样高透明度的预测能够更好地支持专家综合评判和审批。

    丰富的支持信息
    为了辅助专家审评,Sarah还包含了一些额外的数据,包括菌株信息,以及一些没有包含在模型和参考文献中的相似化合物。这个额外的信息无论是单个化合物预测,还是批量预测,或者批量验证中都有。

    预测参数控制
    Sarah已经有一套默认的预测参数,从而控制预测的敏感性和特异性,这套参数已经被证实是有极好的平衡性,可以用于满足ICH M7指导原则。当然,用户可以自行修改预测参数选项以满足特定的需求。

    一个界面,多种预测
    过Nexus用户可以在同一个界面下,方便和其它工具进行联用,比如代谢预测工具Meteor Nexus、毒理数据库Vitic Nexus以及基于专家知识规则的毒性预测工具Derek,很好地提高了用户效率。

    定制化报告
    Sarah整合一套先进的报告生成框架,您可以将结果导出成.doc, .pdf, .xlsx或者.sdf的文件格式。用户可以自定义报告模板,确保您再正确的时间展示合适的信息。

    自动杂质等级分类
    通过Nexus的Derek和Sarah联合预测可以直接得出ICH M7的杂质致突变性风险等级分类。同时可以获得相关的预测细节及预测的支持信息包括相似化合物的毒理实验信息、相关文献、推理过程等等。