StarDrop 使用技巧之先导化合物选择
此项Case探索了在hit-to-lead项目中遇到的典型挑战。此Case的目的 是基于已有的初期活性筛选结果,鉴定出一个或多个高质量的化 合物,以便进行后期的体外和体内实验研究的推进。理想情况下, 用于后期项目推进的化合物不仅需要良好的活性,也需要有合适的ADME性质,才能 产生高质量的一系列先导物。
在此项练习中,我们会利用StarDrop的的一系列模块来探索已有的数据,从而挑选并设 计出有良好平衡性质的化合物。教程中使用到的每个StarDrop模块均提供步骤指导,以 及软件界面图和可能生成的计算结果。如果你对教程有任何问题和疑惑,请随时联系 support-cadd@cloudscientific.com。
•在StarDrop中,选择Menu→File→Open,打开Neurokinin2.sdproj。
你会看到一个数据表格和直方图。数据表格中包含了191个化合物结构及测定的 Neurokinin2受体亲和力数值(表头是NK2 pKi)。
通过创建包含直方图和化学空间分布图的dashboard,我们可以分析此数据库中化合物 基于化学多样性的活性分布。
•在底部的Visualisation区域,点击 Detach 将直方图复制到新的dashboard 上。
•点击底部的Chart按钮,从菜单中选择 Chemical Space 化学空间图。
•点击 Visualisation 区域底部的 Create 按钮,打开 Create Chemical Space 对话框,在此对 话框里,我们可以定义一个新 的化学空间图。
•在Name区域将化学空间命名为 Neurokinin2 Space。
根据化学结构或化合物性质数据, 我们能够构建不同类型的化学空间 图,但在此教程中,我们会使用默 认设置来构建化学空间图:Chemical Structure,Visual Clustering方法和 2D。详细设 置如上图所示。
•点击 OK 按钮,软件会构建化学空间图,并且在Visualisation区域展示出来。
化学空间图的每个点均对应数据集中的某一个化合物。将鼠标停留在某个点上,会展 示此化合物的结构。选择数据集中的一列化合物会选中化学空间图所对应的点,反之 亦然。想要查看化学空间图中的pKi值分布,我们需要改变空间图的格式。
•点击Visualisation区域右下角的Format按钮 出现Format Plot Area对话框。
•使用下拉菜单,以NK2 pKi值进行Colour by着色。
pKi值最高的化合物会被标记成黄色,最低 的则被标记成红色。你可以通过点击颜色 条来改变颜色。注意,当你改变格式选项 时,图表也会实时更新为修改后的格式。
•点击Close按钮关闭格式对话框。
•将修改后的化 学空间图加入dashboard之中。
你可以改变Dashboard窗口的大小,也可以拖动图表和空白部分来重新组织Dashboard。 点击图表右下角的小箭头会出现所有的控制按钮,你可以利用控制按钮改变图表的格式。
从图中可以发现,pKi值最高(黄色)的化合物大部分来源于化学空间中的的某一处。
•为了证实这点,点击右侧直方图中pKi值最高的数据柱。
化学空间中活性最高的化合物会被高亮,数据集的数据也如此。此部分化学空间可能是选择化合物的最佳区域,但我们还应该考虑其他高质量先导化合物应具备的性质。
(你可以将dashboard窗口最小化)。我们没有其他的测量数据,但可以为化合物预测 一些ADME性质和理化性质。
•点击切换至Models选项卡。
•选择所有的StarDrop模型,直接点击StarDrop选项框。
•点击Models区域底部的 按钮。进度条显示预测正在进行中。
当预测过程完成时,每个计算出的性质都会被添加到数据集的新一列中。因为数据集 的大小和数据的复杂性,想要从中选择最具平衡性质的化合物很具挑战。因此,我们 将利用StarDrop中的方法进行多参数优化(又叫Probabilistic Scoring)来更方便地评估此 项信息。
•点击切换到Scoring选项卡。
打分文件定义了一系列项目中重要性质的评分标准。StarDrop中提供了一些打分文件示 例供用户参考。在此工程文件中,我们也内置了一个适合Neurokinin2项目的打分文件 NK2 Project,用于此项目打分。
一个打分文件包含了一系列理化性质及评分标准,并描述了理想数值和相对重要性。 在这个打份文件中,我们期望找到的化合物需要具有良好的Neurokinin2亲和力,并适 合作用于外周靶标。
•按钮来运行打分。
数据集中增加了一列数据,包含每个化合物的打分,同时考虑打分文件中每个性质的 评判标准和相对重要性,以及实验数据和预测数据的偏差。打分值介于0到1之间,代 表化合物满足所有打分文件中性质要求的可能性。
•为了寻找打分最高的化合 物,右键点击打分列表 头,并从Sort菜单中选择 Descending,将数据集从 高到低降序排列。
每个表格中均有一个直方图,给出化合物各项性质对打分影响的概况。向下滚动数据 集,打分随之变低,直方图中较短的数据柱表示某些性质没有达到项目打分文件的要 求,并同时考虑数据的置信度和每个性质的重要性。
点击左下角Chat,选择蛇形图Snake,根据Scoring Profile 进行排序打分:
•蛇形图展示了从高到低降序排列的化合物(X轴) 的打分值(Y轴)。每个打分由 于数据导致的不确定性,在每个打分点之上以error bar展示。
蛇形图中的前30个化合物无法和打分最高的化合物明确地区分(打分最高化合物的 error bar和大概前30个化合物的error bar重合)。
通过此方式,我们在除了考虑活性以外,还综合考虑了其各类成药性,从而选择出了活性好并且成药性优良的先导化合物。