时间: 2026年06月25日(周四)
在AI制药快速发展的今天,真正制约新药研发与模型训练的,早已不是“有没有数据”,而是数据是否高质量、是否标准化、是否可直接用于建模。
公共数据库虽然丰富,但往往存在来源分散、格式不一、噪声偏高等问题。研发人员需要投入大量时间清洗、整理和统一构效关系(SAR)数据,不仅增加了工作负担,也在很大程度上拖慢了先导化合物筛选、ADMET评估和分子设计的进程。
基于这一行业痛点,我们将于6月25日举办在线讲座:
“GOSTAR加速AI驱动的药物研发:高质量SAR数据提升模型性能”
本次分享将围绕GOSTAR小分子化合物SAR数据库展开。作为由专家人工策展的小分子SAR数据库,GOSTAR通过对文献与专利数据进行系统提取、整合与校验,构建出高质量、标准化、适用于AI/ML建模的SAR数据集。届时,我们也将结合多个benchmark数据集进行横向对比,直观展示精细化策展数据在药物研发与算法建模中的实际价值。
在本次讲座中,Xander Wei将和大家一起探讨药物研发过程中常见的数据挑战,分享Excelra在文献与专利数据提取、整合方面的创新技术,并演示GOSTAR精选数据如何为药物发现项目提供全面、高质量的SAR支持。同时,也将通过AI/ML驱动的药物设计案例,展示数据质量如何真正推动制药与生物技术创新提速。
您将收获:
了解不同角色——项目负责人、数据科学家、发现化学家——在AI药物发现中面临的核心数据痛点及应对思路;
了解GOSTAR如何从全球专利和顶级期刊中手动整理与校验数据,覆盖超过1000万化学结构与3700万实验数据点;
了解GOSTAR如何将多类型化合物数据统一规整,帮助用户一站式获取可直接用于模型训练的ML-ready数据集;
GOSTAR与ChEMBL,BindingDB等公共资源之间的关键差异;
通过与主流开源Benchmark数据库的对标测试,直观感受高质量策展数据对AI药物建模性能的提升;
现场了解GOSTAR精选数据集的在线检索功能,并获取免费试用机会。
讲座时间:
6月25日(周四)15:00-16:00
报名方式:
关于本次讲座的任何问题可联系康昱盛官方客服: