基因组数据快速二级分析工具
咨询订购
申请试用

产品介绍

Sentieon提供了二代测序分析的完整解决方案,基于BWA、GATK、HaplotypeCaller、Mutect和Mutect2的分析流程进行了大幅提升,可以部署在任何基于通用CPU的系统结构之上。Sentieon经历了大量用户的测试和验证,处理过上百万样本,总计超过4万亿bp的DNA。

常见客户

1.     基因组测序服务供应商

2.     分子诊断公司

3.     药物和生物技术公司

4.     医院和癌症中心

5.     对接消费者的基因公司

6.     学院和研究机构

突出特点

1.     加速的BWA-MEM和GATK兼容流程整合了BWA-MEM、Picard和GATK3.3-4.1, 可以做“Broad Institute Best Practices Pipelines”中的任意计算方式的替代。

2.     极速周转时间和超低成本对于一个30X WGS全基因组测序(Whole Genome Sequencing, WGS)流程,在分布式计算处理中流程小于30分钟,在单个服务器中流程小于2小时。大大减少了运算时间和成本,同时结果与 BWA/GATK保持一致。

3.     100%一致性。无下采样(Down-Sampling),无线程依赖性,无run-to-run差异。Sentieon在FDA举办的基因测序数据挑战赛PrecisionFDA Consistency Challenge中的整体性能和和可重复性方面取得最优成绩。

4.     部署简单。Sentieon为纯软件解决方法,可以在任何基于通用CPU的电脑系统上运行,十分容易部署在本地或者云端。

5.     竞赛获奖级别的准确性。Sentieon为PrecisionFDA基因测序数据挑战赛中PrecisionFDA Truth Challenge,Hidden Treasure Warm-Up Challenge,NCI-CPTAC Multi-omics Enabled Sample Mislabeling Correction Challenge和ICGC-TCGA DREAM Somatic Mutation Calling Challenge的获胜者。

6.     企业支持。Sentieon的科学家和工程师为企业用户全心全力提供支持。

分析流程与工具

1.    序列比对(Alignment):Sentieon BWA相对于BWA-MEM的速度提升到2倍

2.    生殖细胞SNV/INDEL变异识别(Germline SNV/INDEL Variant Calling):

DNAseq:获得PrecisionFDA奖项的软件,功能匹配GATK3.3-4.1,没有下采样过程(Downsampling),每次获得结果的速度可以提升到10倍并保持100%的一致性

DNAscope:提高的准确性和基因组表征。增强的机器学习方法能够以最高的准确性识别产生的变异

3.     体细胞SNV/INDEL变异识别(Somatic SNV/INDEL Variant Calling):

TNseq:匹配MuTect,MuTect2 v3.8-4.0,为达到更高的准确性和针对低等位基因频率的变异更高的检测能力,没有下采样过程(Downsampling)

TNscope:ICGC-TCGA DREAM竞赛冠军。提升的准确性,针对变异筛选增强的机器学习方法。支持分子条码和唯一的分子识别码

4.     结构变异识别(Structural Variant Calling):生殖细胞和体细胞结构变异识别,包括易位、倒置、复制和大的INDEL

5.     队列研究(Joint Calling):支持超过20w全基因组样本的大型队列研究,可直接从gVCF开始,无需任何中间步骤

6.     BCL-FASTQ转化工具(BCL-FASTQ Tool):Sentieon外部的数据库加速BCL到FASTQ的转化,速度可达1.5到2倍。

7.     RNA变异识别(RNA Variant Calling):匹配GATK RNAseq变异识别的好方法

Sentieon DNAseq(强大稳定的生殖细胞变异检测工具)

1604979680133919.png

1.     与Broad Institute的BWA-GATK Best Practice Workflow一致的算法流程,但以核心小时计算,在FASTQ到VCF文件的流程中速度高10倍,在BAM到VCF文件的流程中速度高20倍。

2.     无run-to-run差异,在高覆盖区域无下采样。

3.     在大型数据(>200K样本)中的Joint-Calling中不合并中间文件。

4.     与常见疾病基因组中心(Centers for Common Disease Genomics)具有等效功能。

5.     纯软件解决方案,可以运行在任何基于通用CPU的系统中。

6.     PrecisionFDA Consistency Challenge获奖者。

7.     PrecisionFDA Truth Challenge获奖者。

8.     PrecisionFDA Hidden-Treasure Warm-Up Challenge获奖者。

9.     在Google Cloud的64核服务器FASTQ-to-VCF流程性能:

30X 基因组,NA12878(HG001)2小时分析完毕(140核心小时)


Sentieon DNAseq实施与Broad Institute的BWA-GATK HaplotypeCaller 3.3-4.1 Best Practices Worfolw工作流程一致的算法,但采用了更效率的计算算法和企业级开发的软件实现。提高的计算算法使Sentieon DNAseq用户在云端计算中完成一个30X WGS测序FASTQ-to-VCF流程的花费小于1美元。使用同样的基于通用CPU的系统且无特殊硬件需求的情况下,Sentieon DNAseq在核心小时上完成FASTQ-to-VCF流程的效率为BWA-GATK的10倍。对于align-BAM-to-VCF流程,Sentieon比GATK快20倍。这个软件也可以应用于超过200K样本的同时Joint Calling,且不合并中间文件。


通过提升的计算算法和严格的多线程软件应用。因为Sentieon DNAseq不在高覆盖区域进行下采样,没有线程依赖性,所以Sentieon DNAseq没有run-to-run差异。这种一致性对于临床应用和需要高测序覆盖的应用十分重要。


这些提升使得Sentieon DNAseq赢得precisionFDA Consistency,Truth和Hidden Treasure Warm-up Challenges. 正如precisionFDA Challenges所展示的,Sentieon DNAseq在使用相同算法时,通过消除随机性和噪声,获得了比原始BWA-GATK更高的准确性。


Sentieon DNAseq是一个在扩展、部署和升级方面都十分简单的纯软件解决方案。它10倍提升了已有计算结构,通过提升效率10倍降低了云端计算花费。其命令行接口和GATK流程十分相似,并可以将Sentieon和BWA-GATK命令直接匹配,使得可以构建灵活应用的流程,包括和GATK流程具有一致性的应用流程,包括满足CCDG的等效功能的规范。


Sentieon对DNAseq进行维护,并会持续匹配BWA-GATK的新版本。在此之上,Sentieon会和用户一起对Sentieon的特点进行发展,提高其精确性和功能性。

对于一个30X全基因组测序,Sentieon DNAseq可以完成整套流程,大概2小时完成FASTA-to-VCF(64核服务器)。如果运转时间很关键,Sentieon DNAseq也有分布式处理的准备,通过复数服务器降低FASTA-to-VCF的时间到半个小时以下。

Sentieon DNAseq构建基于严格和广泛测试检验的数学模型,模型同样也用在Broad Institute’s Best Practices流程之中,但Sentieon DNAseq提供更有效率的计算算法和企业级软件实施。

Sentieon TNseq(强大稳定的体细胞变异检测工具)

1604980345817173.png

1.     与Broad Institute的MuTect和MuTect2一致的算法流程,但以核心小时计算,在FASTQ到VCF文件的流程中速度高10倍,同时无下采样。

2.     无run-to-run差异,在高覆盖区域无下采样。

3.     纯软件解决方案,可以运行在任何基于通用CPU的系统中。

 

Sentieon TNseq是匹配的肿瘤-正常或者仅肿瘤体细胞变异检测工具,其算法和MuTect和MuTect2相匹配。Sentieon TNseq使用Broad Institute中同样的算法,通过高效计算算法和企业级软件实现获得性能的提高。

Sentieon TNseq在核心小时方面提速10倍以上,无run-to-run差异,在高覆盖区域不进行下采样,结果更加稳定。除了提高WGS或者全外显子组 (Whole Exon Sequencing, WES)样本的体细胞变异检测,Sentieon TNseq特别使高覆盖区域的体细胞变异检测成为可能,例如在液体活检中,这是由于Sentieon TNseq可以在无下采样的情况下的处理覆盖深度超过100K的区域。

Sentieon TNseq被设计为可以进行多项成和分布式处理。

Sentieon TNscope(精准综合性肿瘤表征)

1.     综合性体细胞变异检测,在仅肿瘤样本或肿瘤-正常样本中检测SNV、INDEL和SV。

2.     无run-to-run差异,在高覆盖区域无下采样。

3.     纯软件解决方案,可以运行在任何基于通用CPU的系统中。

4.     在ICGC-TCGA Dream Mutation Calling Challenge 6的三组分类中(SNV, INDEL, SV)排名前列。

Sentieon TNscope基于MuTect和MuTect2构建提升数学模型。使用数学模型中复杂的信号传导技术来积累信号同时去除噪声。TNscope在变异检测中提高信号到噪声比率,相对同类软件收获更高的敏感性和特异性。所有的变异类别都可以被同时检测和表征,包括SNV、INDEL和结构变异(Structure Variants),避免了运行多个变异检测工具的需要。

Sentieon参加了ICGC-TCGA举办的DREAM Challenge benchmarking tumor-normal somatic variant calling accuracy,使用TNscope的工程版本,并在三类比赛中均领先:SNV、INDEL和SV。在最终排行榜中,Sentieon在SNV分类中获得98.57%的F-score、INDEL分类获得98.14%、SV分类获得100%。

Sentieon TNscope被设计为可以进行多项成和分布式处理。

申请与订购

您正在申请的产品: 产品 >基因组学 > Sentieon

您的服务是

申请试用
咨询订购
需求说明
提交