Sentieon
Sentieon 中文手册
Sentieon 中文手册(上册)
Sentieon 中文手册(下册)
Sentieon 软件应用教程
Sentieon | 应用教程: 使用DNAscope对HiFi长读长数据进行胚系变异检测分析
Sentieon | 应用教程: 利用Sentieon Python API引擎为自研算法加速
Sentieon | 应用教程: 关于读段组的建议
Sentieon | 应用教程: TNscope® 使用机器学习模型进行有匹配正常样本的体细胞变异发现
Sentieon | 应用教程: CCDG使用Sentieon®的功能等效流程
Sentieon | 应用教程: 利用共识功能去除PCR重复
Sentieon | 应用教程: 适用于PacBio HiFi和Oxford Nanopore长读长测序数据的结构变异检测
Sentieon | 应用教程: 使用 Sentieon进行大型基因组重测序分析
Sentieon | 应用教程: 体细胞SNP/Indel变异检测
Sentieon | 应用教程: DNAscope使用机器学习模型进行胚系变异调用
Sentieon | 应用教程: 唯一分子标识符(UMI)
Sentieon | 应用教程: Sentieon分布模式
Sentieon | 应用教程:使用CNVscope进行CNV检测分析
Sentieon发布核心家系(trio)基因分析最佳实践方案
Sentieon推出Segdup-caller:针对片段重复区域的专用精准变异检测工具
Sentieon软件版本更新
Sentieon | 发布V202503.01版本
Sentieon | 发布V202503.02版本
Sentieon软件快速入门指南
Sentieon 软件模块总述
Sentieon 特色流程 - DNAscope
Sentieon | DNAscope Illumina 流程
sentieon | DNAscope Complete Genomics 流程
Sentieon | DNAscope LongRead PacBio 流程
Sentieon | DNAscope Ultima Genomics 流程
Sentieon | DNAscope Element Bio 流程
Sentieon | DNAscope LongRead Nanopore 流程
Sentieon混合分析流程 - DNAscope Hybrid
Sentieon推出混合型短读长和长读长变异检测DNAscope Hybrid流程(上)
Sentieon推出混合型短读长和长读长变异检测DNAscope Hybrid流程(下)
Sentieon | 泛基因组分析流程详解
Sentieon | 物种全基因组(WGS)分析流程
Sentieon | 植物全基因组(GWS)分析流程
毅硕Sentieon | 小麦(Triticum_aestivum)全基因组WGS分析流程
毅硕Sentieon | 水稻(Oryza_sativa)全基因组WGS分析流程
毅硕Sentieon | 拟南芥(Arabidopsis_thaliana)全基因组WGS分析流程
毅硕Sentieon | 马铃薯(Solanum_tuberosum)全基因组WGS分析流程
毅硕Sentieon | 巨桉(Eucalyptus grandis)全基因组WGS分析流程
毅硕Sentieon | 向日葵(Helianthus annuus)全基因组WGS分析流程
毅硕Sentieon | 野草莓(Fragaria vesca)全基因组WGS分析流程
毅硕Sentieon | 银杏(Ginkgo biloba)全基因组WGS分析流程
毅硕Sentieon | 大豆(Glycine max)全基因组WGS分析流程
毅硕Sentieon | 陆地棉(Gossypium hirsutum)全基因组WGS分析流程
Sentieon | 动物全基因组(WGS)分析流程
毅硕Sentieon | 猪(sus scrofa)全基因组WGS分析流程
毅硕Sentieon | 鸡(Gallus gallus)全基因组WGS分析流程
毅硕Sentieon | 家鼠(Mus musculus)全基因组WGS分析流程
毅硕Sentieon | 家犬(canis lupus familiaris)全基因组WGS分析流程
毅硕Sentieon | 东方蜜蜂(Apis cerana)全基因组WGS分析流程
毅硕Sentieon | 电鳗(Electrophorus electricus)全基因组WGS分析流程
毅硕Sentieon | 红隼(Falco tinnunculus)全基因组WGS分析流程
毅硕Sentieon | 家猫(Felis catus)全基因组WGS分析流程
毅硕Sentieon | 尼罗罗非鱼(Oreochromis niloticus)全基因组WGS分析流程
Sentieon文献解读
Sentieon文献解读 | Population Sequencing
Sentieon文献解读 | Agrigenomics
Sentieon | Agrigenomics-泛基因组揭示小麦结构变异与栖息地及育种的关联
Sentieon文献解读 | Genetic Disease
Sentieon文献解读 | Tumor Sequencing
Sentieon文献解读 | Benchmark and Method Study
Sentieon文献解读 | Long Read Sequencing
Sentieon文献解读 | Clinical Trial
Sentieon文献解读 | Epidemiology
Sentieon文献解读 | Gene Editing
Sentieon文献解读 | Liquid Biopsy
-
+
首页
Sentieon 软件模块总述
在二代测序(NGS)数据分析领域,速度与准确性是永恒的追求。Sentieon Genomics 软件凭借其在半导体芯片设计和核心算法开发方面的经验,提供了一套高度优化、工业级的基因组数据分析工具包。 Sentieon 不仅在多个国际精准医学挑战赛(如 precisionFDA)中屡获殊荣 ,更通过算法和软件实现上的创新,确保分析结果与 Broad Institute 等机构的行业金标准高度一致,同时将处理速度提升5到10 倍。 Sentieon 软件包含近40 个可用模块工具 ,核心功能通过 DRIVER 等二进制文件实现。 以下是 Sentieon 核心功能模块的详细介绍,帮助您全面了解其在基因组分析中的强大能力。 *** # 一、Sentieon分析流程总览 |流程|DNAscope (短读长)|泛基因组|DNAscope LongRead|DNAscope Hybird|DNAseq|TNscope (体细胞)|TNseq (体细胞)| | --- | --- | --- | --- | --- | --- |--- | --- | |比对(Alignment)|✔|✔|✔|✔|✔|✔|✔| |SNP/Indel|✔|✔|✔|✔|✔|✔|✔| |结构变异(SV)|✔|✔|✔|✔| |✔| | |拷贝数变异(CNV)|✔|✔| |✔| | | | |片段重复基因(Segdup Genes)|✔|✔| |✔| | | | |UMI处理| | | | | |✔| | |匹配 GATK| | | | |✔| |✔| - DNAscope (短读长版) :该流程执行短读长数据比对、胚系变异检测(包括 SNP、Indel、SV、CNV 和 Segdup)。 - 泛基因组流程 (Pangenome) :该流程执行短读长数据与图谱参考基因组的比对、胚系变异检测(包括 SNP、Indel、SV、CNV 和 Segdup)。 - DNAscope LongRead:该流程执行长读长数据比对、胚系变异检测(包括 SNP、Indel 和 SV)。 - DNAscope Hybrid :该流程执行短读长和长读长数据的比对、胚系变异检测(包括 SNP、Indel、SV、CNV 和 Segdup)。 - DNAseq :该流程执行短读长数据比对、胚系变异检测(包括 SNP 和 Indel),其结果可匹配 GATK。 - TNscope :该流程执行短读长数据比对、UMI(唯一分子标识)处理、体细胞变异检测(包括 SNP、Indel 和 SV)。 - TNseq:该流程执行短读长数据比对、体细胞变异检测(包括 SNP 和 Indel),其结果可匹配 GATK。 *** # 二、核心可执行文件与基础工具 Sentieon 的分析流程(Pipeline)通过几个核心二进制文件和实用工具协同工作。 |工具名称|主要功能|优势与特点| | --- | --- | --- | |DRIVER|执行生物信息学流程所有阶段的核心二进制文件|能够在一个命令中运行多个算法,并统一协调线程、参考文件、输入 BAM 文件等参数,是构建 Sentieon 分析流程的基石| |BWA|DNA 测序数据比对工具|BWA-turbo 版本比开源 bwa-mem 加速 4 倍,通过机器学习模型优化速度和准确度,支持 shm 模式将 FASTA 索引加载到内存中供多进程共享,提高效率| |STAR|RNA-seq 数据比对工具|分析过程与 STAR 工具一致,在 RNA 变异检测流程中,相比开源版本,可实现 5-10 倍加速| |minimap2|PacBio 或 Oxford Nanopore 长读长基因组数据比对工具|分析过程与 minimap2 一致,minimap2-turbo 相比开源版本可提速 5 倍| |UTIL|实用功能集合,主要处理比对结果|包含 index (BAM 索引)、vcfindex (VCF 索引)、sort (BAM 排序/SAM转BAM)、vcfconvert (VCF 压缩/解压缩) 等,其中 sort 模式在长读长数据上显著降低内存占用| |LICSRVR/LICCLNT|许可证服务器和客户端|实现许可证的动态分配和管理,适用于集群环境| |PLOT|脚本工具|用于生成度量和重校准结果的 PDF 格式图表,方便结果可视化| |UMI|处理含有 UMI 序列的 FASTQ 文件|extract 模式预处理 FASTQ,支持多达 3 个输入 FASTQ 文件| *** # 三、基因组变异检测模块 Sentieon 的变异检测模块是其最核心的竞争力,提供了行业领先的准确度和极高的计算效率。 ## 1. 胚系变异检测 (Germline Variant Calling) |算法模块|核心功能|优势与特点| | --- | --- | --- | |Haplotyper|执行单倍型 (Haplotype) 变异检测|Sentieon DNAseq 流程中的标准胚系变异检测工具,支持输出 GVCF 格式用于联合基因分型| |DNAscope|改进优化的 Haplotyper 变异检测算法|最高准确度的胚系变异检测工具,利用机器学习模型(可在 GitHub 获取)显著提高速度和准确性。相比 GATK 可降低错检变异 2-3 倍,准确度超越 DeepVariant。适用于 Illumina、MGI、Element Biosciences、Ultima Genomics、PacBio HiFi 和 Oxford Nanopore 等多个测序平台 | GVCFtyper|对多个样本的 GVCF 文件进行联合变异基因分型|效率极高,可一步处理超过 100 万个全基因组样本的联合变异检测。支持混合测序平台(二代/三代)样本的联合分析| Genotyper|执行统一基因分型 (Unified Genotyper) 变异检测|与 Haplotyper 类似,是另一种胚系变异检测算法| |VariantPhaser|对 VCF 中的变异进行 read-based 定相|使用长读长 BAM 文件中的信息,对变异进行定相| |CNVscope|胚系全基因组测序 (WGS) 拷贝数变异 (CNV) 检测工具|主要用于检测长度大于约 5kbp 的 CNV| |SVSolver|胚系结构变异 (SV) 检测|与 DNAscope 结合使用,对 DNAscope 输出的 break-end (BND) 信息进行结构变异分析 。在 GIAB v0.5 Tier1 数据集基准测试中,精确度高达 91.21% | ## 2. 体细胞变异检测 (Somatic Variant Calling) |算法模块|核心功能|优势与特点| | --- | --- | --- | |TNscope|体细胞变异和结构变异检测 |ICGC-TCGA DREAM 挑战赛中获胜的算法 。针对高深度 panel 样本优化,在室间质评中获得满分 。支持肿瘤-正常配对或纯肿瘤样本分析| |TNhaplotyper2|基于 Haplotype 的体细胞变异检测|结果匹配 MuTect2 (4.1.9),但速度提高 4-10 倍,且不降采样| |TNsnv / TNhaplotyper|体细胞 SNV/InDel检测 |用于肿瘤-正常配对或纯肿瘤样本| |SVSolver|体细胞结构变异 (SV)检测|与 TNscope 的 BND 输出配合使用,可用于肿瘤-正常配对样本| ## 3. 长读长及混合读长分析模块(Long-Read & Hybrid Analysis) |算法模块|核心功能|优势与特点| | --- | --- | --- | |DNAscope LongRead|专门用于长读长(PacBio HiFi, ONT)数据的胚系变异检测|支持单碱基分辨率的结构变异 (SV) 检测。相比开源工具(如 Clair3),SNP 错误率可降低 50%以上,且加速约 4 倍| |DNAscope Hybrid|支持短读长和长读长混合变异检测|即使在仅有 5 X长读长测序深度的情况下,其 Indel 检测准确性也优于所有其他方法| ## 4. 泛基因组分析模块(Pangenome Analysis) Sentieon 已发布泛基因组比对和变异检测流程。 - 背景:泛基因组参考有助于更准确地捕获传统线性参考基因组中缺失或难以处理的复杂变异,提供更全面的基因组分析能力。 - 核心功能:泛基因组比对和变异检测。 - 工具组合:该流程集成了优化后的 vg giraffe 进行泛基因组比对。 - 变异检测:利用 DNAscope 进行小变异检测。 - 核心优势:Sentieon 通过工业级软件实现和算法优化,在保证泛基因组分析准确度的同时,显著提升了流程速度和效率。 *** # 四、预处理、质量控制与过滤模块 Sentieon 的预处理步骤遵循行业最佳实践(如 Broad Institute 的 DNAseq 流程),并在速度上实现巨大突破。 |算法模块|核心功能|优势与特点| | --- | --- | --- | |LocusCollector/Dedup|标记和去除PCR重复序列(PCR duplicates)|该算法模块同时支持基于 UMI 的去重和 RNA 序列数据处理。相比开源 Fgbio+Vardict 流程,UMI 处理速度可提速 20 倍| |QualCal|碱基质量重校准 (BQSR)|计算并应用 BQSR 表,校正测序引入的实验偏差,是提高变异检测准确性的关键步骤| |RNASplitReadsAtJunction|拆分 RNA 测序reads为外显子片段|重新分配 STAR 比对后的质量值,对 RNA-seq 数据进行特殊处理| |ReadWriter|输出应用 BQSR 后的 BAM 文件|可用于合并多个 BAM 文件或转换为更节省空间的 CRAM 格式| |VarCal / ApplyVarCal|变异质量重校准 (VQSR)|为单个变异检测分配校准后的概率得分,以实现更准确的变异控制和过滤| |DNAModelApply / TNModelApply|应用机器学习模型进行变异过滤|作为 DNAscope/TNscope 流程的第二步,进一步优化变异检测结果的可靠性| |TNfilter|对 TNhaplotyper2 的输出进行过滤|提高体细胞变异检测的准确性| |QC 统计模块|一系列算法(如 AlignmentStat, GCBias, CoverageMetrics 等)|用于生成测序数据质量和流程分析过程中的质量统计摘要和报告,帮助用户进行质量评估| |ContaminationModel / OrientationBias|估算样本交叉污染、肿瘤片段信息|用于体细胞分析流程的过滤,提高结果的可靠性| *** # 五、Sentieon 的卓越优势总结 Sentieon 之所以能被全球用户广泛认可,并在基因组分析中占据领先地位,其优势可总结为: 1. 极致的速度与效率: - 相比开源流程,分析速度提升 5-10 倍,大幅减少计算时间和成本。 - 兼容目前市场上几乎所有的CPU硬件平台(例如Intel/AMD/Ampere/曙光/鲲鹏等),大幅降低了使用门槛。 - 软件架构高度优化,可在 16-128 线程范围内速度与 CPU 线程数成正比,高效利用所有可用运算资源。 - 在云计算平台( AWS/Azure/Alicloud/火山云等)上,实现了基因组分析成本的显著降低。 2. 行业领先的准确度: - 核心算法在数学模型上与 GATK/BWA/STAR等行业金标准高度一致。 - 通过 DNAscope 和 TNscope 模块引入机器学习,在保持速度优势的同时,实现了 更高准确度。在长读长、高深度 Panel 等复杂场景下,其准确性表现卓越。 3. 全面的技术栈覆盖: - 提供从 DNAseq (胚系短读长)、TNseq/TNscope (体细胞短读长)、RNAseq 到 DNAscope LongRead/Hybrid (长读长/混合读长) 的全流程解决方案。 - 全面支持主流测序平台,包括 Illumina、MGI(DNBSEQ)、Element Biosciences、Ultima Genomics、PacBio HiFi 、Oxford Nanopore和赛陆等。 4. 率先推出泛基因组分析的工业级应用实现。 想了解更多 Sentieon 的使用细节或开始您的极速分析之旅吗? 您可以在 Insvast官网和 GitHub 仓库、公众号找到更多资源,包括详细的用户手册、应用说明和流程脚本 。
chsnp
2025年11月27日 13:54
转发
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
Word文件
PDF文档
PDF文档(打印)
分享
链接
类型
密码
更新密码
有效期