Sentieon
Sentieon 中文手册
Sentieon 中文手册(上册)
Sentieon 中文手册(下册)
Sentieon 软件应用教程
Sentieon | 应用教程: 使用DNAscope对HiFi长读长数据进行胚系变异检测分析
Sentieon | 应用教程: 利用Sentieon Python API引擎为自研算法加速
Sentieon | 应用教程: 关于读段组的建议
Sentieon | 应用教程: TNscope® 使用机器学习模型进行有匹配正常样本的体细胞变异发现
Sentieon | 应用教程: CCDG使用Sentieon®的功能等效流程
Sentieon | 应用教程: 利用共识功能去除PCR重复
Sentieon | 应用教程: 适用于PacBio HiFi和Oxford Nanopore长读长测序数据的结构变异检测
Sentieon | 应用教程: 使用 Sentieon进行大型基因组重测序分析
Sentieon | 应用教程: 体细胞SNP/Indel变异检测
Sentieon | 应用教程: DNAscope使用机器学习模型进行胚系变异调用
Sentieon | 应用教程: 唯一分子标识符(UMI)
Sentieon | 应用教程: Sentieon分布模式
Sentieon | 应用教程:使用CNVscope进行CNV检测分析
Sentieon发布核心家系(trio)基因分析最佳实践方案
Sentieon推出Segdup-caller:针对片段重复区域的专用精准变异检测工具
Sentieon软件版本更新
Sentieon | 发布V202503.01版本
Sentieon | 发布V202503.02版本
Sentieon软件快速入门指南
Sentieon 软件模块总述
Sentieon 特色流程 - DNAscope
Sentieon | DNAscope Illumina 流程
sentieon | DNAscope Complete Genomics 流程
Sentieon | DNAscope LongRead PacBio 流程
Sentieon | DNAscope Ultima Genomics 流程
Sentieon | DNAscope Element Bio 流程
Sentieon | DNAscope LongRead Nanopore 流程
Sentieon混合分析流程 - DNAscope Hybrid
Sentieon推出混合型短读长和长读长变异检测DNAscope Hybrid流程(上)
Sentieon推出混合型短读长和长读长变异检测DNAscope Hybrid流程(下)
毅硕Sentieon | 泛基因组分析流程详解
毅硕Sentieon | RNA-seq 变异检测全流程详解
毅硕Sentieon | 物种全基因组(WGS)分析流程
毅硕Sentieon | 植物全基因组(GWS)分析流程
毅硕Sentieon | 小麦(Triticum_aestivum)全基因组WGS分析流程
毅硕Sentieon | 水稻(Oryza_sativa)全基因组WGS分析流程
毅硕Sentieon | 拟南芥(Arabidopsis_thaliana)全基因组WGS分析流程
毅硕Sentieon | 马铃薯(Solanum_tuberosum)全基因组WGS分析流程
毅硕Sentieon | 巨桉(Eucalyptus grandis)全基因组WGS分析流程
毅硕Sentieon | 向日葵(Helianthus annuus)全基因组WGS分析流程
毅硕Sentieon | 野草莓(Fragaria vesca)全基因组WGS分析流程
毅硕Sentieon | 银杏(Ginkgo biloba)全基因组WGS分析流程
毅硕Sentieon | 大豆(Glycine max)全基因组WGS分析流程
毅硕Sentieon | 陆地棉(Gossypium hirsutum)全基因组WGS分析流程
毅硕Sentieon | 动物全基因组(WGS)分析流程
毅硕Sentieon | 猪(sus scrofa)全基因组WGS分析流程
毅硕Sentieon | 鸡(Gallus gallus)全基因组WGS分析流程
毅硕Sentieon | 家鼠(Mus musculus)全基因组WGS分析流程
毅硕Sentieon | 家犬(canis lupus familiaris)全基因组WGS分析流程
毅硕Sentieon | 东方蜜蜂(Apis cerana)全基因组WGS分析流程
毅硕Sentieon | 电鳗(Electrophorus electricus)全基因组WGS分析流程
毅硕Sentieon | 红隼(Falco tinnunculus)全基因组WGS分析流程
毅硕Sentieon | 家猫(Felis catus)全基因组WGS分析流程
毅硕Sentieon | 尼罗罗非鱼(Oreochromis niloticus)全基因组WGS分析流程
毅硕Sentieon文献解读
Sentieon文献解读 | Population Sequencing
Sentieon文献解读 | Agrigenomics
Sentieon | Agrigenomics-泛基因组揭示小麦结构变异与栖息地及育种的关联
Sentieon文献解读 | Genetic Disease
Sentieon文献解读 | Tumor Sequencing
Sentieon文献解读 | Benchmark and Method Study
Sentieon文献解读 | Long Read Sequencing
Sentieon文献解读 | Clinical Trial
Sentieon文献解读 | Epidemiology
Sentieon文献解读 | Gene Editing
Sentieon文献解读 | Liquid Biopsy
-
+
首页
Sentieon | 应用教程:使用CNVscope进行CNV检测分析
# 一、背景介绍 CNV检测已成为全基因组分析的常规内容,并显著提升了阳性诊断率。然而,由于实验室水平和所使用软件的差异,目前仍难以全面、准确地覆盖CNV的检测与细节分析。尤其在数据分析环节,目前尚无开源软件能够在性能优越的同时,全面解决这一问题。以流行的CNVnator为例,这是一款基于Read Depth(RD)原理的拷贝数变异检测软件,主要用于全基因组数据分析。CNVnator不仅能在人群中进行拷贝数变异检测和基因分型,还能根据需求鉴定一些非典型CNV。  总体而言,CNVnator具备较高的灵敏度、较低的错误发现率、并且其断点检测分辨率较高。然而,作为一款经典软件,CNVnator在应对现今多平台测序数据和新一代参考基因组等最新数据类型时,已表现出一定的局限性。 *** # 二、适用场景 CNVscope是Sentieon推出的一款基于机器学习的全基因组CNV分析检测模块。该模块主要用于检测大于5kb的拷贝数增加或缺失,方法是通过分析读段的深度信息,并结合断点检测等其他特征进行拷贝数判断。 *** # 三、环境必备 * 软件授权:License须开通CNV模块权限 * 软件下载:https://ftp.insvast.com/user/Sentieon/release/arm-sentieon-genomics-202503.02.tar.gz * 模型下载:https://insvast-download.oss-cn-shanghai.aliyuncs.com/Sentieon/release/ml_model/SentieonIlluminaWGS2.2.bundle 注意:安装包下载链接需要用户名及密码,请在毅硕科技公众号后台发送"Sentieon安装包"进行获取。 *** # 四、分析流程 运行两条独立的命令来进行 CNV 检测和应用机器学习模型。输入的BAM文件应来自已经完成比对和去重复的流程。 ``` sentieon driver [--interval INTERVAL_FILE] -t NUMBER_THREADS \ -r REFERENCE -i DEDUPED_BAM --algo CNVscope \ --model ML_MODEL/cnv.model TMP_VARIANT_VCF sentieon driver -t NUMBER_THREADS -r REFERENCE --algo CNVModelApply \ --model ML_MODEL/cnv.model -v TMP_VARIANT_VCF VARIANT_VCF ``` **注意**:在 CNVscope 和 CNVModelApply 中使用相同的模型至关重要。如果使用不同的模型,CNVModelApply将会报错。 *** # 五、参数说明 **该命令需要以下必选参数** * `NUMBER_THREADS`:计算中将使用的线程数。我们建议该数量不要超过您系统中可用的计算核心数。 * `REFERENCE`:参考FASTA文件的路径。您应确保该参考序列与映射阶段使用的参考相同。 * `DEDUPED_BAM`:输入BAM文件的路径。 * `TMP_VARIANT_VCF`: CNVscope变异检测输出的临时文件路径和文件名。 * `VARIANT_VCF`:变异检测输出的路径和文件名。系统将创建一个相应的索引文件。若使用 .gz 扩展名,该工具将输出一个压缩文件。 - `ML_MODEL`:机器学习模型文件的位置。在 CNVscope 命令中,该模型将用于确定变异检测中使用的设置。 **该命令可选以下输入参数:** * `INTERVAL_BED`:包含变异检测区间的 BED 文件位置。 *** # 六、结果说明 最终输出的 VCF 文件对 CNVscope 机器学习模型检测到的每个区域使用 CN 注释来表示拷贝数状态。CNVscope 检测到的可能拷贝数状态从 0 到 4,其中 CN=4 代表等于或大于 4 的拷贝数状态。 *** # 七、对男性样本使用 CNVscope CNVscope 将在整个基因组或提供的 --interval 文件中的基因组区域执行二倍体变异检测。在人类男性样本中,应分别在二倍体和单倍体染色体上执行变异检测。这可以通过运行两次 CNVscope 和 CNVModelApply 来实现,一次针对二倍体常染色体,另一次针对单倍体 X 和 Y 染色体,并使用` --interval `参数。 ``` sentieon driver --interval AUTOSOMES_BED -t NUMBER_THREADS \ -r REFERENCE -i DEDUPED_BAM --algo CNVscope \ --model ML_MODEL/cnv.model TMP_DIPLOID_VCF sentieon driver --interval AUTOSOMES_BED \ -t NUMBER_THREADS \ -r REFERENCE --algo CNVModelApply --model ML_MODEL/cnv.model \ -v TMP_DIPLOID_VCF DIPLOID_VCF sentieon driver --interval HAPLOID_BED -t NUMBER_THREADS \ -r REFERENCE -i DEDUPED_BAM --algo CNVscope \ --model ML_MODEL/cnv.model TMP_HAPLOID_VCF sentieon driver --interval HAPLOID_BED \ -t NUMBER_THREADS \ -r REFERENCE --algo CNVModelApply --model ML_MODEL/cnv.model \ -v TMP_HAPLOID_VCF HAPLOID_VCF ``` 该命令需要以下参数: - `AUTOSOMES_BED`:包含二倍体常染色体的 BED 文件位置。 - `HAPLOID_BED`:包含单倍体染色体的 BED 文件位置。 在生成包含单倍体和二倍体检测结果的 VCF 后,可以使用 bcftools 合并这两个 VCF 文件。 ``` bcftools concat -aD DIPLOID_VCF HAPLOID_VCF | \ sentieon util vcfconvert - VARIANT_VCF ``` *** # 八、附录:研发细节 在CNVscope的开发过程中,建立新一代的CNV真集用于训练和测试是最为关键的一步。目前常用的CNV真值集主要来自GIAB的HG002项目和千人基因组计划。然而,由于这些真值集依赖于早期的短读长技术,特别是在低复杂度区域的准确性存在一定问题。 随着测序技术的进步,尤其是长读长测序的发展,使得染色体级别的全基因组组装成为可能。例如,HG002 T2T(端到端)联盟最近宣布完成了HG002所有46条染色体的完整组装,使得样本的结构变异(SV)表征更加准确。同样,Human Pangenome Reference Consortium(人类泛基因组参考联盟)也发布了多个高质量的组装结果,为业内研究者开发最新的分析工具提供了基础。 Sentieon团队在此次开发中,主要采用了最新的HG002 T2T真集以及泛基因组项目中的15个样本。这些真集利用了第三代测序数据,大大提升了结构变异检测的准确性。我们从这些真集中提取了超过5kb的DUP(重复)和DEL(缺失)变异,作为CNVscope开发的真集数据。其中,11个图形基因组样本作为训练集,其余4个样本和T2T数据作为测试集。所有数据均来自约30x深度的全基因组测序。  为展示准确度,我们将CNVscope与先前提到的CNVnator (v0.4.1) 和Illumina开发的DRAGEN CNV (v4.2) 在不同数据集上进行了逐一对比。  <center>图1 拷贝数重复事件</center>  <center>图2 拷贝数缺失事件</center> 从结果来看,Sentieon CNVscope 在WGS中的表现相较于现有的CNV工具,展现出极高的准确性(F1值)。目前,CNVscope正处于持续迭代阶段,当前主要聚焦于检测大于5kb的胚系WGS事件,而小于5kb的复制和缺失则由DNAscope的结构变异检测模块处理。 **未来,CNVscope还将推出适用于外显子组测序(WES)数据和体细胞CNV的分析流程。** [**想了解更多Sentieon软件应用教程,可以点击此处进行跳转**](https://doc.insvast.com/doc/10/)
chsnp
2026年1月22日 15:45
转发
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
Word文件
PDF文档
PDF文档(打印)
分享
链接
类型
密码
更新密码
有效期