Sentieon
Sentieon 中文手册
Sentieon 中文手册(上册)
Sentieon 中文手册(下册)
Sentieon 软件应用教程
Sentieon | 应用教程: 使用DNAscope对HiFi长读长数据进行胚系变异检测分析
Sentieon | 应用教程: 利用Sentieon Python API引擎为自研算法加速
Sentieon | 应用教程: 关于读段组的建议
Sentieon | 应用教程: TNscope® 使用机器学习模型进行有匹配正常样本的体细胞变异发现
Sentieon | 应用教程: CCDG使用Sentieon®的功能等效流程
Sentieon | 应用教程: 利用共识功能去除PCR重复
Sentieon | 应用教程: 适用于PacBio HiFi和Oxford Nanopore长读长测序数据的结构变异检测
Sentieon | 应用教程: 使用 Sentieon进行大型基因组重测序分析
Sentieon | 应用教程: 体细胞SNP/Indel变异检测
Sentieon | 应用教程: DNAscope使用机器学习模型进行胚系变异调用
Sentieon | 应用教程: 唯一分子标识符(UMI)
Sentieon | 应用教程: Sentieon分布模式
Sentieon | 应用教程:使用CNVscope进行CNV检测分析
Sentieon发布核心家系(trio)基因分析最佳实践方案
Sentieon推出Segdup-caller:针对片段重复区域的专用精准变异检测工具
Sentieon软件版本更新
Sentieon | 发布V202503.01版本
Sentieon | 发布V202503.02版本
Sentieon软件快速入门指南
Sentieon 软件模块总述
Sentieon 特色流程 - DNAscope
Sentieon | DNAscope Illumina 流程
sentieon | DNAscope Complete Genomics 流程
Sentieon | DNAscope LongRead PacBio 流程
Sentieon | DNAscope Ultima Genomics 流程
Sentieon | DNAscope Element Bio 流程
Sentieon | DNAscope LongRead Nanopore 流程
Sentieon混合分析流程 - DNAscope Hybrid
Sentieon推出混合型短读长和长读长变异检测DNAscope Hybrid流程(上)
Sentieon推出混合型短读长和长读长变异检测DNAscope Hybrid流程(下)
Sentieon | 泛基因组分析流程详解
Sentieon | 物种全基因组(WGS)分析流程
Sentieon | 植物全基因组(GWS)分析流程
毅硕Sentieon | 小麦(Triticum_aestivum)全基因组WGS分析流程
毅硕Sentieon | 水稻(Oryza_sativa)全基因组WGS分析流程
毅硕Sentieon | 拟南芥(Arabidopsis_thaliana)全基因组WGS分析流程
毅硕Sentieon | 马铃薯(Solanum_tuberosum)全基因组WGS分析流程
毅硕Sentieon | 巨桉(Eucalyptus grandis)全基因组WGS分析流程
毅硕Sentieon | 向日葵(Helianthus annuus)全基因组WGS分析流程
毅硕Sentieon | 野草莓(Fragaria vesca)全基因组WGS分析流程
毅硕Sentieon | 银杏(Ginkgo biloba)全基因组WGS分析流程
毅硕Sentieon | 大豆(Glycine max)全基因组WGS分析流程
毅硕Sentieon | 陆地棉(Gossypium hirsutum)全基因组WGS分析流程
Sentieon | 动物全基因组(WGS)分析流程
毅硕Sentieon | 猪(sus scrofa)全基因组WGS分析流程
毅硕Sentieon | 鸡(Gallus gallus)全基因组WGS分析流程
毅硕Sentieon | 家鼠(Mus musculus)全基因组WGS分析流程
毅硕Sentieon | 家犬(canis lupus familiaris)全基因组WGS分析流程
毅硕Sentieon | 东方蜜蜂(Apis cerana)全基因组WGS分析流程
毅硕Sentieon | 电鳗(Electrophorus electricus)全基因组WGS分析流程
毅硕Sentieon | 红隼(Falco tinnunculus)全基因组WGS分析流程
毅硕Sentieon | 家猫(Felis catus)全基因组WGS分析流程
毅硕Sentieon | 尼罗罗非鱼(Oreochromis niloticus)全基因组WGS分析流程
Sentieon文献解读
Sentieon文献解读 | Population Sequencing
Sentieon文献解读 | Agrigenomics
Sentieon | Agrigenomics-泛基因组揭示小麦结构变异与栖息地及育种的关联
Sentieon文献解读 | Genetic Disease
Sentieon文献解读 | Tumor Sequencing
Sentieon文献解读 | Benchmark and Method Study
Sentieon文献解读 | Long Read Sequencing
Sentieon文献解读 | Clinical Trial
Sentieon文献解读 | Epidemiology
Sentieon文献解读 | Gene Editing
Sentieon文献解读 | Liquid Biopsy
-
+
首页
Sentieon | 应用教程: 使用DNAscope对HiFi长读长数据进行胚系变异检测分析
# 一、介绍 本文描述了使用Sentieon® DNAscope进行PacBio® HiFi数据胚系突变检测。PacBio® HiFi技术产⽣质量值超过Q20的高质量长读段,平均长度在10-25kb之间。准确的长读段可以对短读段和高噪音长读段方法无法检测的基因组重复区域进行精准的变异检测。 Sentieon® DNAscope能利用PacBio® HiFi数据高质量、长读长的优势,使用经过校准的机器学习模型进行快速、精准的变异检测。针对HiFi数据的DNAscope流程输入比对后的HiFi数据,并输出VCF格式变异检测结果。  本流程的使用需要使用202010.03或更新版本的Sentieon软件和可从Sentieon®获取的相关脚本。本流程需要Python版本>2.7或>3.3,bcftools版本为1.10及以上。`Python`,`bcftools`,`bedtools`需要在用户环境变量中。 --- # 二、输入数据要求 ## 1. 比对后数据 本流程的输入使用`pbmm2`或`minimap2`比对后的PacBio® HiFi数据。使⽤`pbmm2`比对推荐使用`-c 0 -y 70 --preset HIFI`参数。这些设置关闭了`pbmm2`传统的比对⼀致性过滤,转而使用间隔压缩序列过滤并使用PacBio®推荐的HiFi数据比对设置。使用`minimap2`比对推荐使用`-x map-hifi`参数。该设置为minimap2针对HiFi数据的推荐设置。 ## 2. 参考基因组 DNAscope将根据高质量参考基因组对样本进行变异检测。除了参考基因组外,由`samtools`生成的基因组索引文件(.fai)也是必须的。我们建议使用没有补丁序列的参考基因组。 --- # 三、PacBio® HiFi数据Sentieon® DNAscope流程 ## 1. 流程概览 本流程会进行两轮变异调用,然后将两轮结果合并到⼀起生成最终的结果。具体步骤如下: - 本流程在第⼀轮调用中会检测样本中的变异位点; - 利⽤第⼀轮检出的SNV和长读长信息进行定相; - 第⼆轮调用: - 在定相区,从每个单倍型中分别进行变异调用; - 在非定相区,使用更准确的⼆倍体模型进行变异调用; - 将第⼀轮和第⼆轮的变异位点合并生成最终结果; - 通过提供的MHC bed⽂件,对MHC区域进行特殊处理,进⼀步提高变异检测准确性;本流程所需的DNAscope机器学习模型可从https://github.com/Sentieon/sentieon-models 获取。 ## 2. 运行流程 通过⼀个包含多个单⼀Sentieon命令的脚本即可运行HiFi数据DNAscope流程。⼀行命令即可完成变异检测并运用机器学习模型。HiFi数据比对文件可以是用pbmm2比对和建立索引后的bam或cram⽂件。 ``` dnascope_HiFi.sh [-h] -r REFERENCE -i HIFI_BAM -m MODEL [-d dbSNP] [-B MHC_INTERVAL] [-b INTERVAL] [-t NUMBER_THREADS] [-h] [--] VARIANT_VCF ``` **HiFi数据Sentieon® DNAscope流程必选参数如下:** `-r REFERENCE`:参考基因组fasta文件路径。请确保使用的参考基因组⽂件与比对阶段使用的⼀致。 `-i HIFI_BAM`:比对后的BAM文件路径。 `-m MODEL`:DNAscope HiFi模型⽂件。 **HiFi数据Sentieon® DNAscope流程可选参数如下:** `-d dbSNP`:dbSNP数据库VCF文件路径。仅需⼀个文件。该文件将用于变异检测结果中位点refSNP ID的注释。 `-B MHC_INTERVAL`:MHC区间文件,BED格式。该文件将用于MHC区域变异检测的特殊处理。 `-b INTERVAL`:区间文件,BED格式。该文件将限制变异检测在该区间。 `-t NUMBER_THREADS`:并行线程数。该参数可选,默认使用计算机所有线程。 `-h`:打印帮助信息。 **HiFi数据Sentieon® DNAscope流程位置参数如下:** `VARIANT_VCF`:变异检测输出文件名。本流程会输出bgzip压缩的VCF文件及其索引文件。 --- # 四、流程输出文件 本流程会输出⼀个以VCF4.2格式标准的bgzip压缩文件(.vcf.gz)及其索引文件(.vcf.gz.tbi)。 --- # 五、其他注意事项 目前,该流程仅推荐应用于⼆倍体样本。对于包含⼆倍体和单倍体的样本,应使⽤`-b INTERVAL`参数将变异检测限定到⼆倍体染⾊体。 [**想了解更多Sentieon软件应用教程,可以点击此处进行跳转**](https://doc.insvast.com/doc/10/)
chsnp
2025年11月26日 17:29
转发
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
Word文件
PDF文档
PDF文档(打印)
分享
链接
类型
密码
更新密码
有效期