Sentieon
Sentieon 中文手册
Sentieon 中文手册(上册)
Sentieon 中文手册(下册)
Sentieon 软件应用教程
Sentieon | 应用教程: 使用DNAscope对HiFi长读长数据进行胚系变异检测分析
Sentieon | 应用教程: 利用Sentieon Python API引擎为自研算法加速
Sentieon | 应用教程: 关于读段组的建议
Sentieon | 应用教程: TNscope® 使用机器学习模型进行有匹配正常样本的体细胞变异发现
Sentieon | 应用教程: CCDG使用Sentieon®的功能等效流程
Sentieon | 应用教程: 利用共识功能去除PCR重复
Sentieon | 应用教程: 适用于PacBio HiFi和Oxford Nanopore长读长测序数据的结构变异检测
Sentieon | 应用教程: 使用 Sentieon进行大型基因组重测序分析
Sentieon | 应用教程: 体细胞SNP/Indel变异检测
Sentieon | 应用教程: DNAscope使用机器学习模型进行胚系变异调用
Sentieon | 应用教程: 唯一分子标识符(UMI)
Sentieon | 应用教程: Sentieon分布模式
Sentieon | 应用教程:使用CNVscope进行CNV检测分析
Sentieon发布核心家系(trio)基因分析最佳实践方案
Sentieon推出Segdup-caller:针对片段重复区域的专用精准变异检测工具
Sentieon软件版本更新
Sentieon | 发布V202503.01版本
Sentieon | 发布V202503.02版本
Sentieon软件快速入门指南
Sentieon 软件模块总述
Sentieon 特色流程 - DNAscope
Sentieon | DNAscope Illumina 流程
sentieon | DNAscope Complete Genomics 流程
Sentieon | DNAscope LongRead PacBio 流程
Sentieon | DNAscope Ultima Genomics 流程
Sentieon | DNAscope Element Bio 流程
Sentieon | DNAscope LongRead Nanopore 流程
Sentieon混合分析流程 - DNAscope Hybrid
Sentieon推出混合型短读长和长读长变异检测DNAscope Hybrid流程(上)
Sentieon推出混合型短读长和长读长变异检测DNAscope Hybrid流程(下)
毅硕Sentieon | 泛基因组分析流程详解
毅硕Sentieon | RNA-seq 变异检测全流程详解
毅硕Sentieon | 物种全基因组(WGS)分析流程
毅硕Sentieon | 植物全基因组(GWS)分析流程
毅硕Sentieon | 小麦(Triticum_aestivum)全基因组WGS分析流程
毅硕Sentieon | 水稻(Oryza_sativa)全基因组WGS分析流程
毅硕Sentieon | 拟南芥(Arabidopsis_thaliana)全基因组WGS分析流程
毅硕Sentieon | 马铃薯(Solanum_tuberosum)全基因组WGS分析流程
毅硕Sentieon | 巨桉(Eucalyptus grandis)全基因组WGS分析流程
毅硕Sentieon | 向日葵(Helianthus annuus)全基因组WGS分析流程
毅硕Sentieon | 野草莓(Fragaria vesca)全基因组WGS分析流程
毅硕Sentieon | 银杏(Ginkgo biloba)全基因组WGS分析流程
毅硕Sentieon | 大豆(Glycine max)全基因组WGS分析流程
毅硕Sentieon | 陆地棉(Gossypium hirsutum)全基因组WGS分析流程
毅硕Sentieon | 动物全基因组(WGS)分析流程
毅硕Sentieon | 猪(sus scrofa)全基因组WGS分析流程
毅硕Sentieon | 鸡(Gallus gallus)全基因组WGS分析流程
毅硕Sentieon | 家鼠(Mus musculus)全基因组WGS分析流程
毅硕Sentieon | 家犬(canis lupus familiaris)全基因组WGS分析流程
毅硕Sentieon | 东方蜜蜂(Apis cerana)全基因组WGS分析流程
毅硕Sentieon | 电鳗(Electrophorus electricus)全基因组WGS分析流程
毅硕Sentieon | 红隼(Falco tinnunculus)全基因组WGS分析流程
毅硕Sentieon | 家猫(Felis catus)全基因组WGS分析流程
毅硕Sentieon | 尼罗罗非鱼(Oreochromis niloticus)全基因组WGS分析流程
毅硕Sentieon文献解读
Sentieon文献解读 | Population Sequencing
Sentieon文献解读 | Agrigenomics
Sentieon | Agrigenomics-泛基因组揭示小麦结构变异与栖息地及育种的关联
Sentieon文献解读 | Genetic Disease
Sentieon文献解读 | Tumor Sequencing
Sentieon文献解读 | Benchmark and Method Study
Sentieon文献解读 | Long Read Sequencing
Sentieon文献解读 | Clinical Trial
Sentieon文献解读 | Epidemiology
Sentieon文献解读 | Gene Editing
Sentieon文献解读 | Liquid Biopsy
-
+
首页
Sentieon | 应用教程: 利用共识功能去除PCR重复
# 一、介绍 本文介绍了如何使用Sentieon® Genomics工具去除PCR重复序列。该步骤使用两个单独的命令来收集读段信息并执行去重操作。LocusCollector工具的选项`--consensus`用于控制是否输出PCR重复序列的共识结果。如果适用唯一分子标识符(UMI)标签,请使用LocusCollector的选项`--umi_tag`来启用基于分子条码的去重。 --- # 二、非共识的去重 通过非共识的去重方法,从一组重复读段中,选择一个代表性的读段作为主要读取。 ## 1. 非共识的去重(无UMI) 该工作流程与Picard MarkDuplicates的默认输出结果相匹配。 ``` sentieon driver -t NUMBER_THREADS -i SORTED_BAM \ --algo LocusCollector --fun score_info SCORE.gz sentieon driver -t NUMBER_THREADS -i SORTED_BAM \ --algo Dedup [--rmdup] --score_info SCORE.gz \ --metrics DEDUP_METRIC_TXT DEDUPED_BAM ``` 有一种特殊的3次流程去重,可以标记主要读段和非主要读段。然而,这种流程仅适用于非共识的去重(无UMI)。 ## 2. 基于分子条码的非共识去重(带有UMI) 该工作流程利用UMI信息以及读段和读段对的5'位置来确定PCR重复序列。在LocusCollector中使用选项--umi_tag来指定UMI标签。 ``` sentieon driver -t NUMBER_THREADS -i SORTED_BAM \ --algo LocusCollector --umi_tag XR --fun score_info SCORE.gz sentieon driver -t NUMBER_THREADS -i SORTED_BAM \ --algo Dedup [--rmdup] --score_info SCORE.gz \ --metrics DEDUP_METRIC_TXT DEDUPED_BAM ``` --- # 三、基于共识的去重 通过基于共识的去重,可以从一组重复的读段中生成单个共识读段。该过程可以纠正PCR和测序引入的错误。它还可以估计每个位置的碱基质量分数,以反映共识读段中碱基错误的概率。在基于共识的去重之后,不应执行额外的碱基质量调整步骤。 在LocusCollector中设置选项--consensus以启用基于共识的去重功能。此外,Dedup需要提供参考基因组的FASTA文件。 ## 1. 不带有UMI的基于共识的去重 在没有UMI的情况下,此工作流程仅使用比对坐标来对测序读段进行聚类。 ``` sentieon driver -t NUMBER_THREADS -i SORTED_BAM \ --algo LocusCollector --consensus --fun score_info SCORE.gz sentieon driver -t NUMBER_THREADS -r REFERENCE -i SORTED_BAM \ --algo Dedup [--rmdup] --score_info SCORE.gz \ --metrics DEDUP_METRIC_TXT DEDUPED_BAM ``` ## 2. 基于UMI的共识去重 基于UMI的共识去重工作流程使用比对坐标和UMI(分子条码)来对测序读段进行聚类。 ``` sentieon driver -t NUMBER_THREADS -i SORTED_BAM \ --algo LocusCollector --consensus --umi_tag XR --fun score_info SCORE.gz sentieon driver -t NUMBER_THREADS -r REFERENCE -i SORTED_BAM \ --algo Dedup [--rmdup] --score_info SCORE.gz \ --metrics DEDUP_METRIC_TXT DEDUPED_BAM ``` - UMI条码错误纠正 UMI条码会根据与其他条码之间的编辑距离进行自动的错误纠正。若要禁用此功能,请在LocusCollector中使用选项`--umi_ecc_dist 0`。 - RNA序列数据 当使用STAR对RNA序列数据进行比对时,在LocusCollector中设置选项`--rna`。 ``` sentieon driver -t NUMBER_THREADS -i SORTED_BAM \ --algo LocusCollector --rna [--consensus] [--umi_tag XR] --fun score_info SCORE.gz sentieon driver -t NUMBER_THREADS -r REFERENCE -i SORTED_BAM \ --algo Dedup [--rmdup] --score_info SCORE.gz DEDUPED_BAM ``` [**想了解更多Sentieon软件应用教程,可以点击此处进行跳转**](https://doc.insvast.com/doc/10/)
chsnp
2025年11月26日 17:30
转发
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
Word文件
PDF文档
PDF文档(打印)
分享
链接
类型
密码
更新密码
有效期