Sentieon
Sentieon 中文手册
Sentieon 中文手册(上册)
Sentieon 中文手册(下册)
Sentieon 软件应用教程
Sentieon | 应用教程: 使用DNAscope对HiFi长读长数据进行胚系变异检测分析
Sentieon | 应用教程: 利用Sentieon Python API引擎为自研算法加速
Sentieon | 应用教程: 关于读段组的建议
Sentieon | 应用教程: TNscope® 使用机器学习模型进行有匹配正常样本的体细胞变异发现
Sentieon | 应用教程: CCDG使用Sentieon®的功能等效流程
Sentieon | 应用教程: 利用共识功能去除PCR重复
Sentieon | 应用教程: 适用于PacBio HiFi和Oxford Nanopore长读长测序数据的结构变异检测
Sentieon | 应用教程: 使用 Sentieon进行大型基因组重测序分析
Sentieon | 应用教程: 体细胞SNP/Indel变异检测
Sentieon | 应用教程: DNAscope使用机器学习模型进行胚系变异调用
Sentieon | 应用教程: 唯一分子标识符(UMI)
Sentieon | 应用教程: Sentieon分布模式
Sentieon | 应用教程:使用CNVscope进行CNV检测分析
Sentieon发布核心家系(trio)基因分析最佳实践方案
Sentieon推出Segdup-caller:针对片段重复区域的专用精准变异检测工具
Sentieon软件版本更新
Sentieon | 发布V202503.01版本
Sentieon | 发布V202503.02版本
Sentieon软件快速入门指南
Sentieon 软件模块总述
Sentieon 特色流程 - DNAscope
Sentieon | DNAscope Illumina 流程
sentieon | DNAscope Complete Genomics 流程
Sentieon | DNAscope LongRead PacBio 流程
Sentieon | DNAscope Ultima Genomics 流程
Sentieon | DNAscope Element Bio 流程
Sentieon | DNAscope LongRead Nanopore 流程
Sentieon混合分析流程 - DNAscope Hybrid
Sentieon推出混合型短读长和长读长变异检测DNAscope Hybrid流程(上)
Sentieon推出混合型短读长和长读长变异检测DNAscope Hybrid流程(下)
毅硕Sentieon | 泛基因组分析流程详解
毅硕Sentieon | RNA-seq 变异检测全流程详解
毅硕Sentieon | 物种全基因组(WGS)分析流程
毅硕Sentieon | 植物全基因组(GWS)分析流程
毅硕Sentieon | 小麦(Triticum_aestivum)全基因组WGS分析流程
毅硕Sentieon | 水稻(Oryza_sativa)全基因组WGS分析流程
毅硕Sentieon | 拟南芥(Arabidopsis_thaliana)全基因组WGS分析流程
毅硕Sentieon | 马铃薯(Solanum_tuberosum)全基因组WGS分析流程
毅硕Sentieon | 巨桉(Eucalyptus grandis)全基因组WGS分析流程
毅硕Sentieon | 向日葵(Helianthus annuus)全基因组WGS分析流程
毅硕Sentieon | 野草莓(Fragaria vesca)全基因组WGS分析流程
毅硕Sentieon | 银杏(Ginkgo biloba)全基因组WGS分析流程
毅硕Sentieon | 大豆(Glycine max)全基因组WGS分析流程
毅硕Sentieon | 陆地棉(Gossypium hirsutum)全基因组WGS分析流程
毅硕Sentieon | 动物全基因组(WGS)分析流程
毅硕Sentieon | 猪(sus scrofa)全基因组WGS分析流程
毅硕Sentieon | 鸡(Gallus gallus)全基因组WGS分析流程
毅硕Sentieon | 家鼠(Mus musculus)全基因组WGS分析流程
毅硕Sentieon | 家犬(canis lupus familiaris)全基因组WGS分析流程
毅硕Sentieon | 东方蜜蜂(Apis cerana)全基因组WGS分析流程
毅硕Sentieon | 电鳗(Electrophorus electricus)全基因组WGS分析流程
毅硕Sentieon | 红隼(Falco tinnunculus)全基因组WGS分析流程
毅硕Sentieon | 家猫(Felis catus)全基因组WGS分析流程
毅硕Sentieon | 尼罗罗非鱼(Oreochromis niloticus)全基因组WGS分析流程
毅硕Sentieon文献解读
Sentieon文献解读 | Population Sequencing
Sentieon文献解读 | Agrigenomics
Sentieon | Agrigenomics-泛基因组揭示小麦结构变异与栖息地及育种的关联
Sentieon文献解读 | Genetic Disease
Sentieon文献解读 | Tumor Sequencing
Sentieon文献解读 | Benchmark and Method Study
Sentieon文献解读 | Long Read Sequencing
Sentieon文献解读 | Clinical Trial
Sentieon文献解读 | Epidemiology
Sentieon文献解读 | Gene Editing
Sentieon文献解读 | Liquid Biopsy
-
+
首页
毅硕Sentieon | 野草莓(Fragaria vesca)全基因组WGS分析流程
*今天给大家介绍的是基于 Sentieon 软件开发的用于野草莓(Fragaria vesca)全基因组测序数据的自动化流程脚本。该流程实现了从原始测序数据(FASTQ)到变异检测结果(GVCF)以及joint calling的完整分析流程,支持多个测序平台和输出格式。* *脚本支持原始测序数据(rawfastq)、过滤后的测序数据(cleanfastq),进行质控、比对、排序、标记重复、生成质量评估指标,最终通过Haplotyper 算法进行变异检测,输出 gVCF 文件。* *测试野草莓样本平均测序深度82.91x,从FastQ到VCF全流程分析最快用时8.15分钟,大幅压缩了植物群体基因组分析时间,加快科研成果转化。* --- # 1. 环境设置与参数解析 ## 1.1 Sentieon环境配置 **下载地址** 软件地址链接 - https://ftp.insvast.com/user/Sentieon/release/sentieon-genomics-202503.02.tar.gz (适配X86架构CPU服务器,例如Intel、 AMD、 曙光) - https://ftp.insvast.com/user/Sentieon/release/arm-sentieon-genomics-202503.02.tar.gz (适配ARM架构CPU服务器, 例如华为鲲鹏、 Ampare、阿⾥倚天) - **注意**:安装包下载链接用户名:insvast;密码:Ins@1234; 模型下载链接 https://github.com/Sentieon/sentieon-models [**环境设置变量[点击跳转阅读]**](http://doc.insvast.com/doc/11/) ## 1.2 变量定义与参数解析 ``` #!/bin/bash echo $0 \$SAMPLEID \$WORKDIR \$FASTQ_1 \$FASTQ_2 \$FASTA \$SUFFIX \$DATATYPE \$KEEP_CLEAN \$KEEP_BAM \$PLOIDY set -euxo pipefail ``` `echo`:打印脚本名及输入参数占位符,方便调试时确认参数顺序。 `set -euxo pipefail`:设置脚本执行规则,增强健壮性。 ``` export SAMPLEID=$1 export WORKDIR=$2 export FASTQ_1=$3 export FASTQ_2=$4 export FASTA=$5 BSUFFIX=$6 TYPE=${7:-"raw"} KEEP_CLEAN=${8:-keep} KEEP_BAM=${9:-keep} PLOIDY=${10:-2} LOGFILE=$SAMPLEID.run.log export root=/Path/sentieon/202503/sentieon-genomics-202503/bin/ ``` 从命令行读取参数,包括样本 ID、工作目录、输入文件路径等。 部分参数设置默认值。 `LOGFILE`:定义日志文件名(样本 ID+.run.log)。 `root`:sentieon工具(基因组分析软件)的安装路径。 更详细的参数表格,如下表所示: | | 参数 | 含义 | 默认值 | | --- | --- | --- | --- | |$1 |SAMPLEID |样本ID | | |$2 |WORKDIR | 工作目录 | | |$3 |FASTQ_1|FASTQ R1文件 | | |$4 |FASTQ_2 |FASTQ R2文件 | | |$5 |FASTA|参考基因组 fasta 文件 | | |$6 |BSUFFIX |输出格式:bam/cram/空格 |无默认 | |$7 |TYPE |数据类型:"raw" 或 "clean" |"raw" | |$8 |KEEP_CLEAN |是否保留质控后的 fastq |"keep" | |$9 |KEEP_BAM |是否保留去重后的 bam/cram |"keep" | |$10 |PLOIDY |样本倍性(根据实际调整 |2 | ## 1.3 输入文件有效性检查 ``` if [ "$BSUFFIX" = "bam" ] || [ "$BSUFFIX" = "cram" ] || [ "$BSUFFIX" = " " ]; then echo "$BSUFFIX check" else die "Error: check 6th blank, BSUFFIX must be 'bam' or 'cram' or space" fi ``` 检查BSUFFIX,只能是bam(二进制比对格式)、cram(压缩比对格式)或空格,否则报错退出。 ## 1.4 测序平台判断 ``` if [ -e $LOGFILE ];then export PLATFORM=$(awk '/Platform/{print $NF;exit}'$LOGFILE) else export count=$(zcat $FASTQ_1|head -n 1|awk '{print NF}') if [ $count -eq 1 ];then export PLATFORM="DNBSEQ" elif [ $count == 2 ];then export PLATFORM="ILLUMINA" elif [ $count == 3 ];then export PLATFORM="ILLUMINA" else echo"Unrecognized platform" export PLATFORM="ILLUMINA" fi fi ``` 若日志文件已存在,从日志中提取测序平台(Platform字段)。 若日志不存在,通过 FASTQ 文件首行的字段数判断平台。 ## 1.5 输出文件格式确定 ``` FAI=$FASTA.fai if [ "$BSUFFIX" = "bam" ] || [ "$BSUFFIX" = "cram" ];then export SUFFIX=$(awk -v preset=$BSUFFIX 'BEGIN{max=0}{if($2>max)max=$2}END{if(max>536870911){print "cram"}else{print preset}}' $FAI) else export SUFFIX=$(awk 'BEGIN{max=0}{if($2>max)max=$2}END{if(max>536870911){print "cram"}else{print "bam"}}' $FAI) fi ``` 根据参考基因组索引文件($FASTA.fai)中最长序列的长度决定输出比对文件格式: - 若最长序列长度 > 536870911(约 512MB),强制使用cram(更适合大基因组压缩)。 - 否则根据BSUFFIX或默认bam。 补充说明:对于单个染色体长度>536870911(约512MB)的物种(比如野草莓),Sentieon软件可以切换至cram,不用因BAM 文件索引 (.bai) 的格式限制切割染色体。 ## 1.6 环境与目录配置 ``` export TMPDIR=$WORKDIR export THREADS=$(nproc) [ -e $WORKDIR ]||mkdir -p $WORKDIR cd $WORKDIR exec >>$LOGFILE 2>&1 echo "SampleID:" $SAMPLEID echo "DataType:" $TYPE …… ``` 配置临时目录、线程数,确保工作目录存在,并将所有输出写入日志文件。 ## 1.7 设置计时函数(可选) ``` timer(){ start_time=$(date +%s) eval $2 && touch $3 end_time=$(date +%s) cost_time=$[ $end_time-$start_time ] echo -e "TIMER: $1\t$(($cost_time/60)) min $(($cost_time%60)) s" } ``` 用于记录每个分析步骤的开始/结束时间、耗时,并通过创建标记文件(如qc.ok)标记步骤完成,避免重复执行。 --- # 2. 数据质控(Raw2clean) - 双端测序质控脚本: ``` raw2clean(){ cmd="fastp -w 16 -i $FASTQ_1 -I $FASTQ_2 -o $clean1 -O $clean2 -j $SAMPLEID.qc.json -h $SAMPLEID.qc.html&&rm $FASTQ_1 $FASTQ_2" timer raw2clean "$cmd" qc.ok } ``` - 单端测序质控脚本: ``` raw2clean(){ cmd="fastp -w 16 -i $FASTQ_1 -o $clean1 -j $SAMPLEID.qc.json -h $SAMPLEID.qc.html&&rm $FASTQ_1" timer raw2clean "$cmd" qc.ok } ``` 使用fastp工具对原始 FASTQ 数据进行质控(过滤低质量reads、接头等),输出过滤后的 FASTQ 文件及质控报告文件(JSON/HTML)。 成功后创建qc.ok标记文件。 --- # 3. 序列比对与排序(Alignment) - 双端测序比对脚本: ``` alignment(){ tag="@RG\tID:rg_$SAMPLEID\tSM:$SAMPLEID\tPL:$PLATFORM" cmd="sentieon bwa mem -R \"$tag\" -t $THREADS -K 10000000 -x $ML_MODEL/bwa.model $FASTA $clean1 $clean2|sentieon util sort --temp_dir $TMPDIR -r $FASTA -o $SAMPLEID.sorted.$SUFFIX -t $THREADS --sam2bam -i -" echo $cmd timer alignment "$cmd" align.ok } ``` - 单端测序比对脚本: ``` alignment(){ tag="@RG\tID:rg_$SAMPLEID\tSM:$SAMPLEID\tPL:$PLATFORM" cmd="$root/sentieon bwa mem -R \"$tag\" -t $THREADS -K 10000000 $FASTA -x $ML_MODEL/bwa.model $clean1 |$root/sentieon util sort --temp_dir $TMPDIR -r $FASTA -o $SAMPLEID.sorted.$SUFFIX -t $THREADS --sam2bam -i -" echo $cmd timer alignment "$cmd" align.ok } ``` 使用sentieon bwa turbo进行序列比对(基于BWA算法),添加Read Group信息(用于后续变异分析),并通过sentieon util sort对结果排序,输出sorted.bam或sorted.cram。 基于测序平台选择不同的机器学习模型($ML_MODEL)优化比对。 成功后创建align.ok标记文件。 --- # 4. 生成质量评估指标(Metrics) ``` metrics(){ cmd="sentieon driver --temp_dir $TMPDIR -r $FASTA -t $THREADS -i $SAMPLEID.sorted.$SUFFIX --algo WgsMetricsAlgo $SAMPLEID.WGS_METRICS.txt --algo MeanQualityByCycle $SAMPLEID.mq_metrics.txt --algo QualDistribution $SAMPLEID.qd_metrics.txt --algo GCBias --summary $SAMPLEID.gc_summary.txt $SAMPLEID.gc_metrics.txt --algo AlignmentStat $SAMPLEID.aln_metrics.txt --algo BaseDistributionByCycle $SAMPLEID.bd_metrics.txt --algo QualityYield $SAMPLEID.qy_metrics.txt --algo InsertSizeMetricAlgo $SAMPLEID.is_metrics.txt" timer metrics "$cmd" metrics.ok } ``` 使用sentieon driver计算多种测序质量指标,包括: - 全基因组测序指标(WgsMetricsAlgo)。 - 碱基质量分布、GC 偏差、插入片段长度等。 结果输出到多个质量指标的.txt文件,成功后创建metrics.ok。 --- # 5. 标记重复序列(Dedup) ``` dedup(){ cmd="sentieon driver -r $FASTA --temp_dir $TMPDIR -t $THREADS -i $SAMPLEID.sorted.$SUFFIX --algo LocusCollector --fun score_info $SAMPLEID.score.txt&&sentieon driver -r $FASTA -t $THREADS -i $SAMPLEID.sorted.$SUFFIX --algo Dedup --score_info $SAMPLEID.score.txt --metrics $SAMPLEID.dedup_metrics.txt $SAMPLEID.deduped.$SUFFIX&&rm $SAMPLEID.sorted.$SUFFIX* $SAMPLEID.score.txt*" timer markdup "$cmd" markdup.ok } ``` 标记重复序列分两步: - `LocusCollector`:收集位点质量分数信息。 - `Dedup`:基于分数标记并去除 PCR 重复序列。 完成后删除中间文件(排序后的比对文件),创建markdup.ok。 # 6. 碱基质量重校正(BQSR可选) ``` bqsr(){ sentieon driver -t $THREADS -r $FASTA -i $SAMPLEID.deduped.$SUFFIX --algo QualCal -k $KNOWN_SITES $SAMPLEID.RECAL_DATA.TABLE sentieon driver -t $THREADS -r $FASTA -i $SAMPLEID.deduped.$SUFFIX -q $SAMPLEID.RECAL_DATA.TABLE --algo QualCal -k $KNOWN_SITES $SAMPLEID.RECAL_DATA.TABLE.POST --algo ReadWriter $SAMPLEID.deduped.RECALIBRATED.$SUFFIX timer markdup "$cmd" markdup.ok } ``` - 此过程分为两个主要部分:首先创建一个校正模型(生成 .TABLE 文件),然后应用该模型生成报告和碱基质量重校正后的bam。 - `--algo QualCal`: 指定运行的算法是 QualCal(质量校正算法)。 - `KNOWN_SITES`:已知变异数据库的VCF文件路径。 - `RECAL_DATA.TABLE`:重校准表的位置和文件名。 - `RECAL_DATA.TABLE.POST`: 临时性的后重校准表的位置和文件名。 - `--algo ReadWriter`:这一步为可选的。Sentieon® 变异检测可以在运行时使用校正前的 BAM 加上重校准表来即时执行重校正。便可以不输出巨大的BAM文件,节省磁盘的空间。 - 若选择执行这一步,第七部分变异检测中请将`$SAMPLEID.deduped.RECALIBRATED.$SUFFIX`设为输入文件。 --- # 7. 变异检测(DNAseq) ``` dnaseq(){ cmd="sentieon driver --temp_dir $TMPDIR -r $FASTA -t $THREADS -i $SAMPLEID.deduped.$SUFFIX --algo Haplotyper --emit_conf=30 --call_conf=30 --emit_mode gvcf --ploidy $PLOIDY $SAMPLEID.hc.gvcf.gz && md5sum $SAMPLEID.hc.gvcf.gz > $SAMPLEID.hc.gvcf.gz.md5" timer Haplotyper "$cmd" hc.ok } ``` 使用Haplotyper算法进行单倍型分析,生成 GVCF 文件。 计算 GVCF 文件的 MD5 ,确保文件完整性,成功后创建hc.ok。 # 8. Joint Calling ## 8.1 参数检查与使用说明 ``` #!/bin/bash [ $# -eq 0 ]&&echo Usage: $(basename $0) \$FASTA \$GVCF_LIST \$NUM \$DATADIR&&exit start_time=$(date +%s) ``` 如果脚本没有传入任何参数,则打印使用说明并退出。 使用方式:脚本名 FASTA文件 GVCF列表文件 NUM 数据目录 记录脚本开始执行的时间 ## 8.2 设置错误处理 ``` set -euo pipefail ``` `-e`: 任何命令失败则退出脚本。 `-u`: 使用未定义的变量时报错。 `-o pipefail`: 管道中任何一个命令失败则整个管道失败。 ## 8.3 参数赋值 ``` DATADIR=$4 FASTA=$1 #"$FASTA_DIR/genomeEN_split.fa" GVCF_LIST=$2 NUM=$3 ``` `$1`: 参考基因组 FASTA 文件路径。 `$2`: 包含所有样本 GVCF 文件路径的列表文件。 `$3`: 用于命名输出文件的数字标识(如批次号)。 `$4`: 数据目录,用于存放输出文件。 ## 8.4 设置线程数、工作目录和日志文件 ``` NT=$(nproc) #number of threads to use in computation, set to number of cores in the server WORKDIR="$DATADIR/JointCall-${NUM}" [ -e $WORKDIR ]||mkdir -p $WORKDIR #[ -e $file ]&&exit 0 cd $WORKDIR LOGFILE=$WORKDIR/joint-call${NUM}_run.log exec >$LOGFILE 2>&1 ``` `NT`: 获取当前系统的 CPU 核心数。 `WORKDIR`: 根据 NUM 创建唯一的工作目录。 如果目录不存在则创建,并进入该目录。 将所有标准输出和标准错误重定向到日志文件。 ## 8.5 执行联合变异检测 ``` root=/APP/u22/x86_com/sentieon/202503/sentieon-genomics-202503 cat $GVCF_LIST|$root/bin/sentieon driver -r $FASTA --algo GVCFtyper \ $WORKDIR/output${NUM}-jc.vcf.gz - || { echo echo "GVCFtyper failed"; exit 1; } ``` `cat $GVCF_LIST`: 读取 GVCF 文件列表。 `sentieon driver`: 调用 Sentieon 驱动程序。 `-r $FASTA`: 指定参考基因组。 `--algo GVCFtyper`: 使用 GVCFtyper 算法进行联合变异检测。 `output${NUM}-jc.vcf.gz`: 输出的压缩 VCF 文件。 如果命令失败,输出错误信息并退出。 ## 8.6 计算并输出运行时间(可选) ``` end_time=$(date +%s) cost_time=$[ $end_time-$start_time ] echo "joint calling time is $(($cost_time/60))min $(($cost_time%60))s" echo "the Joint-calling done at `date +%H:%M:%S` !!!" ``` 计算脚本运行的总时间,并以“分:秒”格式输出。最后输出完成时间。 --- # 9. 总结 该脚本实现了DNA测序数据从原始测序数据(FASTQ)到变异检测结果(GVCF)以及joint calling的完整分析流程,支持Illumina/DNBSEQ平台,可配置输出格式(BAM/CRAM)和中间文件保留策略,通过标记文件和日志确保流程可进行追溯,适用于大规模基因组变异检测场景。特点包括: - **参数化**:通过命令行参数灵活控制输入、输出和流程选项。 - **自动化**:自动检测测序平台和参考基因组以决定最佳分析策略。 - **稳健性**:使用 set -euxo pipefail和标记文件实现错误处理和断点续跑。 - **模块化**:将每个分析步骤封装成函数。 - **高效性**:使用商业优化的sentieon工具替代金标准GATK/BWA,速度更快。 - **可追溯性**:详细的日志记录和 MD5 校验确保结果可重现。 要运行此脚本,需要预先安装好 sentieon、fastp等软件,并准备好对应的模型文件 bundle。 [具体脚本请点击阅读](https://github.com/Sentieon/sentieon-scripts/blob/master/example_pipelines/germline/DNAseq/wgs.sh) --- # 10. 脚本应用示例 使用上述脚本对野草莓全基因组测序数据分析的测序结果,具体样本信息如下表所示: | 类别 | 详情| | --- | --- | |物种id|(Fragaria vesca)| |物种名和倍性|野草莓 (二倍体)| |参考基因组|GCF_000184155.1_FraVesHawaii_1.0_genomic.fna| |参考基因组大小(Gb)|0.21| |测试数据来源|SRR26113964| |测序平台|Illumina NovaSeq 6000| |系统版本|Ubuntu 24.04/Kernel 6.8| |cpu型号|AmpereOne A192-32X| |sentieon版本|sentieon-genomics-202503| |raw_reads|118372884| |raw_data(Gb)|17.76| |测序深度(X)|82.91| **测试数据下载:** 方法一: ``` wget -c ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR261/064/SRR26113964/SRR26113964_1.fastq.gz wget -c ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR261/064/SRR26113964/SRR26113964_2.fastq.gz ``` 方法二: ``` curl -C - -O --progress-bar ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR261/064/SRR26113964/SRR26113964_1.fastq.gz curl -C - -O --progress-bar ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR261/064/SRR26113964/SRR26113964_2.fastq.gz ``` **数据下载:** 参考基因组下载: 方法一: ``` wget -c https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/184/155/GCF_000184155.1_FraVesHawaii_1.0/GCF_000184155.1_FraVesHawaii_1.0_genomic.fna.gz ``` 方法二: ``` curl -C - -O --progress-bar https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/184/155/GCF_000184155.1_FraVesHawaii_1.0/GCF_000184155.1_FraVesHawaii_1.0_genomic.fna.gz ``` 解压 ``` gunzip GCF_000184155.1_FraVesHawaii_1.0_genomic.fna.gz ``` - 测试硬件配置 - CPU为单颗AmpereOne A192-32X - 内存为512GB DDR5 - 系统为Ubuntu 24.04/Kernel 6.8 - 测试结果 使用本文流程对野草莓全基因组测序数据进行变异检测分析,下表为不同CPU核数下的计算时间和资源调用情况: | | 128核 | 96核 | 64核 | 32核 | 16核 | | --- | --- | --- | --- | --- | --- | |比对时间(min)|5.96|5.61|7.45|15.05|25.23| |比对内存峰值(G)|23.61|27.84|24.46|21.64|23.99| |度量指标内存时间(min)|0.67|0.88|1.22|2.21|3.35| |度量指标内存(G)|2.48|2.35|2.05|1.94|0.88| |去重时间(min)|0.73|0.76|0.73|1.23|2.67| |去重内存(G)|7.14|5.23|2.73|1.33|0.89| |变异检测时间(min)|0.79|0.92|1.40|2.89|6.04| |变异检测内存(G)|6.12|4.82|3.94|2.39|1.42| |总时间(min)|8.15|8.17|10.80|21.38|37.29| 本次测试在不同的线程数上进行性能的比较。从数据中可以明显看出,随着线程数的增加,变异检测的整体效率显著提升。从FastQ到VCF全流程分析最快用时8.15分钟,大幅压缩了植物群体基因组分析时间,加快科研成果转化。 Sentieon在不断的优化算法的运行效率,为科研工作者提供更快速、更经济的基因检测方案。若您刚好有需要检测的数据,不妨来申请试用Sentieon吧! [**若要查看其他植物的全基因组分析流程,请点击此处进行跳转**](https://doc.insvast.com/doc/13/)
chsnp
2026年2月27日 14:32
转发
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
Word文件
PDF文档
PDF文档(打印)
分享
链接
类型
密码
更新密码
有效期