Skip to content

二代/三代测序数据混合拼接

Mark Renton 更新于: 2020-09-15


内容简介

微生物基因组用二代加三代测序可以获得较好的基因组序列,往往可以直接获得成环的染色体。本节接单介绍一些混合组装的方法。

2代+3代数据混合组装

1.Spades

# Spades 混合拼接同一个样本 miseq 和 nanopore 测序数据
(spades)$ spades.py -m -k 33,55,77,99,121 --only_assembler -1 S1_R1.fastq.gz -2 S1_R2.fastq.gz --nanopore minion.fastq.gz -o hybrid -t 40

2.Unicycle

# 去除接头,将fastq文件压缩
(nanopore)$ for fq in {0..11}; do porechop -i *_${fq}.fastq -o ../clean/${fq}.fq; done
# 文件数量多时可用 parallel 加速
(nanopore)$ find . -name *.fastq | parallel --max-args=1 porechop -i {1} -o ../clean/{1}

# 去除低质量碱基,将reads平均Q值低于9的去除
(nanopore)$ for trim in ../clean/*.fastq; do cat ${trim} | NanoFilt -q 9 >> trimmed.fastq; done

# unicycler 混合组装illumina和nanopore数据
(nanopore)$ unicycler -1 R1.fastq.gz -2 R2.fastq.gz -l trimmed.fastq -o hybrid

参考资料