illumina Miseq 平台进行 SARS-CoV-2 病毒基因组测序¶
更新于: 2022-09-01
内容简介
简介实验室采用二代测序方法在 illumia miseq 平台进行 Sars-Cov-2 基因组测序方案,结合ivar分析流程获得基因组一致性序列。
实验方法¶
- 片段化法: Nextera XT 文库试剂盒
- 连接法: NEBNext UltraII 文库试剂盒
2种方法前期逆转录和PCR扩增基本一致。对于片段化法建议使用MD或者VS long引物进行扩增实验。
1. 逆转录¶
SuperScript IV 试剂盒进行逆转录。逆转录产物cDNA可在4°C过夜或者-20°C放置一周。
2. PCR扩增¶
- Pool1 + Pool2 混合后,加入0.8x AMPure Beads,吹吸混匀,室温放置10min。
- 置于磁力架上,5min。移液器吸弃残液。
- 加入180uL 80%乙醇,30s后吸弃。共洗2次,不要将离心管从磁力架上取下。
- 将离心管取下,离心甩干,放回磁力架上,将残液吸弃,风干1min。
- 取下离心管,加入30uL水,重悬磁珠,室温放置5min。
- 置于磁力架上2min,将液体吸出即为纯化回收的扩增DNA。
- 取1uL进行定量。
3. 文库构建¶
3.1 连接法¶
试剂与耗材
- NEB Ultra II DNA Library Prep Kit for Illumina
实验步骤
- 根据定量的扩增子,计算所要进行文库构建的input DNA量,保证每个样本大于100ng,体积为26uL,相当与至少浓度为4ng/uL。
Reagent | Volume |
---|---|
NEBNext Ultra II FS Reaction Buffer | 7uL |
NEBNext Ultra II FS Enzyme Mix | 2uL |
3.2 片段化法¶
试剂与耗材
- Nextera XT LIbrary Preparation Kit
- AMPure XP Beads
- Miseq Reagent v2 PE150
实验步骤
- 将 pool1 和 pool2 的 PCR 产物混合后,使用Qubit进行定量。NEB文库构建试剂盒适合500pg~1ug的起始input DNA量。
- 取新的 PCR 管,按照下表配液,混匀后离心甩干。
试剂 | 量 |
---|---|
NEBNext Ultra II End Prep Enzyme Mix | 3 µl |
NEBNext Ultra II End Prep Reaction Buffer | 7 µl |
DNA | 50 µl |
总量 | 60 µl |
- 放置于PCR仪器上,热盖温度大于等于75°C ,运行以下程序:20°C 30min,65°C 30min,4°C hold。
- 按照下表稀释 adaptor。建议初始DNA量大于100ng,如200ng左右。
Input DNA | Adaptor | Adaptor 工作浓度 |
---|---|---|
1ug-101ng | 不稀释 | 15uM |
100ng-5ng | 1:10稀释 | 1.5 uM |
<5ng | 1:25稀释 | 0.6uM |
- 根据下表配置Adaptor连接体系。NEBNext Ultra II Ligation Master Mix加入前要颠倒混匀。
试剂 | 量 |
---|---|
前一步反应液 | 60 µl |
NEBNext Ultra II Ligation Master Mix | 30 µl |
NEBNext LIgation Enhancer | 1 µl |
NEBNext Adaptor for illumina | 2.5 µl |
总量 | 93.5 µl |
可以采用的Adaptor产品:单端(E7350),双端(E7335,E7500,E7710,E7730,E7600,E7535,E6609)
- 用200uL枪的80uL量程吹戏10次混匀。离心甩干。
- 置于金属浴或PCR仪上(不开热盖)20°C 15min。
- 向反应体系中加入3uL USER Enzyme(这个试剂包含在接头试剂盒中)。在PCR仪器上37°C 15min(热盖大于等于47°C)。
- 将液体转移到深孔板内,当input DNA大于50ng时,进行下面的DNA纯化回收。对于小于50ng DNA的样本,只需要用磁株纯化1次,用87uL量。
- 加入18uL AMPure Beads到反应液中,吹吸10次混匀,注意枪头中的液体要全部打出。室温孵育5min。
- 将深孔板置于磁力架上,静置5min待液体澄清。吸出液体到新的孔中。
- 将深孔板从磁力架上取下,加入10uL AMPure Beads,吹吸10次混匀后,室温孵育5min。
- 将深孔板置于磁力架上,静置5min待液体澄清。将液体吸弃。
- 加入80%新鲜配置的乙醇200uL,室温放置30s后吸弃。重复洗1次。
- 开盖风干磁珠5min。如果风干时间过长,会导致DNA回收率下降。
- 从磁力架上取下深孔板,17uL 10mM Tris-HCl或0.1xTE洗脱。
- 震荡仪上1800rpm震荡10min,室温放置2min。
- 将深孔板置于磁力架上,5min后待液体澄清,取1uL进行Qubit定量。
- 吸取15uL液体到新的PCR板。
数据分析
暴发疫情中病毒毒株发生结构变异的可能性较小,可以直接使用比对参考基因组的方法获得毒株基因组序列。如果是研究新发的远源病毒或长时间演化的病毒序列,可能与参考基因组差异较大时,应结合组装与比对的方法获得基因组序列。
- 使用Miseq自带的SAV软件进行basecalling,生成fastq数据后复制到安装分析软件的服务器端
- 可以采用bwa+samtools进行参考序列比对获得一致性序列,或者采用bwa等工具比对获得新冠病毒序列后在进行de novo组装。
# 最基本的比对分析流程
$ bwa index MN909847.3.fasta
# 去除可能含有的引物序列
$ fastp Sample1_R1.fastq.gz
# 比对到参考基因组
$ bwa mem -R "@RG\tID:seq1\tSM:sample1" MN909847.3.fasta \
> Sample1_R1.fastq.gz Sample1_R2.fastq.gz | samtools view -bS | \
> samtools sort -O bam -o Sample1.sorted.bam -@4
$ samtools index Sample1.sorted.bam
# 打开 igv 可视化查看突变位点
$ igv Sample1.sorted.bam
# 以bwa为例进行reads过滤后spades组装
$ bwa index MN908947.3.fasta
$ bwa mem -R "@RG\tID:seq1\tSM:sample1" MN908947.3.fasta \
> HZ-1_S1_L001_R1_001.fastq.gz HZ-1_S1_L001_R2_001.fastq.gz -t 40 | \
> samtools view -bS - | samtools sorted -@40 -O bam HZ-1.sorted.bam
$ samtools index HZ-1.sorted.bam
$ samtools faidx MN908947.3.fasta
$ samtools mpileup -uf MN908047.3.fasta HZ-1.sorted.bam | \
> bcftools call --ploidy 1 -mv -Oz > HZ-1.vcf.gz
$ tabix HZ-1.vcf.gz
$ cat MN908947.3.fasta | bcftools consensus HZ-1.vcf.gz > Hz-1_consensus.fasta
# de novo 组装
$ bwa index MN908947.3.fasta
$ bwa mem -k 45 -R "@RG\tID:HZ-1\tSM:HZ-1" MN908947.3.fasta \
> HZ-1_S1_L001_R1_001.fastq.gz HZ-1_S1_L001_R2_001.fastq.gz -t 4 | \
> samtools view -bS > HZ-1.bam
# 提取双端都比对到参考序列的reads
$ samtools view -bF 12 HZ-1.bam > HZ-1.mapped.bam
# bam格式转化成fastq格式
$ bamToFastq -i HZ-1.mapped.bam -fq HZ-1.mapped_R1.fastq -fq2 HZ-1.mapped_R2.fastq
# de novo assembly
$ shovill --trim --outdir test --R1 HZ-1.mapped_R1.fastq -fq2 HZ-1.mapped_R2.fastq --ram 16 --cpus 40
$ bwa mem -t 40 -x ont2d MN908947.3.fasta test/contigs.fa | samtools view -bS - | samtools sort -o test.sorted.bam -
$ samtools index test.sorted.bam
实验方案采用的是对1200bp的扩增子片段化并构建文库,以PE150模式进行测序。24个样本的逆转录大约需要1h,PCR扩增需要4h,文库构建大约需要12h,Miseq上机测序时间大约26h,下机生成fastq数据以及下游分析大约3h。完成整个过程大约2days时间。
这个流程优点是比较简单稳定,数据质量高,分析过程较为简单,有成熟的成套试剂盒。缺点是测序周期长,如果要加快速度需要采用更快速的机型以及PE75这样的更短的读长进行测序。总体而言更适合回溯研究,而不利于应急疫情快速获得结果。