高通量测序(Next Generation Sequencing,NGS)近年来飞速发展,在各个领域已被广泛应用。而文库的制备是NGS技术中极为重要的步骤。所谓文库制备(Library Preparation)就是在DNA片段两端连接上特定序列的接头的过程,让文库可以在高通量测序平台上进行测序。

文库构建的最终目的在于成功测序,并获得序列信息。那么如何判定这个文库能否上机测序呢?想必这是大家一致关注的问题。

文库的数量和质量是能否成功测序的关键。文库的浓度文库分布是评价文库质量的两个关键参数。

文库浓度测定

ngs检测的过程(干货NGS建库人都在用的文库质量评定方法)(1)

ngs检测的过程(干货NGS建库人都在用的文库质量评定方法)(2)

文库构建完成后,我们首先进行文库浓度的测定。核酸定量的方式有多种,但基于紫外分光光度的测定方法相对不够精准定量,比如Nanodrop或酶标仪,我们推荐使用染料法进行核酸定量,在文库构建中比较常用的核酸定量仪器是Thermo Life Qubit 3.0荧光定量仪

文库分布检测

如果文库浓度符合上机需求,接下来我们用Agilent 2100生物分析仪来检测其片段大小是否符合预期,其峰值大小应该是目的片段加上接头序列的总长度。

ngs检测的过程(干货NGS建库人都在用的文库质量评定方法)(3)

ngs检测的过程(干货NGS建库人都在用的文库质量评定方法)(4)

除ATAC、cfDNA和small RNA等特殊文库外,一般情况下,好的文库应该呈现出单一的、圆滑的峰且接近正态分布,并且文库中小于280 bp和大于1000 bp的片段占比不要过大(如大于20%)都可上机测序。

ngs检测的过程(干货NGS建库人都在用的文库质量评定方法)(5)

图1:常规文库2100峰型图

ngs检测的过程(干货NGS建库人都在用的文库质量评定方法)(6)

图2:cfDNA文库2100峰型图

ngs检测的过程(干货NGS建库人都在用的文库质量评定方法)(7)

图3:ATAC文库2100峰型图

常见问题和解决方案

1.文库峰型偏大

这种情况出现可能因一轮分选方案中磁珠用量过少,导致大片段残留过多。为保证文库主峰在合格上机范围内,可增加分选方案中一轮磁珠用量来解决。

ngs检测的过程(干货NGS建库人都在用的文库质量评定方法)(8)

图4:文库峰型偏大

2.在150 bp以下出现杂峰A2

这种情况可能是因为引物二聚体或者接头二聚体的出现所致,一般引物二聚体的长度在100 bp以下,接头二聚体的长度在125 bp左右。为保证测序数据的质量,可以通过减少引物使用量、连接反应前稀释接头,降低磁珠的比例对文库进行再一次纯化来解决。

ngs检测的过程(干货NGS建库人都在用的文库质量评定方法)(9)

图5:接头、引物残留峰型图

红色箭头标注为引物残留,蓝色箭头标注为接头残留

3.upper marker出现翘尾A3

高产量文库通常会出现不同程度的过度扩增现象。因为在文库扩增后期,通常引物被最先耗尽,大量文库片段在无法结合到引物的情况下,片段之间通过不完全匹配关系退火结合,从而形成部分双链 部分单链的杂合链,且片段更大。根据不同检测方式的对应原理,过度扩增产物在Agilent 2100 生物分析仪峰型中表现为upper marker之后有轻微翘尾;但以上现象均属正常,不影响文库测序和数据分析。

ngs检测的过程(干货NGS建库人都在用的文库质量评定方法)(10)

图6:过度扩增峰型图

通过以上介绍,小伙伴们是不是对文库质量评定一目了然了呢?那就赶紧动手吧!

,