"课题又进行不下去了,肿么办"
"不如...测个序吧"
我可真是个小机灵鬼
作为一个学渣,我常常和小伙伴们讨论这些。没办法,课题太难,测序太火太好用。只要准备一下样本、做个测序、生信分析筛一下差异基因,接下来怎么做就很好办了!实在是个省时省力、经济实惠的延续课题,找后续研究方向的好方法。
尤其是近两年测序价格持续走低,好多测序公司都在赔钱赚吆喝,比较显眼的就是mRNA的测序已经降到了三位数(只要998!现在打电话进来的...换错台了,不好意思)
小编这就简单整理了测序的前世今生出来
"让你去测序,你干啥呢"
"磨刀不误砍柴功,对测序了解清楚才好下手啊!"
先放"太长不看版"
1. 目前,应用最广的是二代测序,其中Illumina平台几乎涵盖了测序应用的各个方面。
2. 发文章也有小诀窍,使用较新技术的文章更容易发。
接下来,小编不整那么多没用的,尽量简单地介绍一下几代测序技术及应用,帮助大家选择使用。
一代测序
一代测序的标志是:sanger测序法。1977年,Sanger首先运用双脱氧核苷酸末端终止法绘制出第一个完整的基因组图谱,标志着第一代测序技术的诞生。
原理是:在4个DNA合成反应体系(含dNTP)中分别加入一定比例带有标记的ddNTP(分别为:ddATP,ddCTP,ddGTP和ddTTP)。由于ddNTP的2'和3'都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA合成反应。通过凝胶电泳和放射自显影后可以根据电泳带的位置确定待测分子的DNA序列
sanger测序法的测序长度可达到1000bp,准确性几乎100%,一度成为测序的主流,渐渐难以满足更高的需求,费用更低、通量更高的、速度更快的二代测序应运而生。
二代测序
具代表性的二代测序平台有瑞士Roche 公司的454(已停产),美国Illumina 公司的基因组测序仪(genome analyzer,GA)、HiSeq 2000 和MiSeq, 美国ABI 公司的寡聚物连接检测测序(sequencing by oligo ligation detection, SOLiD)5500XL。
应用:其中,Roche 公司的454和ABI 公司SOLiD 逐渐退出历史舞台,Illumina 公司的测序成本最低,应用最广,几乎涵盖了测序应用的各个方面,包含基因组学(全基因组从头测序、重测序、外显子和目标区域捕获测序)、转录组学(转录组测序、数字表达谱测序、微小RNA测序和降解组测序)、表观组学(甲基化测序、简化甲基化测序、及甲基化DNA免疫共沉淀测序)等。
在此仅介绍Illumina平台边合成边测序的原理:首先在DNA片段两端加上序列已知的通用接头构建文库,文库加载到测序芯片Flowcell上,文库两端的已知序列与Flowcell基底上的Oligo序列互补,每条文库片段都经过桥式PCR扩增形成一个簇,测序时采用边合成边测序反应,即在碱基延伸过程中,每个循环反应只能延伸一个正确互补的碱基,根据四种不同的荧光信号确认碱基种类,保证最终的核酸序列质量,经过多个循环后,完整读取核酸序列。它的基本步骤包括文库制备、单克隆DNA簇的产生和测序反应。
下面介绍一下常用的几种二代测序技术:
全外显子组测序技术
全外显子组测序是指利用序列捕获技术将全基因组外显子区域的DNA捕捉并富集后进行高通量测序的基因组分析方法,对常见和罕见变异具有高灵敏度。
全基因组外显子序列人类基因组序列中不足1%,却包含着人类85%的基因信息。全外显子组测序技术已经成为疾病基因诊断和研究疾病致病基因的重要方法。
此篇文献(CD55 Deficiency, Early-Onset Protein-Losing Enteropathy, and Thrombosis)对11例早发性蛋白质丢失肠病引起的腹痛和腹泻患者进行了全外显子组测序,在编码CD55(衰变加速因子)的基因中发现了纯合的功能丧失突变,这导致蛋白质表达的丧失。
全基因组测序:
由于外显子测序只能测外显子区域,因此很可能会忽视一些调控区域及内含子区域突变引起的疾病。而全基因组测序不仅能检测编码区和非编码区的点突变、插入、缺失,还可以在全基因组范围内检测拷贝数变异和结构变异。
此篇文献(Diverse sources of C. difficile infection identified on whole-genome sequencing)对从艰难梭菌感染的患者中获得的分离株进行了全基因组测序,比较了单核苷酸变异(SNV)。
转录组测序
转录组即某个物种或特定细胞在某一功能状态下产生的所有RNA的总和,目前研究比较广的有mRNA、miRNA、lncRNA、circRNA。
转录组测序能够在整体水平上探究细胞内基因表达的种类和数量,揭示在特定条件下机体生理生化发生过程以及其中的分子机理,是研究细胞表型和功能的一个重要手段。
下面这篇文献(Characterization of circRNA-Associated-ceRNA Networks in a Senescence-Accelerated Mouse Prone 8 Brain)的研究者通过深度RNA测序找到了显著表达差异的235个circRNA,30个miRNA和1202个mRNA,研究了circRNA相关的ceRNA网络在阿尔茨海默病中的作用机制分析。
三代测序
二代测序技术虽然通量高,但读长较短。此时,三代测序应运而生,在二代的基础上增加了读长,降低了试剂成本,并加快运行速度。简单来说就是:一代测序读长较长,但通量低;二代测序通量高,但读长短;三代测序结合二者优势并加以发展,通量更高,读长更长。
三代测序的显著特点是单分子测序,即不经PCR直接进行边合成边测序,不仅简化了样品处理过程,避免了扩增可能引入的错配,而且不受鸟嘌呤和胞嘧啶或腺嘌呤和胸腺嘧啶含量的影响,因此可直接对RNA和甲基化DNA序列进行测序。
下面的这篇2018年7月2日发表在nature genetics上的文献(Adaptation and conservation insights from the koala genome)利用三代测序SMRT技术获得了高质量的考拉基因组序列,为未来的考拉保育工作提供了丰富的借鉴资源。
四代测序
四代测序的代表是:Oxford Nanopore Technologies公司的纳米孔测序技术,它不需要进行合成反应、荧光标记、洗脱和电荷耦合器件,实现了从光学检测到电子传导检测和短读长到长读长测序的双重跨越,被认作是真正的单分子测序。目前尚在研发阶段,未进行真正的商业应用。
有心的小伙伴会发现明明测序已经发展到四代,小编却在二代测序上着墨更多。这是因为虽然更优秀的新技术已经出现,但暂时并不能取代二代测序,二代测序依旧是现在的主流测序手段。原因简单说来有两点:1.三代、四代技术尚在研究阶段,有无法忽视的缺点(比如说准确率低),未能大规模应用。2.二代测序也在迅速地自我更新,好像手机系统一样,过段时间就给自己加个补丁,完善一下功能。
读到这里的都是真爱粉,再给大家讲一个小秘密:同样是做测序,用较新的技术更容易发文章。
因为没有一个技术是完美的,可能现有的技术手段有着一些缺陷,而新的技术出现弥补了这些缺陷,使结果更为准确,能够发现之前不能发现的问题,比如说上面提到的三代、四代测序,就是在二代测序上发展起来的;可能一些重要的问题应用现在的技术手段无法解决,出现了新的技术解决了这个比较有价值的问题,比如说小编接下来要讲的单细胞测序,它就解决了肿瘤异质性的问题,一出现就大火。
单细胞测序
单细胞测序技术依托于二代测序技术对单个细胞的微量核酸进行测序,它主要的优势在于其能帮助解决细胞异质性的问题。
单细胞测序的策略一般是:单细胞分离-构建测序文库-单细胞测序,但这种方法的难点在于将单细胞分离出来,待测细胞数量少,成本高。因此,目前出现了基于barcode标记的单细胞识别的技术,给每个细胞加上独一无二的barcode,测序的时候,携带相同barcode的序列即为同一个细胞,一次建库可以测得上千个细胞。
这篇文章(Single-cell RNA sequencing to explore immune cell heterogeneity)主题是通过单细胞测序研究免疫细胞的异质性,其中简单介绍了现有的单细胞测序技术,并比较了他们的优缺点,深入讨论了如何研究免疫细胞的异质性,还讨论了单细胞测序的应用场景。
关于肿瘤异质性与单细胞测序,之前也有一篇推送,没看的小伙伴请移步。
文章内容多有不足,欢迎大家批评指正。
投稿请发邮件至:liqing@gcbi.com.cn
,