在分子育种中,科学家们往往需要借助高效的基因分型技术手段,来对海量种质资源进行基因型检测,从而进行更为高效、精准地选育。在早期很长一段时间内,这类基因检测主要通过以illumina、affymetrix为代表的固相芯片来完成。固相芯片技术门槛高,此前一直为欧美寡头企业垄断。为了降低成本,近年来,出现了“液相芯片”、“低深度重测序”等以二代测序技术(NGS)为依托的高通量基因分型概念。这些技术手段的原理是什么?与固相芯片的区别在哪里?接下来的两期内容,小编将为大家一一做介绍,今天,我们就从“液相芯片”开始。
01技术原理 基于二代测序的靶向捕获测序
农业育种中,我们经常听到的“液相芯片”,实际指的是“靶向序列捕获”,英文名称为“Genotyping by target sequencing”。该类产品最先是由安捷伦公司推出的SureSelect系列产品,在进入中国后,又被国人命名为“液相芯片”。靶向序列捕获的工作原理,是基于目标探针与靶向序列互补结合的定点捕获测序。 具体实验流程如下图所示:首先,对要测试的材料进行gDNA 文库构建。同时根据 DNA 互补原理,在每个待测位点设计覆盖目标SNP的探针,采用生物素(Biotin)标记对目标探针进行修饰。然后,在液态中利用生物素修饰的探针与基因组目标区域杂交形成双链。随后利用链霉亲和素包被的磁珠对携有生物素修饰的探针进行分子吸附,从而捕获与探针杂交的靶点。最后,对捕获的靶点序列进行洗脱、靶点扩增和测序,最终获得目标SNP的基因型。从原理上看,“液相芯片”就是用于捕获特定位点或区域DNA片段的“捕获试剂盒”,在捕获完成后,仍需通过二代测序来进一步获得目标区域的基因型。相比于全基因组重测序,靶向序列捕获试剂盒能够通过有的放矢地捕获住目标区域位点,从而降低测序量,大大简化了生物信息分析和数据处理。
02技术优势 大幅降低测序成本
目前,二代测序的检测费用与数据量挂钩,然而对于绝大多数研究来说,实验人员并不需要用到全基因组的测序数据,而只需某些位点或某些DNA区域的测序数据。因此,如果进行全基因组重测序,不仅会产生大量冗余的数据,提高了数据处理难度,而且也产生了不必要的测序成本。而通过靶向序列捕获,实验人员仅需对感兴趣的区域进行测序,大大降低了测序量和数据产出量,从而降低了测序成本。因此,近年来,靶向序列捕获被广泛运用于分子育种。
03技术对比 与固相芯片有何不同?
在分子育种中,由于被冠以“液相芯片”之名的靶向测序捕获与固相芯片仅一字之差,不免让人产生疑惑:“液相芯片”与固相芯片究竟有什么区别?前面说到,“液相芯片”本质上是一种用于靶向测序捕获的捕获试剂盒,对基因型的检测仍要依靠二代测序。而固相芯片则不依赖于测序等其它基因分型技术。利用固定于固态基底(如载玻片等)的寡核苷酸探针,固相芯片能够同时对几十万乃至几百万量级的SNP位点直接进行基因分型,通量高,速度快,数据准确。
固相芯片检测原理
基于碱基互补杂交特性,设计并固定与待测位点互补的寡核苷酸探针于固体芯片上,在通过杂交反应捕获待测位点后,对探针进行单碱基延伸及荧光染色,最后利用高分辨率芯片扫描仪和数据处理软件对检测结果进行分析处理,直接获取待测位点的基因型。不同的技术原理决定了二者在实际应用中也有不同的特性。
检测周期
固相芯片有着更高的检测效率,在完成样本处理、杂交后,只需进行单碱基延伸及荧光染色,即可上机扫描。一次实验最快仅需2天就能拿到分型结果。靶向序列捕获的检测周期较长,在对样本进行处理、杂交后,还要进行扩增、建库、测序,一次实验通常需要2~4周的时间才能拿到检测结果。对于农业育种,尤其是动物品种的改良来说,提前一天拿到分型结果,就能提前一天进行淘汰选择,从而在这个过程中节省大量饲料成本、人力成本,提高空舍使用率。从这个角度来说,固相芯片为育种节约的时间成本是非常可观的。
检测灵活性
在实际检测中,固相芯片具有更高的灵活性。这是因为,靶向序列捕获依赖于二代测序,而二代测序一次开机则费用高昂,试剂盒昂贵,开机通量大。因此,在进行靶向 序列捕获时,为充分利用试剂盒及检测通量,常常需要“凑样”。而固相芯片每张芯片所需样本量少,24个样本即可上机检测,检测更灵活。
准确性
两种技术都具有高度的准确性,捕获率高,缺失数据少。重复率高,都可以达到99%以上。其中,固相芯片在交付时即具备稳定的捕获率与准确性,检出区域没有随机性,实验标准化、可重复性强。而靶向序列捕获的准确性、捕获标记数量均依赖于测序深度。需要捕获的标记数越多、数据准确性越高,则所需要的测序深度越多,目标区域检出率存在着随机性。
高通量
固相芯片和靶向序列捕获均可用于几万至几十万检测位点的高通量基因分型。但在超高通量的标记检测中(如检测标记数达百万级的高精度GWAS分析),靶向序列捕获局限于底层测序技术的检测成本、数据处理难度等难以完成,而固相芯片检测则游刃有余。因此,诸如分子育种中的全基因组选择育种(GS),或GWAS分析等都以采用高密度固相基因芯片为首选。
检测成本
固相芯片在早期的开发成本较高,但随着检测样本数量的提升,规模效应显现,单个样本的检测成本将不断降低。在大规模定制样本的情况下,固相芯片成本更低,更具优势。靶向序列捕获试剂盒的开发成本较低,但基于二代测序技术,在大规模定制样本、超高通量检测的情况下,靶向序列捕获不具成本优势。
定制灵活性
靶向序列捕获试剂盒与固相芯片都能根据实验需要按需定制检测位点。定制完成后,二者都能灵活增加检测位点。但在定制周期上,固相芯片定制周期现已缩短至10周左右,而靶向序列捕获试剂盒的定制周期可能在半年以上。靶向序列捕获试剂盒与固相芯片都能根据实验需要按需定制检测位点。定制完成后,二者都能灵活增加检测位点。但在定制周期上,固相芯片定制周期现已缩短至10周左右,而靶向序列捕获试剂盒的定制周期可能在半年以上。
灵敏性及特异性
固相芯片与靶向序列捕获都具有很高的灵敏性及特异性。固相芯片除了能够检测SNPs(单核苷酸多态性),还可检测插入缺失(Indels),拷贝数异常(CNV),可用于数量性状位点(QTL)分析。在特异性方面,Thermofisher的固相芯片已经能够做到检测相距只有10个碱基对距离的两个相邻SNP。靶向序列捕获可实现对基因组任意位置、任意长度的非高度重复区的精准捕获,包括散点、外显子、基因组片段等,可同时检测SNP、短SSR、长/短 InDel、SV、已知/未知融合基因、甲基化位点等多种类型的基因型变异。此外,靶向序列捕获对目标序列GC含量容忍性较高,可对GC含量80%以上的区域进行捕获。
知识产权
目前,固相芯片已有拉索生物成功研发完全自主知识产权的国产芯片。靶向序列捕获在进行目标区域捕获后,还需依赖二代测序平台完成后续检测。在农业育种中,固相芯片和靶向序列捕获各有千秋,都有其各自适用的场景:固相芯片适合待测位点已知,高通量、规模化的基因分型,它的处理高效便捷,能够为企业节省大量成本,提高效益。而靶向序列捕获定制灵活,灵敏度高,适合样本量、位点量较低,对时间成本不敏感,基因组学信息尚不够完善的场景。目前,由于开发及使用成本低于进口的固相芯片,靶向序列捕获被广泛运用于分子育种的各类场景,用以替代昂贵的进口固相芯片。而随着我国拥有自主知识产权的国产固相芯片研制成功,相信将为未来我国分子育种的高速发展,打开新的窗口。