毛细管电泳法研究核酸库容量对蛋白质适配体筛选的影响

2022.07.03

李林森朱超赵毅杨歌屈锋

摘?要?毛细管电泳（CE）具有高分辨、快速分离、样品用量小和无需固相介质等优点，是高效筛选核酸适配体的方法之一。然而，由于CE的进样量少，有限的核酸库容量是否影响毛细管电泳-指数富集配体系统进化（CE-SELEX）适配体的筛选效率，尚不明确。本研究以神经元特异性烯醇化酶（NSE）为模式蛋白，考察了CE筛选中核酸库容量对筛选效率的影响，以明确CE-SELEX方法的有效性。分别使用4个浓度（0.1、1、10和100 μmol/L）的初始核酸库进行适配体筛选，比较了初始库与经3轮筛选后的次级核酸库的亲和力。结果表明，4个核酸库筛选轮次间库亲和力相近，且经2轮筛选后均得到了微摩尔级别的核酸适配体。此外，用高浓度核酸库筛选获得的序列更具多样性，但未能提升候选序列亲和力。经2轮筛选得到NSE的核酸适配体Seq qN-01，其与NSE复合物的解离常数（KD）为（4.72±0.15） μmol/L，并表现出很好的特异性。综上，核酸库容量会提高后续富集库的序列多样性，但对适配体筛选效率没有显著影响。

关键词?神经元特异性烯醇化酶;核酸库容量;核酸适配体筛选;毛细管电泳-指数富集配体系统进化

1?引言

核酸适配体（Aptamer），又被称为“化学抗体”，是通过指数富集配体系统进化（SELEX）技术体外筛选获得的寡核苷酸序列（单链DNA/ssDNA或RNA）。核酸适配体作为新型识别分子，不仅具有性质稳定、易合成和化学修饰、免疫原性低等优点，而且其识别的靶标广泛，包括金属离子、有机分子、蛋白质、细胞、微生物、病毒等[1，2]。自1990年SELEX和Aptamer概念被提出以来[3，4]，核酸适配体已成为生物传感、环境分析、疾病诊断、药物递送及医学影像等领域的研究热点之一[5～9]。近三十年来，已有超过2700种核酸适配体被报道，但很多核酸适配体在实际应用时的分子识别效果不佳，因而，核酸适配体的高效及有效筛选仍是影响其实际应用的关键问题之一[10～12]。目前，用于核酸适配体筛选的SELEX技术多达三十余种，多数SELEX技术需要8～15轮筛选，通常需要4～6周甚至数月之久，大大降低了核酸适配体的筛选效率;同时，多数SELEX技术在分离过程中引入介质（磁珠、芯片等），也会造成核酸适配体的特异性缺失[11，13，14]。毛细管电泳（Capillary electrophoresis，CE）作为一种高分辨快速分离技术，可在溶液中分离和检测核酸库和靶标-核酸复合物，筛选过程中无需固定靶标或核酸库，可大大缩短筛选周期，通常仅需1～4轮即可获得适配体。此外，CE还可用于筛选过程中蛋白与核酸相互作用表征，次级核酸库的亲和力评价等[15～19]。常规的SELEX筛选使用的核酸库容量约为1016个ssDNA序列，CE筛选时样品用量少，所用的核酸库容量约为1012个ssDNA序列[20，21]。有限的核酸库容量是否会影响适配体的筛选效率是CE-SELEX的一个存疑点。

神经元特异性烯醇化酶（NSE）是糖酵解烯醇化酶的细胞特异性同工酶，广泛分布于神经元和外周神经内分泌细胞中，是目前小细胞肺癌的诊断、预后和后续治疗中最可靠的肿瘤标志物之一[22～24]。本研究以NSE为靶蛋白，建立了基于CE的NSE核酸适配体筛选方法，采用4个不同数量级浓度的初始核酸库（0.1、1、10和100 μmol/L ssDNA库）改变库容量，以此研究核酸库容量对适配体筛选效率的影响。经过2轮CE筛选，优选了NSE的核酸适配体Seq qN-01，其复合物的解离常数（KD）为（4.72±0.15） μmol/L，并利用CE-LIF法验证了其特异性，该适配体有望用于NSE的相关分析检测。研究结果表明，从4个不同数量级浓度的初始核酸库筛选的适配体序列与NSE的亲和力相当，说明CE-SELEX在0.1～100 μmol/L浓度范围内初始核酸库的浓度和容量差异对适配体筛选效率没有显著影响。

2?实验部分

2.1?仪器与试剂

Beckman P/ACETM MDQ（美國Beckman公司），配备激光诱导荧光（LIF）检测器（488 nm激发光和520 nm发射光）;S1000TM Thermal Cycler PCR仪、电泳仪和电泳槽（美国Bio-Road公司）;T-green切胶仪（北京天根生化科技有限公司）;Illumina-Hiseq平台测序（生工生物工程（上海）股份有限公司）。

熔融石英毛细管（75 μm内径，有效长度/总长：40.2 cm/50.2 cm，河北邯郸鑫诺光纤色谱有限公司）;NSE（武汉云克隆科技股份有限公司）;80 nt荧光标记核酸库（5-FAM-AGCA GCAC AGAG GTCA GATG-40N-CCTA TGCG TGCT ACCG TGAA-3（两端为20 nt引物区固定序列，中间为40 nt随机序列））、上游引物P1（5-AGCA GCAC AGAG GTCA GATG-3）、荧光标记的上游引物5-FAM-P1（ FAM-5-AGCA GCAC AGAG GTCA GATG-3）、下游引物P2（5-TTCA CGGT AGCA CGCA TAGG-3（生工生物工程（上海）股份有限公司）;溶菌酶适配体（80 nt长度的AChE-L和60 nt长度的AChE-M）;2×Taq Plus PCR Master Mix（天根生化科技有限公司）;Na2B4O7·10H2O、H3BO3、NaOH、H3PO4、Tris-HCl（分析纯，北京化工厂）;实验用水为二次蒸馏水（ddH2O）。

适配体筛选用溶液：A：25 mmol/L Tris base，192 mmol/L Glycine，5 mmol/L K2HPO4，1 mmol/L MgCl2，2.7 mmol/L KCl，40 mmol/L NaCl（TGK，pH 8.3）;B：25 mmol/L Tris-HCl，1 mmol/L MgCl2，2.7 mmol/L KCl，40 mmol/L NaCl（Tris-HCl，pH 7.4）;C：8.1 mmol/L Na2HPO4，1.1 mmol/L KH2PO4，1 mmol/L MgCl2，2.7 mmol/L KCl，40 mmol/L NaCl（PBS，pH 7.4）;D：20 mmol/L HEPES，150 mmol/L NaCl（HEPES，pH 7.5）。上述溶液均用ddH2O配制，并经 0.22 μm滤膜过滤后使用。

2.2?实验方法

2.2.1?蛋白和核酸库溶液配制?NSE使用ddH2O配制成10 μmol/L储备液，80℃保存。核酸库配制成100 μmol/L溶液，使用前在94℃变性5 min，缓慢冷却至室温，再稀释至所需浓度。

2.2.2?毛细管电泳分离分析?将NSE和核酸库在PCR管中混匀，37℃水浴孵育30 min。CE分析条件：50 mmol/L硼酸-硼砂缓冲液（pH 8.7），分离电压20 kV，温度25℃，LIF检测，0.5 psi（1 psi=6.895 kPa）进样10 s。将所需复合物收集到含50 μL缓冲液的PCR管中，用于后续PCR。每次CE运行间分别用0.1 mol/L NaOH、ddH2O、H3BO3/Na2B4O7溶液冲洗毛细管3 min。新毛细管使用前，用1 mol/L NaOH、0.1 mol/L NaOH和ddH2O各冲洗30 min。

2.2.3?核酸序列分析与亲和力表征?PCR扩增包含对称PCR和不对称PCR两个步骤，PCR扩增产物使用2%琼脂糖凝胶电泳进行纯化，具体步骤参考文献[25]。M-fold软件用于预测候选核酸适配体序列的二级结构。亲和力KD计算参考NECEEM方法，计算公式如下[16，26]：

其中，[P]0和[DNA]0分别是平衡体系中蛋白质和核酸的总浓度;A1是游离核酸的峰面积，A2是蛋白质-核酸复合物的峰面积，A3是复合物解离区的峰面积。

3?结果与讨论

3.1?NSE-ssDNA复合物形成和验证

将1 μmol/L核酸库与等体积水混合，进行CE分析，7.5 min处出现明显的核酸库峰。加入NSE蛋白，核酸库峰降低，并在3.5 min处出现新峰，此峰随NSE浓度增加（2.5、5和10 μmol/L）而增大（图1A），是NSE-ssDNA复合物。这也说明NSE与核酸库中的一些核酸序列之间发生相互作用，并能形成稳定的复合物。

进一步考察了溶液对复合物形成的影响。分别用ddH2O、TGK、Tris-HCl、PBS、HEPES溶液配制核酸库，使核酸库与NSE在上述溶液中孵育后进行CE分析。由图1B可见，5种溶液中均可形成NSE-ssDNA复合物，2.5 min处有明显的复合物峰。其中，ddH2O和TGK溶液中产生的复合物峰较小;而Tris-HCl、PBS和HEPES溶液中产生的复合物峰高比ddH2O中提高约4倍，表明Tris-HCl、PBS和HEPES溶液更有利于NSE-ssDNA复合物的形成和稳定。HEPES溶液中产生的复合物峰最大，后续实验中选择HEPES为孵育缓冲液。

3.2?不同濃度核酸库的筛选效率比较

将4个浓度的初始核酸库（0.1、1、10和100 μmol/L）分别与5 μmol/L NSE混合孵育，进行CE分离。收集NSE-ssDNA复合物进行PCR扩增，再纯化后，制成次级核酸库，完成1轮筛选，此过程可重复进行，实现多轮筛选。通过CE-LIF测定每轮核酸库与NSE复合物的亲和力，监测每轮次级核酸库的亲和力，评估核酸库的富集程度，直至次级核酸库的亲和力不再提升时，停止筛选。

由图2A可见，较低浓度的初始核酸库ssDNA0（0.1和1 μmol/L）中加入NSE，只有很小的复合物峰出现，而10和100 μmol/L核酸库中加入NSE，复合物峰明显增大。100 μmol/L核酸库产生的复合物峰面积约为前者的10倍，说明相同浓度的NSE在高浓度的核酸库中结合了更多的核酸。将此复合物收集、扩增、纯化，得到第1轮筛选后的次级核酸库ssDNA1。继续第2轮筛选，得到ssDNA2。对4个浓度的初始核酸库分别进行2轮筛选，在2轮筛选得到的次级核酸库ssDNA2中分别加入NSE。由图2B可见，4个次级库与NSE形成的复合物峰都很小，特别是100和0.1 μmol/L形成的复合物峰没有明显差异。4个浓度的初始核酸库（浓度相差104倍）经过2轮筛选后，次级核酸库ssDNA2与NSE的结合已无明显差异。说明初始核酸库的浓度并不决定次级核酸库中与NSE结合的核酸序列的数量。这也进一步说明，高浓度的初始核酸库中可能有大部分核酸序列与NSE的结合较弱，形成的复合物也不稳定。经过两轮筛选，与NSE结合弱的核酸序列几乎都被去除。由于核酸库是各种核酸序列的混合，核酸库合成时，中间随机区的序列具有不确定性。因此，高浓度的核酸库中并不能确定含有更多可与NSE强结合的核酸序列，高浓度和低浓度核酸库中含有的强结合核酸序列可能是恒定的，因此，核酸库的容量并不决定适配体的筛选效率。

为定量评价核酸库与NSE的结合强弱，分别测定4个初始核酸库ssDNA0与NSE的解离常数KD。由图3A可见，初始核酸库ssDNA0的KD≈40 μmol/L，经过3轮筛选后，再测定3个次级库ssDNA1、ssDNA2和ssDNA3的KD。经过1轮筛选后，次级核酸库ssDNA1的KD明显降低，说明其亲和力明显提升，初始核酸库中结合力强的序列得到富集。经第2轮和第3轮筛选后的KD值变化不大，平均KD≈10 μmol/L。4个浓度的初始核酸库经过筛选后得到的次级库KD值在同一数量级（图3A），说明不同浓度的核酸库经过两轮CE筛选后，其与NSE结合的亲和力相当。

值得注意的是，高浓度（100 μmol/L）的初始核酸库经第1轮筛选后，次级核酸库的亲和力反而低于其它浓度的核酸库（KD≈20 μmol/L）。可能的原因是，高浓度核酸库形成的复合物量大，复合物中含有的不均一核酸序列也多，而PCR存在的偏性扩增可能导致强结合的序列未能成比例地有效扩增，故高浓度次级库的亲和力并未达预期。但经过第2轮、第3轮筛选后，大部分核酸序列去除，这种扩增所致的差异已不明显。此外，与第2轮筛选相比，第3轮筛选并不能使KD进一步提升，甚至降低，这说明过多的筛选轮数不仅造成时间和费用的浪费，而且多次PCR过程可能引入较大的碱基错配、偏性扩增等误差。因此，较多的筛选轮次并不能明显提高核酸库的平均亲和力。

第2輪筛选后，收集的复合物的PCR产物的琼脂糖凝胶电泳图如图3B所示，4个浓度的核酸库产生的复合物的扩增产物在50～100 bp区间内均有清晰的、亮度相近的DNA条带，且没有多余杂带。这也说明4个核酸库经过2轮筛选后，其复合物的PCR产物量相当。因此，在本研究选择的浓度范围内，初始核酸库的浓度不会影响后续产生的适配体的数量。

3.3?高通量测序与数据分析

收集2轮筛选的ssDNA2-NSE复合物，PCR扩增后，经Illumina-Miseq高通量测序，使用Fastaptamer软件对ssDNA2序列进行统计分析。4个核酸库中筛选出的核酸序列测序后的总序列数分别为179355、185306、166185和171142，总量相差不大，但不同序列的数量（序列多样性）有差异。100 μmol/L核酸库，筛选后的序列多样性为总序列数的93.95%，而0.1 μmol/L核酸库，序列多样性占78.33%。这也说明从高浓度初始核酸库筛选得到的次级库，其核酸序列的多样性可能更好，但核酸库中的序列多样性与筛选序列的亲和力没有必然相关性。图2和图3的定性和定量分析结果也表明核酸库浓度对所筛选序列的亲和力没有显著影响。

3.4?候选序列的选择及亲和力分析

对每个核酸库中2轮筛选后的ssDNA2进行高通量测序，从大量核酸序列中选择10条核酸序列作为候选序列。这10条候选序列分别是每个次级库中出现频率最高的两条序列（Seq qN-01～08）、一条随机序列（Seq qN-09）、4个库中的共有序列（Seq qN-10）。图4为M-fold软件给出序列的二级结构。10条候选序列中Seq qN-01表现出最佳的亲和力，KD=（4.72±0.15） μmol/L;其余候选序列的KD≈6.5 μmol/L;这些序列表现出相近的亲和力（μmol级）（表2），与图3A核酸库的总亲和力结果吻合。其中，Seq qN-10为4个核酸库中的共同序列，出现的频率和比率均最高，测定其KD=（7.84±1.31） μmol/L;而随机序列Seq qN-09的KD=（8.51±1.67） μmol/L，与Seq qN-10亲和力相近。此结果也与文献[27]一致，即CE筛选中序列出现的频次与其亲和力强弱之间没有统计差异。

3.5?适配体特异性分析

以亲和力最优的Seq qN-01为候选适配体，验证其对NSE蛋白结合的特异性。将Seq qN-01分别与NSE及血清相关蛋白（细胞色素C、血红蛋白、人凝血酶、免疫球蛋白G（IgG）、人血清白蛋白（HSA））混合孵育后，进行CE分析。由图5A可见，Seq qN-01与NSE的混合物在2.6 min有明显的复合物峰，而与其它5种蛋白的混合物没有复合物峰，说明筛选的Seq qN-01对NSE具有选择性识别能力。以两条溶菌酶的适配体序列（AChE-L和AChE-M）为对照，它们是与NSE不相关的核酸序列，故与NSE没有相互作用，图5B中没有复合物峰。而Seq qN-01与NSE可形成明显的复合物峰。当Seq qN-01与溶菌酶的两条适配体序列混合，其中加入NSE，仍然可见复合物峰，表明只有Seq qN-01对NSE具有特异性识别。

4?结论

基于CE-SELEX建立了筛选NSE适配体的方法，使用4种不同浓度的初始核酸库（0.1、1、10和100 μmol/L），通过比较3轮筛选的库间亲和力、序列多样性以及筛选后得到的序列亲和力，研究核酸库容量对适配体筛选效率的影响。实验结果表明，尽管浓度较高的大容量核酸库中含有更多的ssDNA序列，但从中筛选的核酸适配体序列亲和力与容量小的核酸库中筛选的序列亲和力相当。说明在CE-SELEX中核酸库容量对适配体筛选效率并没有显著影响，进一步说明ssDNA库中序列的多样性不是获得高亲和力适配体的关键，而能够获得有识别功能的核酸序列是成功筛选的关键。尽管CE-SELEX中所用的核酸库容量小于其它SELEX方法，但仅需2轮筛选即可获到NSE的高亲和力、高特异性的适配体Seq qN-01（KD=（4.72±0.15） μmol/L），其亲和力和特异性令人满意。

Reference

1?Munzar J D，Ng A，Juncker D. Chem. Soc. Rev.，?2019，48（5）： 1390-1419

2?Rthlisberger P，Hollenstein M. Adv. Drug Delivery Rev.，???2018，134： 3-21

3?Ellington A D，Szostak J W. Nature，???1990，346（6287）： 818-822

4?Tuerk C，Gold L. Science，?1990，249（4968）： 505-510

5?Ou D，Sun D P，Lin X G，Liang Z X，Zhong Y S，Chen Z G. J. Mater. Chem. B，?2019，7（23）： 3661-3669

6?Fraser L A，Kinghorn A B，Dirkzwager R M，Liang S L，Cheung Y W，Lim B，Shiu S C C，Tang M S L，Andrew D，Manitta J，Richards J S，Tanner J A. Biosens. Bioelectron.，???2018，100： 591-596

7?Yang L，Sun H，Liu Y，Hou W，Yang Y，Cai R，Cui C，Zhang P，Pan X，Li X. Angew. Chem. Int. Edit.，???2018，57（52）： 17048-17052

8?Meng H M，Liu H，Kuai H，Peng R，Mo L，Zhang X B. Chem. Soc. Rev.，???2016，45（9）： 2583-2602

9?Nguyen V T，Kwon Y S，Gu M B. Curr. Opin. Biotech.，??2017，45： 15-23

10?Lee J F，Hesselberth J R，Meyers L A，Ellington A D. Nucleic Acids Res.，???2004，32（1）： D95

11?Zhuo Z L，Yu Y Y，Wang M L，Li J，Zhang Z K，Liu J，Wu X H，Lu A P，Zhang G，Zhang B T. Int. J. Mol. Sci.，???2017，18（10）： 2142

12?Zhu C，Yang G，Ghulam M，Li L，Qu F. Biotechnol. Adv.，???2019，37（8）： 107432

13?Gotrik M R，Feagin T A，Csordas A T，Nakamoto M A，Soh H T. Acc. Chem. Res.，???2016，49： 1903-1910

14?Bayat P，Nosrati R，Alibolandi M，Rafatpanah H，Abnous K，Khedri M，Ramezani M. Biochimie，?2018，154： 132-155

15?Mendonsa S D，Bowser M T. J. Am. Chem. Soc.，???2004，126（1）： 20-21

16?Berezovski M，Drabovich A，Krylova S M，Musheev M，Okhonin V，Petrov A，Krylov S N. J. Am. Chem. Soc.，???2005，127（9）： 3165-3171

17?Mallikaratchy P，Stahelin R V，Cao Z，Cho W，Tan W. Chem. Commun.，???2006，（30）： 3229-3231

18?Luo Z，Zhou H，Jiang H，Ou H，Li X，Zhang L. Analyst，?2015，140（8）： 2664-2670

19?Li X，He Y，Ma Y，Bie Z，Liu B，Liu Z. Anal. Chem.，???2016，88（19）： 9805-9812

20?Ruff P，Pai R B，Storici F. ISRN Mol. Biol.，???2012： ?939083

21?Wang T，Chen C，Larcher L M，Barrero R A，Veedu R N. Biotechnol. Adv.，???2019，37（1）： 28-50

22?Fizazi K，Cojean I，Pignon J P，Rixe O，Gatineau M，Hadef S，Arriagada R，Baldeyrou P，Comoy E，Chevalier T L. Cancer，?1998，82（6）： 1049-1055

23?Erbaycu A E，Gunduz A，Batum O，Ucar Z Z，Tuksavul F，Guclu S Z. Arch. Bronconeumol.，???2010，46（7）： 364-369

24?Duffy M J，OByrne K. Adv. Clin. Chem.，???2018，86： 1-21

25?YANG Ge，ZHU Chao，LIU Xiao-Hui，WANG Yong，QU Feng. Chinese J. Anal. Chem.，???2018，46（10）： 1595-1603

楊歌，朱超，刘晓慧，王勇，屈锋. 分析化学，2018，46（10）： 1595-1603

26?Berezovski M V，Musheev M U，Drabovich A P，Jitkova J V，Krylov S N. Nat. Protoc.，???2006，1（3）： 1359-1369

27?Jing M，Bowser M T. Anal. Chem.，???2013，85（22）： 10761-10770