1、(10)申请公布号 CN 102797044 A(43)申请公布日 2012.11.28CN102797044A*CN102797044A*(21)申请号 201210291096.2(22)申请日 2012.08.16C40B 40/08(2006.01)C40B 50/06(2006.01)C12N 15/10(2006.01)(71)申请人北京诺兰信生化科技有限责任公司地址 100193 北京市海淀区天秀路10号北京建设大学622室(72)发明人罗昊澍其他发明人请求不公开姓名(54) 发明名称一种快速高效的均一化全长cDNA文库构建方法(57) 摘要一种高效快速的均一化全长cDNA文库构
2、建方法,该方法利用特定的5-OH寡核苷酸封闭非全长mRNA,在用烟草酸焦磷酸酶除去mRNA5端的帽子结构,使mRNA5端帽子结构处的磷酸基团暴露出来,用高效的RNA连接系统在mRNA的5端连上一段优化的寡聚核糖核酸作为引发第二链cDNA合成的引物结合位点,最后经反转录,二链合成、分级纯化后,将双链DNA克隆于载体中。该方法具有简洁高效的全长mRNA筛选功能,实现对真核生物全长mRNA的捕获,mRNA5末端含有生物素标记,可用于全长mRNA分离,所用寡核苷酸引物含有优化的修饰方法及核苷酸序列,可实现真核生物mRNA全场捕获、反转录以及DNA的合成。(51)Int.Cl.权利要求书1页 说明书8页
3、 附图3页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书 1 页 说明书 8 页 附图 3 页1/1页21.一种高效快速的均一化全长cDNA文库构建方法,包括mRNA的差减/均一化处理,全长cDNA的获得,二链cDNA的合成及文库的获得,其特征在于差减/均一化处理采用直接在磁珠上合成cDNA第一链后与mRNA进行杂交后,用磁珠分离法将高表达的mRNA除去得到稀有表达的mRNA;全长cDNA的获得以及二链cDNA的合成结合改进后的Oligo-capping法一步获得全长mRNA以及改进后的Cap-trapper法获得第二链cDNA。2.如权利要求1所述的高效快速的均一化全长c
4、DNA文库构建方法,其特征在于构建方法包括以下步骤:1)mRNA与磁珠的结合并进行cDNA第一链的转录;2)均一化杂交及冗余RNA的去除;3)捕获全长mRNA并进行5-Adapter的连接;4)cDNA第一链的合成;5)cDNA第二链的合成;6)双链DNA的分级纯化;7)双链DNA的重组;8)重组产物的电转化;9)菌落PCR鉴定重组克隆的阳性率。3.如权利要求1所述的高效快速的均一化全长cDNA文库构建方法,其特征在于:cDNA第一链的合成时引入SEQ IN No.1-SEQ IN No.4序列。4.如权利要求1所述的高效快速的均一化全长cDNA文库构建方法,其特征在于:菌落PCR鉴定重组克隆
5、的阳性率引入SEQ IN No.5和SEQ IN No.6序列。权 利 要 求 书CN 102797044 A1/8页3一种快速高效的均一化全长 cDNA 文库构建方法 技术领域0001 本发明涉及一种快速高效的均一化全长cDNA文库构建方法,属于现代分子生物学技术领域。 背景技术0002 全长cDNA文库不仅能大大提高基因测序和生物信息学分析的进程,还利于后期蛋白质表达及功能分析,也是高效、大规模获得基因序列信息的一条有效途径,尤其是对基因组庞大,近期内尚不能进行全基因组测序的生物来说更是进行功能基因组研究的一条重要途径。即使在模式生物,如拟南芥、水稻、秀丽线虫等全基因组测序完成后,分子生物
6、学家们仍旧构建了相应生物的全长cDNA文库,并进行了大规模的全长cDNA测序,以深入了解基因的功能。如:拟南芥(A.thaliana),小鼠(M.musculus),果蝇(D.melanoga ster),水稻(O.sati2va)等等,产生了大量有价值的数据,由此科学家们也取得了很多全新的研究成果,极大地促进了功能基因组学研究,推动了医学、农业和环保生物技术产品的开发。 0003 构建高质量全长cDNA文库是一个技术难度大、成本高、耗时长的重要生物技术。首先,获取完整的mRNA比较困难;其次,全长cDNA也不易得到;第三,有效区分全长和截短的基因非常棘手;第四,由于基因序列长短不同,克隆生长
7、快慢也不一致,很容易导致小片段基因的富集。而基于普通cDNA文库中的基因片段来获取全长基因的方法(如RACE技术)在整个基因组范围内大规模、高通量地发 掘新基因是难以想象的。 0004 此外,要想获得高质量有价值的全长cDNA文库,mRNA的均一化处理非常关键。全长cDNA文库在一定程度上解决了大规模获得全长cDNA的问题,但如果想通过大规模测序来发掘新基因,还有一个无法回避的现实问题就是:冗余序列。为了提高发掘稀有表达新基因的效率,还需要对全长cDNA文库进行差减/均一化。目前有基于DNA复性动力学原理或基因组饱和杂交的方法进行cDNA文库的均一化处理方法。前者利用DSN(duplex-sp
8、ecific nuclease)特异降解mRNA/DNA双链中的DNA,后者将具有互补性的基因组DNA固定在磁珠上,与文库质粒进行杂交,收集流出组分。 0005 目前,在全长cDNA文库构建方面已经取得了很大的进展,全长cDNA文库的构建方法也不断涌现,其中主要有:CAPture法1、Oligo-capping法2、SMART3法、以及Cap-jumping法4等。 0006 1.CAPture法 0007 CAPture法(mRNA Cap Retention Procedure)利用真核生物mRNA的帽子结构和帽子结合蛋白(转录起始因子eIF-4e)相互作用的动力学原理来捕获全长cDNA。
9、首先,在反转录酶的作用下将mRNA转录为cDNA,形成cDNA/mRNA双链复合体;接着,用RNaseA对cDNA/mRNA双链分子进行酶切。如果反转录不彻底,cDNA没有延伸到mRNA的帽子结构部位,那么靠近mRNA5端的mRNA将以单链形式存在,这种情况下,RNaseA就能将这类mRNA的帽子结构切除掉,因此这类cDNA/mRNA双链复合体也就不再携带帽子结构。 0008 CAPture法采用RNAseA酶切cDNA/mRNA复合体,以除去短截的(没有完全转录)复说 明 书CN 102797044 A2/8页4合体中mRNA5端的帽子结构。但RNaseA具有碱基偏爱性,它能够有效切割富含嘧
10、啶的单链RNA,而对嘌呤含量较高的mRNA消化效率却很低,甚至不能切割。一般来说,mRNA的5端G+C含量普遍较高,尤其在5端非编码区,这种现象更为明显,也正是由于这种原因,致使短截cDNA掺入到全长cDNA中,导致全长cDNA在文库中的比例下降,文库中全长cDNA的比例不是很高(6070)。 0009 2.Oligo-capping法 0010 Oligo-capping法(Oligo-capping)利用细菌碱性磷酸酶(Bacterial alkaline phosphatase BAP)水解5端不完整的mRNA的5磷酸团,防止短截的mRNA在后续反应中与寡聚核糖核酸连接;接着,用烟草酸焦
11、磷酸酶(Tobacco acid pyrophosphatase TAP)除去mRNA5端的帽子结构,使mRNA5端帽子结构处的磷酸基团暴露出来;然后,用T4RNA连接酶mRNA的5端连上一段寡聚核糖核酸,作为引发第二链cDNA合成的引物结合位点,最后经反转录,PCR扩增、酶切、连接,建成目的文库。 0011 Oligo-capping法构建cDNA文库涉及多种酶促反应,酶的效率将直接影响文库的最终质量。实验中所用的T4RNA连接酶对文库的构建至关重要,通常RNA连接酶的连接效率没有DNA连接酶高。此外,该方法涉及PCR扩增,而PCR反应常常会由于模板DNA的长度不同,G+C碱基的含量高低不一
12、致以及模板自身的二级结构等因 素的影响,导致扩增产物之间比例失调,甚至有些基因由于自身结构比较复杂,无法用PCR的方法进行扩增。以上不利因素都会影响稀有表达基因的发掘。 0012 3.SMART法 0013 SMART法(Switching Mechanism At5end of RNA Transcript method/SMART method)利用反转录酶PowerScript RT的末端转移酶活性来实现的。当反转录达到mRNA的5端时,PowerScript RT就能够在双链核酸的3端添加几个脱氧胞嘧啶(dC),而对于非全长cDNA,由于反转录延伸没有达到mRNA的5端,Powersc
13、ript RT不能在其不完整的3末端加上dC。在cDNA第二链合成时,3端携带oligo(dG)的第二链引物也就不能与短截的ss-cDNA结合,因而这类cDNA不能合成互补链,最终得到的dsDNA都是全长的。 0014 SMART法设计很巧妙,但也存在一定的缺陷。由于相当多的cDNA内部存在寡聚dC,而这种方法在第二链cDNA合成时复性温度不是很高,有些存在于基因内部的寡聚dC有机会与末端携带几个dG的第二链引物退火,从而在cDNA的内部引发第二链cDNA的合成,导致文库中短截cDNA的比例升高。此外,由于cDNA的5端G+C含量较高,所以这类事件发生的几率也大大提高(大规模测序的结果也证明了
14、这一点)。 0015 4.Cap-trapper法 0016 Cap-trapper法(Cap-trapp er method)利用高碘酸钠的氧化特性,在低温、避光条件下特异氧化cDNA/mRNA复合体中mRNA5和 3端末位核糖上的两个相邻的羟基(2-2OH和3-2OH)。经NaIO4作用后,mRNA两端的邻二醇基团被氧化成二醛基团,后者在一定条件下能够与生物素结合,而生物素化的cDNA/mRNA复合体可被链霉亲和素包被的磁珠来分离出来。此外,采用RNase I对双链复合体进行酶切,RNase I可以消化以单链状态存在的mRNA,而且没有碱基特异性。在第二链cDNA的合成时,第二链引物结合位
15、点的引入可采用两种方法:一种是通过末端转移酶在单链cDNA的3端加上一段poly(G),另一种是在利用DNA连接酶在cDNA的3端加上一段寡核苷酸。Cap-trapper法和Cap-jumping法说 明 书CN 102797044 A3/8页5均利用高碘酸钠来氧化mRNA5和3端核糖上的邻二醇基团,使之变为二醛基团。步骤繁琐,效率低,耗时间,不利用高通量文库构建。 0017 现有构建全长cDNA文库的方法各具特色,也都存在一定的缺陷,它们有的涉及PCR扩增,极易改变文库中克隆的代表性,并影响难扩增基因的克隆;有的以质粒为载体,不利于大片段基因的克隆;有的实验流程长,步骤繁琐;有的成本高,效率
16、底等。而且目前已有的4种构建方法均没有包含均一化这个关键技术步骤,而需单独进行均一化处理,这样大大增加了操作的难度、时间成本和工作量,存在较大的技术缺陷。 发明内容0018 针对上述缺点,本发明提供一种快速高效均一化全长cDNA文库构建方法。 0019 本发明的目的之一是通过以下技术方案来实现的:利用特定的5-OH 寡核苷酸封闭非全长mRNA,在用烟草酸焦磷酸酶(Tobacco acid pyrophosphatase,TAP)除去mRNA5端的帽子结构,使mRNA5端帽子结构处的磷酸基团暴露出来,用高效的RNA连接系统在mRNA的5端连上一段优化的寡聚核糖核酸作为引发第二链cDNA合成的引物
17、结合位点,最后经反转录,二链合成、分级纯化后,将双链DNA克隆于载体中。包括以下步骤: 0020 (1)mRNA与磁珠的结合并进行cDNA第一链的转录,取10ugmRNA,与100ul带有oligo d(T)25的磁珠进行结合,25孵育1小时;用500ul 1X RT buffer洗一次,进行以下反应: 0021 10ul M-MLV(final2000U) 0022 2.5ul dNTP(10mM each) 0023 10ul 10X RT buffe 0024 H2O(DEPC treated) 0025 反应条件: 0026 505min 0027 4530min 0028 5030m
18、in 0029 5530min 0030 (2)将反转录后结合有cDNA第一链的磁珠用TE buffer洗两次,加入Hybridization buffer和mRNA,于55杂交20min,将结合有mRNA/cDNA复合体用磁铁分离,再生磁珠,含有mRNA的上清与磁珠进行杂交,反复杂交3次。 0031 (3)捕获全长mRNA并进行5-Adapter的连接 0032 (4)cDNA第一链的合成以及反应产物纯化,引入SEQ IN No.1-SEQ IN No.4序列, 0033 (5)cDNA第二链的合成; 0034 (6)双链DNA的分级纯化 0035 (7)双链DNA的重组 0036 (8)重
19、组产物的电转化 0037 本发明所要解决的技术问题包括: 0038 1.具有简洁高效的全长mRNA筛选功能,实现对真核生物全长mRNA的捕获。 0039 2.mRNA5末端含有生物素标记,可用于全长mRNA分离。 说 明 书CN 102797044 A4/8页60040 3.所用寡核苷酸引物含有优化的修饰方法及核苷酸序列,可实现真核生物mRNA全场捕获、反转录以及DNA的合成。 0041 4.双链DNA接头含有attB的重组位点,可利用Gateway克隆至载体。 0042 5.对mRNA的起始量要求小,可用于少量材料的文库构建。 附图说明0043 下面结合附图对本发明的具体实施例作进一步详细的
20、说明。 0044 图1.磁珠上进行mRNA的反转录示意图 0045 图2.均一化前后的mRNA电泳检测 0046 图3.均一化后的mRNA的纯度测定 0047 图4.Ds DNA合成产物的电泳及与某品牌试剂盒产物的比较 0048 图5.Ds DNA的分级纯化产物电泳 0049 图6.携带cDNA序列的重组质粒示意图 0050 图7.文库克隆菌落PCRF产物电泳 具体实施方式0051 以下将结合附图,对本发明的优选实施例进行详细的描述;应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。 0052 本发明构建cDNA文库的过程可分为3个部分:1)mRNA的差减/均一化处理;2)
21、全长cDNA的获得;3)二链cDNA的合成及文库的获得。在这3个部分中,差减/均一化处理采用直接在磁珠上合成cDNA第一链后与mRNA进行杂交后,用磁珠分离法将高表达的mRNA除去,最终得到稀有表达的mRNA;其他两部分的方法和步骤结合改进后的Oligo-capping法一步获得全长mRNA以及改进后的Cap-trapper法获得第二链cDNA。 0053 一、mRNA与磁珠的结合并进行cDNA第一链的转录 0054 取10ug mRNA,与100ul带有oligo d(T)25的磁珠进行结合,25孵育1小时;用500ul 1X RT buffer洗一次,进行以下反应: 0055 10ul M
22、-MLV(final 2000U) 0056 2.5ul dNTP(10mM each) 0057 10ul 10X RT buffe 0058 H2O(DEPC treated) 0059 反应条件: 0060 505min 0061 4530min 0062 5030min 0063 5530min 0064 二、均一化杂交及冗余RNA的去除 0065 将反转录后结合有cDNA第一链的磁珠用TE buffer洗两次,加入200ul Hybridization buffer(10mM Tris-HCl,pH7.5;1mM EDTA;100mM NaCl)和10ug mRNA,于55杂交20m
23、in,将结合有mRNA/cDNA复合体用磁铁分离,再生磁珠(705min,冰上2min;说 明 书CN 102797044 A5/8页7TE洗两次),含有mRNA的上清与磁珠进行杂交,反复杂交3次。 0066 三、捕获全长mRNA并进行5-Adapter的连接 0067 1.取均一化后的mRNA200-500ng,加入BAP/TAP反应混合液10ul(10U BAP;50U TAP;10mM HEPESpH7.0;1-mercaptoethanol;0.1Triton X-100),补足ddH2O至50ul,于37反应1小时。 0068 2.反应产物纯化 0069 (1)将上述反应液加入350
24、ul ddH2O,400ul溶液Binding buffer(10mM Tris-HCl,pH7.5;1mM EDTA;0.3M NaCl,),400ul无水乙醇(常温), 0070 (2)混匀上述溶液,取600ul置于离心柱中,室温6000g离心1分钟,弃流出液,取剩余600液体重复上述步骤, 0071 (3)离心柱内加入400ul溶液Washing buffer(1.0M NaCl;50mM MOPS,pH7.0;15isopropanol(v/v),室温6000g离心1分钟,弃流出液, 0072 (4)离心柱内加入400ul溶液Washing buffer,室温16000g离心1分钟,弃
25、流出液,将离心柱置于一个干净的EP管中,开盖置于室温2分钟。 0073 (5)加入12ul ddH2O于离心柱中央,室温静置2分钟,室温16000g离心1分钟,另取12ul ddH2O于离心柱中央,重复上述操作。共获得24ul洗脱液,进行d步骤。 0074 3.5-Adapter的连接 0075 22ul的上一步骤洗脱液;27ul的反应液(1mMATP50mM Tris-HCl,pH7.0;10mM MgCl2;1mM Dithiothreitol;15PEG8000;100uM RNA adapter5-Biotin-GG2-OMe ACAACTTTG2-OMe TACAAAAAAG2-OM
26、e TTG2-OMe GGCAG2-OMe G-3);1ul RNA ligase I(10U);总体积50ul。37反应1h。 0076 4.反应产物纯化 0077 (1)上述反应液加入350ul ddH2O,400ul溶液Binding buffer,400ul无水乙醇(常温)。 0078 (2)-(4)同2步骤 0079 (5)加入15ul ddH2O于离心柱中央,室温静置2分钟,室温16000g离心1分钟,另取15ul ddH2O于离心柱中央,重复上述操作。共获得30ul洗脱液。 0080 四、cDNA第一链的合成 0081 1.配置以下反应体系(24ul上述洗脱液;2ul的3-Pri
27、mer混合物(4411)0082 5-Biotin-GGACAACTTTGTACAAGAAAGTTGGG(T)18RG, 0083 5-Biotin-GGACAACTTTGTACAAGAAAGTTGGG(T)18YGG 0084 5-Biotin-GGACAACTTTGTACAAGAAAGTTGGG(T)18VGGG 0085 5-Biotin-GGACAACTTTGTACAAGAAAGTTGGG(T)18NGGGG); 0086 于PCR仪中70反应3分钟,缓慢降温至45(10-15分钟)。 0087 降温期间配置以下反应体系,于45预热2分钟后,立即加入反应液24ul(50mM Tris-
28、HCl,pH8.0;75mM KCl;3mM MgCl2;2.5mM dNTP each;5ul的M-MLV-RT;1.5ul的RNase Inhibitor),总体积为50ul。4 530min,5030min,5530min进行反转录。 0088 2.反应产物纯化 说 明 书CN 102797044 A6/8页80089 (1)加入350ul ddH2O,然后加入400ul Binding buffer,400ul无水乙醇(常温)。 0090 (2)-(4)同2步骤. 0091 (5)加入40ul ddH2O于离心柱中央,室温静置2分钟,室温16000g离心1分钟,分两次用35ul ddH
29、2O于离心柱中央,洗脱cDNA。 0092 五、cDNA第二链的合成 0093 配置如下反应体系: 0094 61.2ul cDNA洗脱液 0095 5ul 1M Tris-HCl(pH6.9)(final 50mM); 0096 4.5ul 1M MgCl2(final 5mM); 0097 12ul 1M KCl(final 100mM); 0098 3.3ul 1M DTT(final 5mM); 0099 6ul 5mM dNTP(final 0.33mM each) 0100 1ul2 U/ul RNase H(final 2U); 0101 1ul10 U/ul T4DNA lig
30、ase(final 10U); 0102 4ul10 U/ul T4DNA polymerase I(final 40U). 0103 混匀上述反应体系,于16for2-4h后,加入1ul T4DNApolymerase(final 10U)于16反应5min,加入10ul0.5M EDTA终止反应。 0104 六、双链DNA的分级纯化 0105 1.上下颠倒层析柱,至介质充分混匀,并没有气泡产生,垂直置于架子上,折段下端封闭头,打开上盖,将层析柱中液体充分流干。 0106 2.轻轻加入700ul TE,将溶液完全流干,重复此步骤一次。 0107 3.轻轻加入100ul3中的反应液,至完全流干
31、,加入100ul溶液G将溶液完全流干,将层析柱置于干净的1.5ml EP管中。 0108 4.轻轻加入600ul TE,收集6-7滴流出液(约240ul,标注1#)。 0109 5.将层析柱置于另一干净的1.5ml EP管中,继续收集3滴流出液(约80ul,标注2#,并补加160ul ddH2O),弃层析柱。按照如下体系(240ul的dsDNA;120ul的7.5M NH4Ac;1ul的Glycogen;900ul的预冷100乙醇)进行核酸沉淀,充分混匀后于-801h或-20过夜。 0110 6.将上述经沉淀的溶液于416000g离心30分钟。 0111 7.弃上清,加入1ml70乙醇(预冷)
32、,416000g离心5分钟,小心弃上清,重复此步骤一次。 0112 8.沉淀经真空干燥或于超净台5-10分钟吹干,加入16ul ddH2O,仔细吹打管壁悬起核酸。 0113 七、双链DNA的重组 0114 配置如下反应体系(9ul大约100ng的dsDNA;3ul的溶液H;1ul的pDONR221,总体积15ul),充分混匀上述反应液,避免气泡产生,于25反应16小时。 0115 八、重组产物的电转化 0116 1.将5中的反应液加入2ul蛋白酶K,3715分钟后于7510分钟。 0117 2.加入85ul双蒸水后,按照以下体系(100ul的dsDNA重组产物;50ul的7.5M 说 明 书C
33、N 102797044 A7/8页9NH4Ac;1ul的Glycogen;400ul的预冷100乙醇)进行核酸沉淀 0118 3.充分混匀后-801h或-20过夜 0119 4.将上述沉淀的溶液于416000g离心30分钟, 0120 5.弃上清,加入1ml70乙醇(预冷),416000g离心5分钟,小心弃上清,重复此步骤一次 0121 6.沉淀经真空干燥或于超净台5-10分钟吹干,加入10ul ddH2O,仔细吹打管壁悬起核酸。 0122 7.取2.5ul重组产物,加入适量的电转化大肠杆菌感受态细胞,进行电转化。 0123 8.取孵育培养后的菌液,按照稀释100-1000倍后涂板(LB,卡那
34、抗性),37OC培养过夜。 0124 九、库容量计算 0125 Cfu/ml克隆数稀释倍数/涂板的菌液体积 0126 十、菌落PCR鉴定重组克隆的阳性率以及插入片段大小M13 Forward primer:5-GTAAAACGACGGCCAG-3M13 Reverse primer:5-CAGGAAACAGCTATGAC-3 0127 序列表 0128 北京诺兰信生化科技有限责任公司 0129 一种快速高效的均一化全长cDNA文库构建方法 0130 6 0131 1 0132 26 0133 DNA 0134 1 0135 GGACAACTTTGTACAAGAAAGTTGGG(T)18RG 0
35、136 2 0137 26 0138 DNA 0139 2 0140 GGACAACTTTGTACAAGAAAGTTGGG(T)18YGG 0141 3 0142 26 0143 DNA 0144 3 0145 GGACAACTTTGTACAAGAAAGTTGGG(T)18VGGG 0146 4 0147 26 0148 DNA 0149 4 0150 GGACAACTTTGTACAAGAAAGTTGGG(T)18NGGGG 0151 5 说 明 书CN 102797044 A8/8页100152 16 0153 DNA 0154 5 0155 5-GTAAAACGACGGCCAG-3 0156 6 0157 16 0158 DNA 0159 6 0160 5-CAGGAAACAGCTATGAC-3 说 明 书CN 102797044 A10