技术领域
本发明属于生物领域,涉及HCV NS3/4A丝氨酸蛋白酶抑制剂的评价体系,特 别是涉及一种可用于NS3/4A丝氨酸蛋白酶活性评价的载体及其应用。
背景技术
丙型肝炎病毒(Hepatitis C Virus,HCV)正严重危害着人类健康。我国HCV 感染者已达6000万。HCV急性感染后50-80%转变为慢性感染,其中的10-20%发展成 肝硬化,并与肝细胞癌的发生密切相关。HCV为单股正链RNA病毒,属黄病毒科,全 长约9600个核苷酸,ORF区编码3010个氨基酸的多聚蛋白前体,经过宿主和病毒本 身基因编码的蛋白酶裂解为十个功能性片段,包括4个结构蛋白(核心蛋白C、包膜 蛋白E1、E2以及P7)及6个非结构蛋白(NS2、NS3、NS4A、NS4B、NS5A和NS5B), 如图1所示。
HCV NS3/4A蛋白具有丝氨酸蛋白酶活性,参与病毒蛋白翻译后加工,在NS4A的 辅助下能催化裂解NS3-NS4A,NS4A-NS4B,NS4B-NS5A和NS5A-NS5B的连接点,对HCV非 结构蛋白的成熟起到关键作用。因此,抑制HCV NS3/4A丝氨酸蛋白酶活性,可阻止 HCV非结构蛋白的成熟。HCV NS3/4A抑制剂,可成为抗丙型肝炎病毒药物。
多年来针对HCV NS3/4A抑制剂的研究取得可喜的进展,但由于缺乏理想的评价 体系,这些药物抗HCV的作用效果难以作出评估,极大地延缓了这些药物进入临床, 因而建立一种理想的适用于HCV NS3/4A蛋白抑制剂筛选及评价体系迫在眉睫。
发明内容
本发明的目的是提供一种用于评价HCV NS3/4A丝氨酸蛋白酶活性的融合蛋白。
该用于评价HCV NS3/4A丝氨酸蛋白酶活性的融合蛋白,由细胞内定位因子 -NS3/4A丝氨酸蛋白酶作用底物-报告基因SEAP组成的融合基因插入真核表达载体 形成指示载体后表达产生。
所述细胞内定位因子为EGFP、Fluc、RFP、或所有定位于细胞内且不影响细胞 功能的蛋白分子;所述NS3/4A丝氨酸蛋白酶作用底物为NS3/NS4A、NS4A/4B、 NS4B/NS5A、NS5A/NS5B的连接点。
指示载体的表达在体外细胞水平表达,或通过转基因的方式在动物体内表达。
所述融合蛋白为EGFP-NS4A/4B-SEAP,是融合基因EGFP-NS4A/4B-SEAP插入真核 表达载体PCI neo形成指示载体EGFP(Δ4AB)SEAP后表达产生。
编码上述融合蛋白的融合基因也是本发明所要提供的。具体的,所述融合基因, 表示为EGFP-NS4A/4B-SEAP,其核苷酸序列如SEQ.1所述。
由上述融合基因插入真核表达载体构建而成的指示载体也是本发明所要提供 的。具体的,所述指示载体,是融合基因EGFP-NS4A/4B-SEAP插入真核表达载体PCI neo形成,表示为EGFP(Δ4AB)SEAP。
本发明的另一目的是提供一种评价HCV NS3/4A丝氨酸蛋白酶活性的方法,即所 述融合蛋白在HCV NS3/4A丝氨酸蛋白酶抑制剂的筛选与评价中的应用。
具体的,该应用是在HCV NS3/4A丝氨酸蛋白酶抑制剂存在的条件下,用上述指 示载体转染含有HCV NS3/4A丝氨酸蛋白酶的细胞,收集细胞培养上清,测定胞外SEAP 活性,以此测定细胞内HCV NS3/4A丝氨酸蛋白酶活性的抑制率,得到对HCV NS3/4A 丝氨酸蛋白酶抑制剂效果的评价。
所述NS3/4A丝氨酸蛋白酶和指示载体可以在不同载体中表达,或以双顺反子的 形式在同一载体中表达。
所述双顺反子,NS3/4A基因位于融合基因EGFP-NS4A/4B-SEAP之后,由HCV IRES介导其翻译表达,可同时评价HCV IRES的功能。
具体的,用所述NS3/4A丝氨酸蛋白酶构建表达载体pEGFP-N1-NS3/4A,用 pEGFP-N1-NS3/4A载体转染细胞后,再以指示载体EGFP(Δ4AB)SEAP转染细胞;或用 所述NS3/4A丝氨酸蛋白酶构建表达载体pEGFP-N1-NS3/4A,用pEGFP-N1-NS3/4A载体 和指示载体EGFP(Δ4AB)SEAP共转染细胞。
在应用中,所述细胞为体外细胞或体内细胞,所述NS3丝氨酸蛋白酶抑制剂主 要包括干扰RNA、小分子化合物、或多肽。
利用本发明提供的融合蛋白,不仅可简单、快速、灵敏而且可以定量指示丝氨 酸蛋白酶活性,具有较高的实际应用价值,在医学领域具有广阔的应用前景。
附图说明
图1为HCV的基因结构模式图。
图2为质粒EGFP(Δ4AB)SEAP双酶切(Nhe I、EcoR I)鉴定图。
图3为质粒pEGFP-N1-NS3/4A双酶切(BglII、BamHI)鉴定图。
图4为荧光显微镜和光学显微镜检测外源基因NS3/4A在COS-7细胞的表达。
图5为流式细胞仪FACS分析外源基因NS3/4A在COS-7细胞内的表达。
图6为免疫印迹Western Blot分析外源基因NS3/4A在COS-7细胞内的表达。
图7为cos-7细胞内NS3/4A丝氨酸蛋白酶对融合蛋白GFP-NS4A/B-SEAP酶解 后SEAP活性检测结果。
图8为免疫组化检测小鼠肝脏中NS3/4A蛋白的表达。
图9为小鼠肝脏内NS3/4A丝氨酸蛋白酶对融合蛋白GFP-NS4A/B-SEAP酶解后 SEAP活性检测结果。
图10为质粒p-Dual酶切鉴定图(Not I)。
图11为质粒EGFP(Δ4AB)SEAP及p-Dual转染cos-7细胞后细胞培养上清中 SEAP活性检测结果。
图12为质粒EGFP(Δ4AB)SEAP及p-Dual转染小鼠后血清中SEAP活性检测结 果。
图13为siRNA表达质粒对HCV NS3/4A丝氨酸蛋白酶的抑制作用。
图14为NS3/4A与其底物NS4A/B双顺反子同表达载体的构建。
具体实施方式
本发明利用NS4A/4B是NS3/4A丝氨酸蛋白酶作用底物的特性,设计融合基因 EGFP-NS4A/4B-SEAP,将底物片段NS4A/4B插在绿色荧光蛋白(EGFP)和来源于人 胎盘基因编码的外分泌性碱性磷酸酶(SEAP)之间,再将该融合基因插入真核表达 载体pCIneo,建立了可用于指示NS34A丝氨酸蛋白酶活性的指示载体 EGFP(Δ4AB)SEAP。
EGFP(Δ4AB)SEAP表达后产生的融合蛋白EGFP-NS4A/4B-SEAP依靠EGFP在细 胞内定位,在细胞内有NS3/4A丝氨酸蛋白酶共表达的情况下,在NS4A/4B处发生 切割作用,就使得SEAP游离出来并通过其自身的信号肽分泌到细胞外,通过测定 胞外SEAP活性便可反映出HCV NS3/4A丝氨酸蛋白酶的活性。
下面以具体实施例详细说明本发明的设计。应该理解,以下实施例不构成对本 发明的限制,基于本发明的设计思想,实施中细胞内定位因子EGFP可由RFP、Fluc 等所有定位于细胞内的功能蛋白代替(K Shah,A Jacobs,XO Breakefield,R Weissleder.Molecular imaging of gene therapy for cancer.Gene Therapy.2004; 11:1175-1187.),而NS3/4A丝氨酸蛋白酶作用底物NS4A/4B可由NS3-NS4A, NS4A-4B,NS4B-NS5A和NS5A-NS5B的连接点代替(Tetsuro Suzuki,Hideki Aizaki, Kyoko Murakami,Ikuo Shoji,and Takaji Wakita.Molecular biology of hepatitis C virus. J Gastroenterol;2007;42:411-423.)。
下述实施例中所用方法如无特别说明均为常规方法,所用引物均由博亚公司合 成,所用酶制剂及回收试剂盒均购自TaKaRa公司。
实施例1、指示载体EGFP(Δ4AB)SEAP的构建
根据NS4A/B(Genebank号:gi|537813)、SEAP(Genebank号:gi|2190722) 的cDNA序列设计PCR扩增上述基因片段的引物,引物序列如下:
扩增NS4A/B的引物:
PA:(上游引物)5’-AGATCTATGTCGGCTGACCTGGAGG-3,
PB:(下游引物)5’-GAATTCAGGGTATGTTGGGTGGTGAG-3’
扩增SEAP的引物:
PC:(上游引物)5’-GAATTCCTGCTGCTGCTGCTGCTGCTGGG-3’
PD:(下游引物)5’-GTCGACGTCGACGGATCCTTATCGATTTTA-3’
分别以质粒FL-neo(参见文献Blight KJ,McKeating JA,Rice CM.Highly permissive cell lines for subgenomic and genomic hepatitis C virus RNA replication.J Virol.2002;76(24):13001-13014.)及PTAL-SEAP(购自promega) 为模板,分别使用引物对PA/PB及引物对PC/PD,PCR扩增NS4A/B及SEAP,PCR 体系如下:10×PCR缓冲液5μl,上下游引物各1μl,dNTP 1μl,模板1μl,Pyrobest 高保真DNA聚合酶0.25μl,去离子双蒸水40.75μl,总体积50μl,反应条件分 别为:94℃5min、94℃30s→55℃30s→72℃30s(30cycle)、72℃5min;94℃5min、 94℃30s→55℃30s→72℃2min(30cycle)、72℃5min。
含双报告基因的质粒pCI-EGFP-NS4A/B-SEAP(简称为EGFP(Δ4AB)SEAP)构建 过程:将PCR扩增得到的SEAP基因到经EcoRI、Sal I双酶切、回收后插入经相同酶 切处理的载体pCIneo,得到载体pCIneo-SEAP,EGFP编码基因由质粒pEGFP-C1(购 自promega)通过Nhe I、BglII双酶切后获得,NS4A/B通过PCR扩增后,再经BglII、 EcoRI酶切处理得到,将回收后的Nhe I-GFP-BglII片断及BglII-NS4A/B-EcoRI片 断插入经Nhe I、EcoRI双酶切处理的载体pCIneo-SEAP即可,载体鉴定见图2(泳 道1:DL15000Marker;2:pCIneo;3:EGFP(Δ4AB)SEAP)。
本实施例得到的指示载体EGFP(Δ4AB)SEAP序列见序列表中SEQ.1。
具体操作中,酶切及连接:所有限制性内切酶均为Takana公司产品,限制性内 切酶的消化时间和酶与底物的浓度依酶的活性单位灵活决定,选取获得最高活性所 需缓冲液,酶解时间依据酶活性和酶与底物的用量以及所用酶是否具有星号活力灵 活决定,酶切产物的连接使用Promega公司的T4DNA连接酶,连接反应的体积为10 μl,10×连接缓冲液体积为1μl,3u/μl连接酶的体积为1μl,质粒和PCR酶解产 物的量依各自的浓度灵活决定,连接条件为4℃过夜连接。PCR产物经凝胶电泳回收 后与pGEM-T载体的连接使用Promega pGEM-T载体连接试剂盒,2×快速连接缓冲液 (T4DNA ligase)5μl,pGEM-T载体1μl,3u/μl连接酶的体积为1μl,PCR回收产 物的量依浓度灵活加入,加入双蒸水至终体积为10μl,4℃过夜连接。
转化感受态菌:取一管感受态菌,在超净工作台中,加入连接产物,连接产物 的加入量依浓度灵活决定,轻轻旋转混匀,冰浴30min。立即转移到42℃水浴中放 置1.5min,迅速置于冰浴,每管加入0.9ml无抗性LB培养基,37℃水浴摇床培养 45min后,涂布相应抗性的琼脂糖平板,室温晾干后,置37℃恒温箱倒置培养过夜。 涂板的转化产物的量以及是否离心浓缩依据转化效率灵活决定。
实施例2、利用cos-7细胞内及小鼠肝脏中表达的NS3/4A蛋白验证指示系统
一、载体pEGFP-N1-NS3/4A的构建
根据NS3/4A(Genebank号:gi|28921568)的cDNA序列(参见序列表SEQ.2) 设计PCR扩增上述基因片段的引物,引物序列如下:
扩增NS3/4A N端的引物
PE(上游引物):GGAAGATCTATGGCGCCTATTACGGCCTACTC
PF(下游引物):AGTCGACTGTCTGGGTGACA
扩增NS3/4A C端的引物
PG(上游引物):ATGTGTCACCCAGACAGTCG
PH(下游引物):CGCGGATCCTGTTCGATGTAAGGGAGGTG
以质粒FL-neo为模板,利用NS3/4A基因1305-1311位存在的Sal I酶切位点 设计引物,分两段对NS3/4A进行扩增。扩增NS3/4A N端及C端编码基因的引物分 别为PE/PF及PG/PH。PCR体系如下:10×PCR缓冲液5μl,上下游引物各1μl, dNTP 1μl,模板1μl,Pyrobest高保真DNA聚合酶0.25μl,去离子双蒸水40.75 μl,总体积50μl,反应条件为:94℃5min、94℃30s→55℃30s→72℃1min (30cycle)、72℃5min。将克隆得到的NS3/4A N端、C端基因片断分别通过Bgl II/Sal I、Sal I/BamHI插入经BglII/BamHI双酶切处理后的真核表达载体 pEGFP-N1,构建了带有绿色荧光蛋白标签的真核表达载体pEGFP-N1-NS3/4A,载体 鉴定见图3(泳道1:DL15000Marker;2:pEGFP-N1;3:pEGFP-N1-NS3/4A)。
二、利用cos-7细胞内表达的NS3/4A蛋白验证指示系统
分别用真核表达载体pEGFP-N1-NS3/4A、pEGFP-N1转染COS-7细胞(购自 promega)。培养基选用含有10%的胎牛血清(HyClone公司)、10mM的HEPES、25U/ml 的青霉素、25μg/ml的链霉素的DMEM(Gibcol公司),细胞用含0.25%的胰酶和0.02% 的EDTA的消化液常规消化传代,置于37℃含5%CO2的孵箱中培养),转染使用 Lipofectamine2000(Invetrogen life technologies),转染的步骤按照厂家说明 书,简言之,等细胞生长至70%融合成片时,将1μg质粒和3μl脂质体用50μl不 含血清的DMEM培养基稀释后完全混合,室温孵育20min,在24孔板中的细胞用不含 血清的DMEM洗三遍,然后将孵育好的混合物加入到相应孔中,补加450μl不含血清 的DMEM,将转染细胞置于37℃含5%CO2的孵箱中培养,6h后补加20%的胎牛血清, 或者将细胞洗涤后加入完全DMEM培养基。培养24h后按1∶4传代,48h后加入1mg/ml 的G418进行筛选,两周后收集G418抗性阳性克隆,继续在含250μg/ml G418的培养 基中培养。通过荧光显微镜和光学显微镜(参见图4,A:pEGFP-N1-NS3/4A转染的 COS-7细胞在荧光显微镜下;B:pEGFP-N1-NS3/4A转染的COS-7细胞在光镜下;C: pEGFP-N1转染的COS-7细胞在荧光显微镜下;D:pEGFP-N1转染的COS-7细胞在光镜 下;E:正常COS-7细胞在荧光显微镜下;F:正常COS-7细胞在光镜下)、流式细胞 仪(仪器型号:FACSAria)参见图5,可见稳定转染pEGFP-N1-NS3/4A、pEGFP-N1的 COS-7细胞阳性率分别为28.16%、39.83%,荧光强度分别为110、688)、免疫印迹 Western blot(参见图6)分析,可以看到外源基因NS3/4A在COS-7中得到高效表达。
含报告基因的质粒EGFP(Δ4AB)SEAP转染稳定表达pEGFP-N1、 pEGFP-N1-NS3/4A的COS-7细胞,并于转染后24、36、48小时给细胞换液,收集 细胞培养上清用Phospha-LightTM System试剂盒(A&B公司)测定血清中SEAP 的活性,结果参见图7显示,在表达NS3/4A丝氨酸蛋白酶的COS-7细胞中,SEAP 活性要明显高于对照组(P<0.05)。说明该指示质粒可以用来指示NS3/4A丝氨酸蛋 白酶活性。
三、利用小鼠肝脏中表达的NS3/4A蛋白验证指示系统
4~6周龄Balb/c小鼠12只,随机分为2组,将25μg真核表达载体 pEGFP-N1-NS3/4A、pEGFP-N1分别与25μg指示质粒EGFP(Δ4AB)SEAP混合于相当 于小鼠体重10%的生理盐水,在五秒钟以内通过尾静脉转染至Balb/c小鼠(购自 军事医学科学院实验动物中心)肝脏,分别于注射后第1、3、5、7、10、20天尾 静脉采血,用Phospha-LightTM System试剂盒(A&B公司)测定血清中SEAP的活 性。在共表达NS3/4A丝氨酸蛋白酶的小鼠体内(免疫组化检测见图8),SEAP 活性要明显高于对照组(P<0.05)。说明该指示质粒可以用来指示NS3/4A丝氨酸蛋 白酶活性(参见图9)。
实施例3、NS3/4A与其底物NS4A/B以双顺反子的形式在同一载体中表达 载体构建如图14所示。
在此载体中“依赖帽子的扫描机制”翻译表达EGFP-NS4A/4B-hSEAP,“非依赖 帽子的扫描机制”HCV IRES介导HCV NS3/4A翻译;表达的NS3/4A通过切割 EGFP-NS4A/4B-hSEAP上的NS4A/4B,使hSEAP得以分泌性表达,hSEAP活性表达高 低反映了HCV NS3/4A的活性。
一、双顺反子表达载体的构建
以质粒FL-neo为模板,根据HCV IRES的cDNA序列设计PCR扩增上述基因片 段的引物,引物序列如下:
上游引物(Not I):CGGCGGCCGCCCCAAGCTTGCCAGCCCCCGATTG
下游引物(Bgl II):GGAAGATCTGTGGGCGGCGGTTGGTGTTAC
将克隆得到的IRES基因片断及实施例2中得到的NS3/4基因片断A通过Not I酶切位点插入实施例1中构建的表达载体EGFP(Δ4AB)SEAP,构建了使NS3/4A 与其底物NS4A/B在同一载体中共表达的双顺反子表达载体(简称p-Dual,见图 10),具体操作方法同实施例1
HCV IRES序列参见序列表中SEQ.3。
二、双顺反子表达载体在细胞及小鼠体内的表达
含报告基因的质粒EGFP(Δ4AB)SEAP及p-Dual分别使用Lipofectamine2000 (Invetrogen life technologies)转染COS-7细胞(细胞培养及转染的步骤同实施例2), 并于转染后24、48小时给细胞换液,12000rpm离心30s收集细胞培养上清;同时 将4~6周龄Balb/c小鼠12只随机分为2组,分别将25μg上述质粒混合于相当于 小鼠体重10%的生理盐水,在五秒钟以内通过尾静脉转染至Balb/c小鼠(购自军 事医学科学院实验动物中心)肝脏,分别于注射后第1、3、5、7、11天尾静脉采 血,用Phospha-LightTM System试剂盒测定细胞培养上清及血清中SEAP的活性。 结果:p-Dual组细胞培养上清中(图11)及小鼠血清中(图12)SEAP活性明显 高于对照组EGFP(Δ4AB)SEAP。说明在双顺反子表达载体p-Dual中融合基因 EGFP-NS4A/4B-SEAP可以用来指示NS3/4A丝氨酸蛋白。
实施例4、指示体系在药物评价中的应用
针对HCV NS3/4A的结构序列设计siRNA以及它的突变对照msiRNA(一个碱基 变异)引物,引物序列如下:
siRNA-sense
5’
-GATCCGCGAGGTTACTACCACACACTTCAAGAGAGTGTGTGGTAGTAACCT CGTTTTTTGG AAA-3’
siRNA-antisense
5’
-AGCTTTTCCAAAAAACGAGGTTACTACCACACACTCTCTTGAAGTGTGTGGT AGTAACCTG GCG-3’
msiRNA-sense
5’
-GATCCGCGAGGTTACTACCACACACTTCAAGAGACTGTGTGGTAGTAACCT CGTTTTTTGG AAA-3’
msiRNA-antisense
5’
-AGCTTTTCCAAAAAACGAGGTTACTACCACACAGTCTCTTGAAGTGTGTGGT AGTAACCTG GCG-3’
退火形成发夹型siRNA及msiRNA模板寡核苷酸,与质粒pSilencer TM2.1-U6 neo(购自Ambion公司)连接,应用Invitrogen公司LipofectamineTM2000将siRNA、 msiRNA表达质粒与双顺反子表达质粒p-Dual分别共转染cos-7细胞。
此外,将4~6周龄Balb/c小鼠12只随机分为2组,分别将含20μg siRNA及 msiRNA表达质粒与20μg质粒p-Dual混合后加至相当于Balb/c小鼠体重10%的生 理盐水,在五秒钟以内通过尾静脉转染至Balb/c小鼠(购白军事医学科学院实验动 物中心)肝脏,分别检测转染48h后cos-7细胞培养上清及小鼠血清中SEAP活性,可 见到siRNA表达质粒对HCV NS3/4A有很强的抑制作用,抑制率分别为78%、71%(图 13)。说明融合基因EGFP-NS4A/4B-SEAP表达后不仅能够指示NS3/4A丝氨酸蛋白酶 的活性,同时在抗HCV NS3/4A丝氨酸蛋白酶活性评价中具有很好的指示作用。
序列表
<160>3
<210>1
<211>2774
<212>DNA
<213>人工序列
<220>
<223>
<400>1
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtcc 720
ggactcagat ctatgtcggc tgacctggag gtcgtcacga gcacctgggt gctggtaggc 780
ggagtcctag cagctctggc cgcgtattgc ctgacaacag gcagcgtggt cattgtgggc 840
aggatcatct tgtccggaaa gccggccatc attcccgaca gggaagtcct ttaccgggag 900
ttcgatgaga tggaagagtg cgcctcacac ctcccttaca tcgaacaggg aatgcagctc 960
gccgaacaat tcaaacagaa ggcaatcggg ttgctgcaaa cagccaccaa gcaagcggag 1020
gctgctgctc ccgtggtgga atccaagtgg cggaccctcg aagccttctg ggcgaagcat 1080
atgtggaatt tcatcagcgg gatacaatat ttagcaggct tgtccactct gcctggcaac 1140
cccgcgatag catcactgat ggcattcaca gcctctatca ccagcccgct caccacccaa 1200
cataccctga attcatgctg ctgctgctgc tgctgctggg cctgaggcta cagctctccc 1260
tgggcatcat cccagttgag gaggagaacc cggacttctg gaaccgcgag gcagccgagg 1320
ccctgggtgc cgccaagaag ctgcagcctg cacagacagc cgccaagaac ctcatcatct 1380
tcctgggcga tgggatgggg gtgtctacgg tgacagctgc caggatccta aaagggcaga 1440
agaaggacaa actggggcct gagatacccc tggccatgga ccgcttccca tatgtggctc 1500
tgtccaagac atacaatgta gacaaacatg tgccagacag tggagccaca gccacggcct 1560
acctgtgcgg ggtcaagggc aacttccaga ccattggctt gagtgcagcc gcccgcttta 1620
accagtgcaa cacgacacgc ggcaacgagg tcatctccgt gatgaatcgg gccaagaaag 1680
cagggaagtc agtgggagtg gtaaccacca cacgagtgca gcacgcctcg ccagccggca 1740
cctacgccca cacggtgaac cgcaactggt actcggacgc cgacgtgcct gcctcggccc 1800
gccaggaggg gtgccaggac atcgctacgc agctcatctc caacatggac attgacgtga 1860
tcctaggtgg aggccgaaag tacatgtttc gcatgggaac cccagaccct gagtacccag 1920
atgactacag ccaaggtggg accaggctgg acgggaagaa tctggtgcag gaatggctgg 1980
cgaagcgcca gggtgcccgg tatgtgtgga accgcactga gctcatgcag gcttccctgg 2040
acccgtctgt gacccatctc atgggtctct ttgagcctgg agacatgaaa tacgagatcc 2100
accgagactc cacactggac ccctccctga tggagatgac agaggctgcc ctgcgcctgc 2160
tgagcaggaa cccccgcggc ttcttcctct tcgtggaggg tggtcgcatc gaccatggtc 2220
atcatgaaag cagggcttac cgggcactga ctgagacgat catgttcgac gacgccattg 2280
agagggcggg ccagctcacc agcgaggagg acacgctgag cctcgtcact gccgaccact 2340
cccacgtctt ctccttcgga ggctaccccc tgcgagggag ctccatcttc gggctggccc 2400
ctggcaaggc ccgggacagg aaggcctaca cggtcctcct atacggaaac ggtccaggct 2460
atgtgctcaa ggacggcgcc cggccggatg ttaccgagag cgagagcggg agccccgagt 2520
atcggcagca gtcagcagtg cccctggacg aagagaccca cgcaggcgag gacgtggcgg 2580
tgttcgcgcg cggcccgcag gcgcacctgg ttcacggcgt gcaggagcag accttcatag 2640
cgcacgtcat ggccttcgcc gcctgcctgg agccctacac cgcctgcgac ctggcgcccc 2700
ccgccggcac caccgacgcc gcgcacccgg gttactctag agtcggggcg gccggccgct 2760
tcgagcagac atga 2774
<210>2
<211>1308
<212>DNA
<213>黄病毒(Flavivrus)/丙型肝炎病毒
<220>
<223>
<400>2
atggcgccta ttacggccta ctcccaacag acgcgaggcc tacttggctg catcatcact 60
agcctcacag gccgggacag gaaccaggtc gagggggagg tccaagtggt ctccaccgca 120
acacaatctt tcctggcgac ctgcgtcaat ggcgtgtgtt ggactgtcta tcatggtgcc 180
ggctcaaaga cccttgccgg cccaaagggc ccaatcaccc aaatgtacac caatgtggac 240
caggacctcg tcggctggca agcgcccccc ggggcgcgtt ccttgacacc atgcacctgc 300
ggcagctcgg acctttactt ggtcacgagg catgccgatg tcattccggt gcgccggcgg 360
ggcgacagca gggggagcct actctccccc aggcccgtct cctacttgaa gggctcttcg 420
ggcggtccac tgctctgccc ctcggggcac gctgtgggca tctttcgggc tgccgtgtgc 480
acccgagggg ttgcgaaggc ggtggacttt gtacccgtcg agtctatgga aaccactatg 540
cggtccccgg tcttcacgga caactcgtcc cctccggccg taccgcagac attccaggtg 600
gcccatctac acgcccctac tggtagcggc aagagcacta aggtgccggc tgcgtatgca 660
gcccaagggt ataaggtgct tgtcctgaac ccgtccgtcg ccgccaccct aggtttcggg 720
gcgtatatgt ctaaggcaca tggtatcgac cctaacatca gaaccggggt aaggaccatc 780
accacgggtg cccccatcac gtactccacc tatggcaagt ttcttgccga cggtggttgc 840
tctgggggcg cctatgacat cataatatgt gatgagtgcc actcaactga ctcgaccact 900
atcctgggca tcggcacagt cctggaccaa gcggagacgg ctggagcgcg actcgtcgtg 960
ctcgccaccg ctacgcctcc gggatcggtc accgtgccac atccaaacat cgaggaggtg 1020
gctctgtcca gcactggaga aatccccttt tatggcaaag ccatccccat cgagaccatc 1080
aaggggggga ggcacctcat tttctgccat tccaagaaga aatgtgatga gctcgccgcg 1140
aagctgtccg gcctcggact caatgctgta gcatattacc ggggccttga tgtatccgtc 1200
ataccaacta gcggagacgt cattgtcgta gcaacggacg ctctaatgac gggctttacc 1260
ggcgatttcg actcagtgat cgactgcaat acatgtgtca cccagaca 1308
<210>3
<211>422
<212>DNA
<213>人工序列
<220>
<223>
<400>3
gcggccgccc caagcttgcc agcccccgat tgggggcgac actccaccat gaatcactcc 60
cctgtgagga actactgtct tcacgcagaa agcgtctagc catggcgtta gtatgagtgt 120
cgtgcagcct ccaggacccc ccctcccggg agagccatag tggtctgcgg aaccggtgag 180
tacaccggaa ttgccaggac gaccgggtcc tttcttggat caacccgctc aatgcctgga 240
gatttgggcg tgcccccgcg agactgctag ccgagtagtg ttgggtcgcg aaaggccttg 300
tggtactgcc tgatagggtg cttgcgagtg ccccgggagg tctcgtagac cgtgcaccat 360
gagcacgaat cctaaacctc aaagaaaaac caaacgtaac accaaccgcc gcccacagat 420
ct 422