书签 分享 收藏 举报 版权申诉 / 540

包含具有大范围核酸酶活性的序列的组合物和方法.pdf

  • 上传人:汲墨****o
  • 文档编号:8882814
  • 上传时间:2021-01-09
  • 格式:PDF
  • 页数:540
  • 大小:77.59MB
  • 摘要
    申请专利号:

    CN201380035464.X

    申请日:

    20130501

    公开号:

    CN104411823A

    公开日:

    20150311

    当前法律状态:

    有效性:

    失效

    法律详情:

    IPC分类号:

    C12N9/22,C12N15/82

    主分类号:

    C12N9/22,C12N15/82

    申请人:

    纳幕尔杜邦公司,先锋国际良种公司

    发明人:

    E.伯穆德兹,A.M.西甘,J.恩格里斯,S.C.发科,H.高,L.刘,Z-B.刘,A.安格,S.斯维塔舍夫,J.K.杨

    地址:

    美国特拉华州威尔明顿

    优先权:

    61/642,470,61/683,765

    专利代理机构:

    中国专利代理(香港)有限公司

    代理人:

    邹雪梅;李炳爱

    PDF完整版下载: PDF下载
    内容摘要

    本发明提供了包含具有大范围核酸酶活性的多核苷酸和多肽的组合物和方法。另外提供了具有大范围核酸酶序列的核酸构建体、酵母、植物、植物细胞、外植体、种子和谷物。提供了使用所述大范围核酸酶序列的各种方法。此类方法包括用于制备在宽泛的温度范围具有提高的活性的大范围核酸酶的方法、用于制备包含具有提高的活性的大范围核酸酶的酵母、植物、植物细胞、外植体或种子的方法。

    权利要求书

    1.一种分离的或重组的多核苷酸,其包含编码大范围核酸酶多肽的核苷酸序列,所述多肽包含:a)在对应于SEQ ID NO:1的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:1的位置选自位置2、12、16、22、23、31、36、43、50、56、58、59、62、71、72、73、80、81、82、86、91、95、98、103、113、114、116、117、118、121、124、128、129、131、147、151、153、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、194、195、196、197、200、203、204、209、222、232、236、237、246、254、258、267、278、281、282、289、308、311、312、316、318、319、334、339、340、342、345、346、348、以及它们的组合;或b)具有(a)的任何氨基酸修饰中的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43或44个的氨基酸序列。 2.根据权利要求1所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码与SEQ ID NO:1具有至少80%的序列同一性的大范围核酸酶多肽。 3.根据权利要求1所述的分离的或重组的多核苷酸,其中所述至少一个氨基酸修饰包括:a)在对应于SEQ ID NO:1中氨基酸位置2的位置处的天冬氨酸(D);b)在对应于SEQ ID NO:1中氨基酸位置12的位置处的组氨酸(H);c)在对应于SEQ ID NO:1中氨基酸位置16的位置处的异亮氨酸(I);d)在对应于SEQ ID NO:1中氨基酸位置22的位置处的半胱氨酸(C);e)在对应于SEQ ID NO:1中氨基酸位置23的位置处的亮氨酸(L);f)在对应于SEQ ID NO:1中氨基酸位置31的位置处的精氨酸(R);g)在对应于SEQ ID NO:1中氨基酸位置36的位置处的天冬酰胺(N);h)在对应于SEQ ID NO:1中氨基酸位置43的位置处的亮氨酸(L);i)在对应于SEQ ID NO:1中氨基酸位置50的位置处的精氨酸(R)或赖氨酸(K);j)在对应于SEQ ID NO:1中氨基酸位置56的位置处的亮氨酸(L);k)在对应于SEQ ID NO:1中氨基酸位置58的位置处的异亮氨酸(I);l)在对应于SEQ ID NO:1中氨基酸位置59的位置处的组氨酸(H)或丙氨酸(A);m)在对应于SEQ ID NO:1中氨基酸位置62的位置处的缬氨酸(V);n)在对应于SEQ ID NO:1中氨基酸位置71的位置处的赖氨酸(K);o)在对应于SEQ ID NO:1中氨基酸位置72的位置处的苏氨酸(T);p)在对应于SEQ ID NO:1中氨基酸位置73的位置处的丙氨酸(A);q)在对应于SEQ ID NO:1中氨基酸位置80的位置处的精氨酸(R);r)在对应于SEQ ID NO:1中氨基酸位置81的位置处的赖氨酸(K);s)在对应于SEQ ID NO:1中氨基酸位置82的位置处的精氨酸(R);t)在对应于SEQ ID NO:1中氨基酸位置86的位置处的天冬氨酸(D);u)在对应于SEQ ID NO:1中氨基酸位置91的位置处的异亮氨酸(I);v)在对应于SEQ ID NO:1中氨基酸位置95的位置处的异亮氨酸(I);w)在对应于SEQ ID NO:1中氨基酸位置98的位置处的精氨酸(R);x)在对应于SEQ ID NO:1中氨基酸位置103的位置处的缬氨酸(V);y)在对应于SEQ ID NO:1中氨基酸位置113的位置处的丝氨酸(S);z)在对应于SEQ ID NO:1中氨基酸位置114的位置处的脯氨酸(P);aa)在对应于SEQ ID NO:1中氨基酸位置116的位置处的精氨酸(R);bb)在对应于SEQ ID NO:1中氨基酸位置117的位置处的甘氨酸(G);cc)在对应于SEQ ID NO:1中氨基酸位置118的位置处的苏氨酸(T);dd)在对应于SEQ ID NO:1中氨基酸位置121的位置处的甘氨酸(G);ee)在对应于SEQ ID NO:1中氨基酸位置124的位置处的精氨酸(R);ff)在对应于SEQ ID NO:1中氨基酸位置128的位置处的半胱氨酸(C):gg)在对应于SEQ ID NO:1中氨基酸位置129的位置处的丙氨酸(A);hh)在对应于SEQ ID NO:1中氨基酸位置131的位置处的精氨酸(R);ii)在对应于SEQ ID NO:1中氨基酸位置147的位置处的丝氨酸(S);jj)在对应于SEQ ID NO:1中氨基酸位置151的位置处的丙氨酸(A);kk)在对应于SEQ ID NO:1中氨基酸位置153的位置处的亮氨酸(L)或甲硫氨酸(M);11)在对应于SEQ ID NO:1中氨基酸位置159的位置处的色氨酸(W);mm)在对应于SEQ ID NO:1中氨基酸位置160的位置处的谷氨酸(E);nn)在对应于SEQ ID NO:1中氨基酸位置161的位置处的缬氨酸(V);oo)在对应于SEQ ID NO:1中氨基酸位置162的位置处的酪氨酸(Y);pp)在对应于SEQ ID NO:1中氨基酸位置163的位置处的精氨酸(R);qq)在对应于SEQ ID NO:1中氨基酸位置164的位置处的组氨酸(H);rr)在对应于SEQ ID NO:1中氨基酸位置165的位置处的亮氨酸(L);ss)在对应于SEQ ID NO:1中氨基酸位置166的位置处的精氨酸(R);tt)在对应于SEQ ID NO:1中氨基酸位置167的位置处的组氨酸(H);uu)在对应于SEQ ID NO:1中氨基酸位置168的位置处的脯氨酸(P);w)在对应于SEQ ID NO:1中氨基酸位置169的位置处的丙氨酸(A);ww)在对应于SEQ ID NO:1中氨基酸位置170的位置处的脯氨酸(P);xx)在对应于SEQ ID NO:1中氨基酸位置171的位置处的组氨酸(H);yy)在对应于SEQ ID NO:1中氨基酸位置172的位置处的脯氨酸(P);zz)在对应于SEQ ID NO:1中氨基酸位置173的位置处的精氨酸(R);aaa)在对应于SEQ ID NO:1中氨基酸位置174的位置处的亮氨酸(L);bbb)在对应于SEQ ID NO:1中氨基酸位置175的位置处的脯氨酸(P);ccc)在对应于SEQ ID NO:1中氨基酸位置176的位置处的谷氨酰胺(Q);ddd)在对应于SEQ ID NO:1中氨基酸位置177的位置处的丙氨酸(A);eee)在对应于SEQ ID NO:1中氨基酸位置178的位置处的精氨酸(R);fff)在对应于SEQ ID NO:1中氨基酸位置179的位置处的缬氨酸(V);ggg)在对应于SEQ ID NO:1中氨基酸位置180的位置处的谷氨酰胺(Q);hhh)在对应于SEQ ID NO:1中氨基酸位置182的位置处的缬氨酸(V);iii)在对应于SEQ ID NO:1中氨基酸位置183的位置处的脯氨酸(P);jjj)在对应于SEQ ID NO:1中氨基酸位置184的位置处的赖氨酸(K);kkk)在对应于SEQ ID NO:1中氨基酸位置185的位置处的苏氨酸(T)或组氨酸(H);lll)在对应于SEQ ID NO:1中氨基酸位置186的位置处的丝氨酸(S);mmm)在对应于SEQ ID NO:1中氨基酸位置187的位置处的谷氨酸(E);nnn)在对应于SEQ ID NO:1中氨基酸位置188的位置处的亮氨酸(L);ooo)在对应于SEQ ID NO:1中氨基酸位置189的位置处的谷氨酸(E);ppp)在对应于SEQ ID NO:1中氨基酸位置190的位置处的谷氨酰胺(Q);qqq)在对应于SEQ ID NO:1中氨基酸位置191的位置处的亮氨酸(L);rrr)在对应于SEQ ID NO:1中氨基酸位置194的位置处的脯氨酸(P);sss)在对应于SEQ ID NO:1中氨基酸位置195的位置处的赖氨酸(K);ttt)在对应于SEQ ID NO:1中氨基酸位置196的位置处的丝氨酸(S);uuu)在对应于SEQ ID NO:1中氨基酸位置197的位置处的苯丙氨酸(F);vvv)在对应于SEQ ID NO:1中氨基酸位置200的位置处的异亮氨酸(I);www)在对应于SEQ ID NO:1中氨基酸位置203的位置处的缬氨酸(V);xxx)在对应于SEQ ID NO:1中氨基酸位置204的位置处的亮氨酸(L);yyy)在对应于SEQ ID NO:1中氨基酸位置209的位置处的半胱氨酸(C);zzz)在对应于SEQ ID NO:1中氨基酸位置222的位置处的亮氨酸(L);aaaa)在对应于SEQ ID NO:1中氨基酸位置232的位置处的异亮氨酸(I);bbbb)在对应于SEQ ID NO:1中氨基酸位置236的位置处的丝氨酸(S);cccc)在对应于SEQ ID NO:1中氨基酸位置237的位置处的亮氨酸(L)或精氨酸(R);dddd)在对应于SEQ ID NO:1中氨基酸位置246的位置处的组氨酸(H);eeee)在对应于SEQ ID NO:1中氨基酸位置254的位置处的异亮氨酸(I);ffff)在对应于SEQ ID NO:1中氨基酸位置258的位置处的丝氨酸(S);gggg)在对应于SEQ ID NO:1中氨基酸位置267的位置处的精氨酸(R);hhhh)在对应于SEQ ID NO:1中氨基酸位置278的位置处的异亮氨酸(I);iiii)在对应于SEQ ID NO:1中氨基酸位置281的位置处的酪氨酸(Y);jjjj)在对应于SEQ ID NO:1中氨基酸位置282的位置处的苯丙氨酸(F);kkkk)在对应于SEQ ID NO:1中氨基酸位置289的位置处的苏氨酸(T);llll)在对应于SEQ ID NO:1中氨基酸位置308的位置处的甘氨酸(G);mmmm)在对应于SEQ ID NO:1中氨基酸位置311的位置处的精氨酸(R);nnnn)在对应于SEQ ID NO:1中氨基酸位置312的位置处的丙氨酸(A);oooo)在对应于SEQ ID NO:1中氨基酸位置316的位置处的丙氨酸(A);pppp)在对应于SEQ ID NO:1中氨基酸位置318的位置处的精氨酸(R);qqqq)在对应于SEQ ID NO:1中氨基酸位置334的位置处的丙氨酸(A);rrrr)在对应于SEQ ID NO:1中氨基酸位置339的位置处的苯丙氨酸(F);ssss)在对应于SEQ ID NO:1中氨基酸位置340的位置处的甘氨酸(G)或亮氨酸(L);tttt)在对应于SEQ ID NO:1中氨基酸位置342的位置处的丝氨酸(S);uuuu)在对应于SEQ ID NO:1中氨基酸位置345的位置处的天冬酰胺(N);vvvv)在对应于SEQ ID NO:1中氨基酸位置346的位置处的天冬酰胺(N);wwww)在对应于SEQ ID NO:1中氨基酸位置348的位置处的天冬酰胺(N);或xxxx)a)至wwww)的任何组合。 4.根据权利要求1所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码大范围核酸酶多肽,其中所述多肽还包含:a)在对应于SEQ ID NO:1中氨基酸位置2的位置处的天冬氨酸(D);b)在对应于SEQ ID NO:1中氨基酸位置12的位置处的组氨酸(H);c)在对应于SEQ ID NO:1中氨基酸位置16的位置处的异亮氨酸(I);d)在对应于SEQ ID NO:1中氨基酸位置19的位置处的丝氨酸(S)或丙氨酸(A);e)在对应于SEQ ID NO:1中氨基酸位置22的位置处的半胱氨酸(C);f)在对应于SEQ ID NO:1中氨基酸位置23的位置处的亮氨酸(L);g)在对应于SEQ ID NO:1中氨基酸位置24的位置处的甲硫氨酸(M);h)在对应于SEQ ID NO:1中氨基酸位置28的位置处的精氨酸(R)或丙氨酸(A);i)在对应于SEQ ID NO:1中氨基酸位置30的位置处的精氨酸(R)、丙氨酸(A)、谷氨酰胺(Q)、半胱氨酸(C)、甘氨酸(G)、丝氨酸(S)、苏氨酸(T)、亮氨酸(L)、谷氨酸(E)或脯氨酸(P);j)在对应于SEQ ID NO:1中氨基酸位置31的位置处的精氨酸(R);k)在对应于SEQ ID NO:1中氨基酸位置32的位置处的精氨酸(R)、丙氨酸(A)、赖氨酸(K)、谷氨酰胺(Q)、甘氨酸(G)或亮氨酸(L);l)在对应于SEQ ID NO:1中氨基酸位置36的位置处的天冬酰胺(N);m)在对应于SEQ ID NO:1中氨基酸位置43的位置处的亮氨酸(L);n)在对应于SEQ ID NO:1中氨基酸位置50的位置处的精氨酸(R)或赖氨酸(K);o)在对应于SEQ ID NO:1中氨基酸位置54的位置处的异亮氨酸(I)或亮氨酸(L);p)在对应于SEQ ID NO:1中氨基酸位置56的位置处的亮氨酸(L);q)在对应于SEQ ID NO:1中氨基酸位置57的位置处的谷氨酸(E);r)在对应于SEQ ID NO:1中氨基酸位置58的位置处的异亮氨酸(I);s)在对应于SEQ ID NO:1中氨基酸位置59的位置处的组氨酸(H)或丙氨酸(A);t)在对应于SEQ ID NO:1中氨基酸位置62的位置处的缬氨酸(V);u)在对应于SEQ ID NO:1中氨基酸位置71的位置处的赖氨酸(K);v)在对应于SEQ ID NO:1中氨基酸位置72的位置处的苏氨酸(T);w)在对应于SEQ ID NO:1中氨基酸位置73的位置处的丙氨酸(A);x)在对应于SEQ ID NO:1中氨基酸位置79的位置处的甘氨酸(G);y)在对应于SEQ ID NO:1中氨基酸位置80的位置处的精氨酸(R);z)在对应于SEQ ID NO:1中氨基酸位置81的位置处的赖氨酸(K);aa)在对应于SEQ ID NO:1中氨基酸位置82的位置处的精氨酸(R);bb)在对应于SEQ ID NO:1中氨基酸位置86的位置处的天冬氨酸(D);cc)在对应于SEQ ID NO:1中氨基酸位置87的位置处的亮氨酸(L);dd)在对应于SEQ ID NO:1中氨基酸位置91的位置处的异亮氨酸(I);ee)在对应于SEQ ID NO:1中氨基酸位置95的位置处的异亮氨酸(I);ff)在对应于SEQ ID NO:1中氨基酸位置98的位置处的精氨酸(R);gg)在对应于SEQ ID NO:1中氨基酸位置103的位置处的缬氨酸(V);hh)在对应于SEQ ID NO:1中氨基酸位置105的位置处的丙氨酸(A);ii)在对应于SEQ ID NO:1中氨基酸位置111的位置处的精氨酸(R);jj)在对应于SEQ ID NO:1中氨基酸位置113的位置处的丝氨酸(S);kk)在对应于SEQ ID NO:1中氨基酸位置114的位置处的脯氨酸(P);ll)在对应于SEQ ID NO:1中氨基酸位置116的位置处的精氨酸(R);mm)在对应于SEQ ID NO:1中氨基酸位置117的位置处的甘氨酸(G);nn)在对应于SEQ ID NO:1中氨基酸位置118的位置处的苏氨酸(T);oo)在对应于SEQ ID NO:1中氨基酸位置121的位置处的甘氨酸(G);pp)在对应于SEQ ID NO:1中氨基酸位置124的位置处的精氨酸(R);qq)在对应于SEQ ID NO:1中氨基酸位置128的位置处的半胱氨酸(C);rr)在对应于SEQ ID NO:1中氨基酸位置129的位置处的丙氨酸(A);ss)在对应于SEQ ID NO:1中氨基酸位置131的位置处的精氨酸(R);tt)在对应于SEQ ID NO:1中氨基酸位置132的位置处的缬氨酸(V);uu)在对应于SEQ ID NO:1中氨基酸位置147的位置处的丝氨酸(S);vv)在对应于SEQ ID NO:1中氨基酸位置151的位置处的丙氨酸(A);ww)在对应于SEQ ID NO:1中氨基酸位置153的位置处的亮氨酸(L)或甲硫氨酸(M);xx)在对应于SEQ ID NO:1中氨基酸位置159的位置处的色氨酸(W);yy)在对应于SEQ ID NO:1中氨基酸位置160的位置处的谷氨酸(E);zz)在对应于SEQ ID NO:1中氨基酸位置161的位置处的缬氨酸(V);aaa)在对应于SEQ ID NO:1中氨基酸位置162的位置处的酪氨酸(Y);bbb)在对应于SEQ ID NO:1中氨基酸位置163的位置处的精氨酸(R);ccc)在对应于SEQ ID NO:1中氨基酸位置164的位置处的组氨酸(H);ddd)在对应于SEQ ID NO:1中氨基酸位置165的位置处的亮氨酸(L);eee)在对应于SEQ ID NO:1中氨基酸位置166的位置处的精氨酸(R);fff)在对应于SEQ ID NO:1中氨基酸位置167的位置处的组氨酸(H);ggg)在对应于SEQ ID NO:1中氨基酸位置168的位置处的脯氨酸(P);hhh)在对应于SEQ ID NO:1中氨基酸位置169的位置处的丙氨酸(A);iii)在对应于SEQ ID NO:1中氨基酸位置170的位置处的脯氨酸(P);jjj)在对应于SEQ ID NO:1中氨基酸位置171的位置处的组氨酸(H);kkk)在对应于SEQ ID NO:1中氨基酸位置172的位置处的脯氨酸(P);lll)在对应于SEQ ID NO:1中氨基酸位置173的位置处的精氨酸(R);mmm)在对应于SEQ ID NO:1中氨基酸位置174的位置处的亮氨酸(L);nnn)在对应于SEQ ID NO:1中氨基酸位置175的位置处的脯氨酸(P);ooo)在对应于SEQ ID NO:1中氨基酸位置176的位置处的谷氨酰胺(Q);ppp)在对应于SEQ ID NO:1中氨基酸位置177的位置处的丙氨酸(A);qqq)在对应于SEQ ID NO:1中氨基酸位置178的位置处的精氨酸(R);rrr)在对应于SEQ ID NO:1中氨基酸位置179的位置处的缬氨酸(V);sss)在对应于SEQ ID NO:1中氨基酸位置180的位置处的谷氨酰胺(Q);ttt)在对应于SEQ ID NO:1中氨基酸位置182的位置处的缬氨酸(V);uuu)在对应于SEQ ID NO:1中氨基酸位置183的位置处的脯氨酸(P);vvv)在对应于SEQ ID NO:1中氨基酸位置184的位置处的赖氨酸(K);www)在对应于SEQ ID NO:1中氨基酸位置185的位置处的苏氨酸(T)或组氨酸(H):xxx)在对应于SEQ ID NO:1中氨基酸位置186的位置处的丝氨酸(S);yyy)在对应于SEQ ID NO:1中氨基酸位置187的位置处的谷氨酸(E);zzz)在对应于SEQ ID NO:1中氨基酸位置188的位置处的亮氨酸(L);aaaa)在对应于SEQ ID NO:1中氨基酸位置189的位置处的谷氨酸(E);bbbb)在对应于SEQ ID NO:1中氨基酸位置190的位置处的谷氨酰胺(Q);cccc)在对应于SEQ ID NO:1中氨基酸位置191的位置处的亮氨酸(L);dddd)在对应于SEQ ID NO:1中氨基酸位置192的位置处的氨基酸缺失;eeee)在对应于SEQ ID NO:1中氨基酸位置194的位置处的脯氨酸(P);ffff)在对应于SEQ ID NO:1中氨基酸位置195的位置处的赖氨酸(K);gggg)在对应于SEQ ID NO:1中氨基酸位置196的位置处的丝氨酸(S);hhhh)在对应于SEQ ID NO:1中氨基酸位置197的位置处的苯丙氨酸(F);iiii)在对应于SEQ ID NO:1中氨基酸位置200的位置处的异亮氨酸(I);jjjj)在对应于SEQ ID NO:1中氨基酸位置203的位置处的缬氨酸(V);kkkk)在对应于SEQ ID NO:1中氨基酸位置204的位置处的亮氨酸(L);llll)在对应于SEQ ID NO:1中氨基酸位置206的位置处的丙氨酸(A)或丝氨酸(S);mmmm)在对应于SEQ ID NO:1中氨基酸位置209的位置处的半胱氨酸(C);nnnn)在对应于SEQ ID NO:1中氨基酸位置222的位置处的亮氨酸(L);oooo)在对应于SEQ ID NO:1中氨基酸位置211的位置处的甲硫氨酸(M);pppp)在对应于SEQ ID NO:1中氨基酸位置232的位置处的异亮氨酸(I);qqqq)在对应于SEQ ID NO:1中氨基酸位置236的位置处的丝氨酸(S);rrrr)在对应于SEQ ID NO:1中氨基酸位置237的位置处的亮氨酸(L)或精氨酸(R);ssss)在对应于SEQ ID NO:1中氨基酸位置241的位置处的异亮氨酸(I)或亮氨酸(L);tttt)在对应于SEQ ID NO:1中氨基酸位置244的位置处的谷氨酸(E);uuuu)在对应于SEQ ID NO:1中氨基酸位置246的位置处的组氨酸(H);vvvv)在对应于SEQ ID NO:1中氨基酸位置253的位置处的天冬氨酸(D)或组氨酸(H);wwww)在对应于SEQ ID NO:1中氨基酸位置254的位置处的异亮氨酸(I);xxxx)在对应于SEQ ID NO:1中氨基酸位置258的位置处的丝氨酸(S);yyyy)在对应于SEQ ID NO:1中氨基酸位置267的位置处的精氨酸(R);zzzz)在对应于SEQ ID NO:1中氨基酸位置278的位置处的异亮氨酸(I);aaaaa)在对应于SEQ ID NO:1中氨基酸位置281的位置处的酪氨酸(Y);bbbbb)在对应于SEQ ID NO:1中氨基酸位置282的位置处的苯丙氨酸(F);ccccc)在对应于SEQ ID NO:1中氨基酸位置289的位置处的苏氨酸(T);ddddd)在对应于SEQ ID NO:1中氨基酸位置292的位置处的丙氨酸(A);eeeee)在对应于SEQ ID NO:1中氨基酸位置308的位置处的甘氨酸(G);fffff)在对应于SEQ ID NO:1中氨基酸位置311的位置处的精氨酸(R);ggggg)在对应于SEQ ID NO:1中氨基酸位置312的位置处的丙氨酸(A);hhhhh)在对应于SEQ ID NO:1中氨基酸位置316的位置处的丙氨酸(A);iiiii)在对应于SEQ ID NO:1中氨基酸位置318的位置处的精氨酸(R);jjjjj)在对应于SEQ ID NO:1中氨基酸位置319的位置处的缬氨酸(V);kkkkk)在对应于SEQ ID NO:1中氨基酸位置334的位置处的丙氨酸(A);lllll)在对应于SEQ ID NO:1中氨基酸位置339的位置处的苯丙氨酸(F);mmmmm)在对应于SEQ ID NO:1中氨基酸位置340的位置处的甘氨酸(G)或亮氨酸(L);nnnnn)在对应于SEQ ID NO:1中氨基酸位置342的位置处的丝氨酸(S);ooooo)在对应于SEQ ID NO:1中氨基酸位置345的位置处的天冬酰胺(N);ppppp)在对应于SEQ ID NO:1中氨基酸位置346的位置处的天冬酰胺(N);或qqqqq)在对应于SEQ ID NO:1中氨基酸位置348的位置处的天冬酰胺(N);或rrrrr)a)至qqqqq)的任何组合。 5.根据权利要求1所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID NO:14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402、403、430、431、432和433。 6.根据权利要求1所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码大范围核酸酶多肽,其中所述多肽能够识别和裂解大范围核酸酶识别序列,所述大范围核酸酶识别序列选自SEQ ID NO:2、SEQ ID NO:85、SEQ ID NO:269、SEQ ID NO:281、SEQ ID NO:331、SEQ ID NO:358、SEQ ID NO:390、SEQ ID NO:423或SEQ ID NO:424。 7.根据权利要求1所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码大范围核酸酶多肽,其中所述多肽在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时具有提高的大范围核酸酶活性。 8.根据权利要求7所述的分离的或重组的多核苷酸,其中所述对照大范围核酸酶选自SEQ ID NO:1、SEQ ID NO:86、SEQ ID NO:250、SEQ ID NO:270、SEQ ID NO:271、SEQ ID NO:282、SEQ ID NO:283、SEQ ID NO:329、SEQ ID NO:356、SEQ ID NO:389、SEQ ID NO:429或SEQ ID NO:435。 9.根据权利要求7所述的分离的或重组的多核苷酸,其中所述提高的大范围核酸酶活性的证据是:a)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更高的酵母测定得分;或b)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更高的目标位点突变率;或c)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更高的体外切割;或d)(a)、(b)和(c)的任何组合。 10.根据权利要求1所述的分离的或重组的多核苷酸,其还包含编码N-末端核转运肽的核苷酸序列。 11.根据权利要求1所述的分离的或重组的多核苷酸,其还包含编码C-末端组氨酸标签的核苷酸序列。 12.根据权利要求7所述的分离的或重组的多核苷酸,其中所述提高的大范围核酸酶活性是在16℃、24℃、28℃、30℃或37℃下测定的。 13.一种重组DNA构建体,其包含权利要求1所述的分离的或重组的多核苷酸。 14.根据权利要求13所述的重组DNA构建体,其还包含可操作地连接至所述多核苷酸的启动子。 15.根据权利要求14所述的重组DNA构建体,其中所述启动子相对于所述多核苷酸是异源的,或所述启动子相对于所述多核苷酸是同源的。 16.一种细胞,其包含至少一种权利要求1所述的多核苷酸或权利要求13所述的重组DNA构建体,其中所述多核苷酸对于所述细胞是异源的。 17.根据权利要求16所述的细胞,其中所述细胞是酵母细胞。 18.根据权利要求16所述的细胞,其中所述细胞是植物细胞。 19.根据权利要求16所述的细胞,其中所述多核苷酸或所述重组DNA构建体稳定地掺入至所述植物细胞的基因组中。 20.根据权利要求16所述的细胞,其中所述多核苷酸或所述重组DNA构建体稳定地掺入至所述植物细胞的叶绿体基因组中。 21.根据权利要求18所述的细胞,其中所述植物细胞来自单子叶植物。 22.根据权利要求21所述的细胞,其中所述单子叶植物为玉米、小麦、稻、大麦、甘蔗、高粱或黑麦。 23.根据权利要求18所述的细胞,其中所述植物细胞来自双子叶植物。 24.根据权利要求23所述的细胞,其中所述双子叶植物为大豆、芸苔属植物(Brassica)、向日葵、棉花或苜蓿。 25.一种植物,其包含权利要求18所述的植物细胞。 26.一种植物外植体,其包含权利要求18所述的植物细胞。 27.根据权利要求26所述的植物、外植体或植物细胞,其中所述植物、外植体或植物细胞在与不包含至少一种权利要求1所述的多核苷酸的相同物种、品系或品种的植物、外植体或植物细胞进行比较时表现出提高的大范围核酸酶活性。 28.一种转基因种子,其由权利要求25所述的植物产生。 29.一种具有大范围核酸酶活性的分离的多肽,所述多肽包含:a)在对应于SEQ ID NO:1的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:1的位置选自位置2、12、16、22、23、31、36、43、50、56、58、59、62、71、72、73、80、81、82、86、91、95、98、103、113、114、116、117、118、121、124、128、129、131、147、151、153、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、194、195、196、197、200、203、204、209、222、232、236、237、246、254、258、267、278、281、282、289、308、311、312、316、318、319、334、339、340、342、345、346、348、以及它们的组合;或b)具有(a)的任何氨基酸修饰中的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43或44个的氨基酸序列。 30.根据权利要求29所述的分离的多肽,其中所述多肽与SEQ ID NO:1具有至少80%的序列同一性。 31.根据权利要求29所述的分离的多肽,其中所述至少一个氨基酸修饰包括:a)在对应于SEQ ID NO:1中氨基酸位置2的位置处的天冬氨酸(D);b)在对应于SEQ ID NO:1中氨基酸位置12的位置处的组氨酸(H);c)在对应于SEQ ID NO:1中氨基酸位置16的位置处的异亮氨酸(I);d)在对应于SEQ ID NO:1中氨基酸位置22的位置处的半胱氨酸(C);e)在对应于SEQ ID NO:1中氨基酸位置23的位置处的亮氨酸(L);f)在对应于SEQ ID NO:1中氨基酸位置31的位置处的精氨酸(R);g)在对应于SEQ ID NO:1中氨基酸位置36的位置处的天冬酰胺(N);h)在对应于SEQ ID NO:1中氨基酸位置43的位置处的亮氨酸(L);i)在对应于SEQ ID NO:1中氨基酸位置50的位置处的精氨酸(R)或赖氨酸(K);j)在对应于SEQ ID NO:1中氨基酸位置56的位置处的亮氨酸(L);k)在对应于SEQ ID NO:1中氨基酸位置58的位置处的异亮氨酸(I);l)在对应于SEQ ID NO:1中氨基酸位置59的位置处的组氨酸(H)或丙氨酸(A);m)在对应于SEQ ID NO:1中氨基酸位置62的位置处的缬氨酸(V);n)在对应于SEQ ID NO:1中氨基酸位置71的位置处的赖氨酸(K);o)在对应于SEQ ID NO:1中氨基酸位置72的位置处的苏氨酸(T);p)在对应于SEQ ID NO:1中氨基酸位置73的位置处的丙氨酸(A);q)在对应于SEQ ID NO:1中氨基酸位置80的位置处的精氨酸(R);r)在对应于SEQ ID NO:1中氨基酸位置81的位置处的赖氨酸(K);s)在对应于SEQ ID NO:1中氨基酸位置82的位置处的精氨酸(R);t)在对应于SEQ ID NO:1中氨基酸位置86的位置处的天冬氨酸(D);u)在对应于SEQ ID NO:1中氨基酸位置91的位置处的异亮氨酸(I);v)在对应于SEQ ID NO:1中氨基酸位置95的位置处的异亮氨酸(I);w)在对应于SEQ ID NO:1中氨基酸位置98的位置处的精氨酸(R);x)在对应于SEQ ID NO:1中氨基酸位置103的位置处的缬氨酸(V);y)在对应于SEQ ID NO:1中氨基酸位置113的位置处的丝氨酸(S);z)在对应于SEQ ID NO:1中氨基酸位置114的位置处的脯氨酸(P);aa)在对应于SEQ ID NO:1中氨基酸位置116的位置处的精氨酸(R);bb)在对应于SEQ ID NO:1中氨基酸位置117的位置处的甘氨酸(G);cc)在对应于SEQ ID NO:1中氨基酸位置118的位置处的苏氨酸(T);dd)在对应于SEQ ID NO:1中氨基酸位置121的位置处的甘氨酸(G);ee)在对应于SEQ ID NO:1中氨基酸位置124的位置处的精氨酸(R);ff)在对应于SEQ ID NO:1中氨基酸位置128的位置处的半胱氨酸(C);gg)在对应于SEQ ID NO:1中氨基酸位置129的位置处的丙氨酸(A);hh)在对应于SEQ ID NO:1中氨基酸位置131的位置处的精氨酸(R);ii)在对应于SEQ ID NO:1中氨基酸位置147的位置处的丝氨酸(S);jj)在对应于SEQ ID NO:1中氨基酸位置151的位置处的丙氨酸(A);kk)在对应于SEQ ID NO:1中氨基酸位置153的位置处的亮氨酸(L)或甲硫氨酸(M);ll)在对应于SEQ ID NO:1中氨基酸位置159的位置处的色氨酸(W);mm)在对应于SEQ ID NO:1中氨基酸位置160的位置处的谷氨酸(E);nn)在对应于SEQ ID NO:1中氨基酸位置161的位置处的缬氨酸(V);oo)在对应于SEQ ID NO:1中氨基酸位置162的位置处的酪氨酸(Y);pp)在对应于SEQ ID NO:1中氨基酸位置163的位置处的精氨酸(R);qq)在对应于SEQ ID NO:1中氨基酸位置164的位置处的组氨酸(H);rr)在对应于SEQ ID NO:1中氨基酸位置165的位置处的亮氨酸(L);ss)在对应于SEQ ID NO:1中氨基酸位置166的位置处的精氨酸(R);tt)在对应于SEQ ID NO:1中氨基酸位置167的位置处的组氨酸(H);uu)在对应于SEQ ID NO:1中氨基酸位置168的位置处的脯氨酸(P);vv)在对应于SEQ ID NO:1中氨基酸位置169的位置处的丙氨酸(A);ww)在对应于SEQ ID NO:1中氨基酸位置170的位置处的脯氨酸(P);xx)在对应于SEQ ID NO:1中氨基酸位置171的位置处的组氨酸(H);yy)在对应于SEQ ID NO:1中氨基酸位置172的位置处的脯氨酸(P);zz)在对应于SEQ ID NO:1中氨基酸位置173的位置处的精氨酸(R);aaa)在对应于SEQ ID NO:1中氨基酸位置174的位置处的亮氨酸(L);bbb)在对应于SEQ ID NO:1中氨基酸位置175的位置处的脯氨酸(P);ccc)在对应于SEQ ID NO:1中氨基酸位置176的位置处的谷氨酰胺(Q);ddd)在对应于SEQ ID NO:1中氨基酸位置177的位置处的丙氨酸(A);eee)在对应于SEQ ID NO:1中氨基酸位置178的位置处的精氨酸(R);fff)在对应于SEQ ID NO:1中氨基酸位置179的位置处的缬氨酸(V);ggg)在对应于SEQ ID NO:1中氨基酸位置180的位置处的谷氨酰胺(Q);hhh)在对应于SEQ ID NO:1中氨基酸位置182的位置处的缬氨酸(V);iii)在对应于SEQ ID NO:1中氨基酸位置183的位置处的脯氨酸(P);jjj)在对应于SEQ ID NO:1中氨基酸位置184的位置处的赖氨酸(K);kkk)在对应于SEQ ID NO:1中氨基酸位置185的位置处的苏氨酸(T)或组氨酸(H);lll)在对应于SEQ ID NO:1中氨基酸位置186的位置处的丝氨酸(S);mmm)在对应于SEQ ID NO:1中氨基酸位置187的位置处的谷氨酸(E);nnn)在对应于SEQ ID NO:1中氨基酸位置188的位置处的亮氨酸(L);ooo)在对应于SEQ ID NO:1中氨基酸位置189的位置处的谷氨酸(E);ppp)在对应于SEQ ID NO:1中氨基酸位置190的位置处的谷氨酰胺(Q);qqq)在对应于SEQ ID NO:1中氨基酸位置191的位置处的亮氨酸(L);rrr)在对应于SEQ ID NO:1中氨基酸位置194的位置处的脯氨酸(P);sss)在对应于SEQ ID NO:1中氨基酸位置195的位置处的赖氨酸(K);ttt)在对应于SEQ ID NO:1中氨基酸位置196的位置处的丝氨酸(S);uuu)在对应于SEQ ID NO:1中氨基酸位置197的位置处的苯丙氨酸(F);vvv)在对应于SEQ ID NO:1中氨基酸位置200的位置处的异亮氨酸(I);www)在对应于SEQ ID NO:1中氨基酸位置203的位置处的缬氨酸(V);xxx)在对应于SEQ ID NO:1中氨基酸位置204的位置处的亮氨酸(L);yyy)在对应于SEQ ID NO:1中氨基酸位置209的位置处的半胱氨酸(C);zzz)在对应于SEQ ID NO:1中氨基酸位置222的位置处的亮氨酸(L);aaaa)在对应于SEQ ID NO:1中氨基酸位置232的位置处的异亮氨酸(I);bbbb)在对应于SEQ ID NO:1中氨基酸位置236的位置处的丝氨酸(S);cccc)在对应于SEQ ID NO:1中氨基酸位置237的位置处的亮氨酸(L)或精氨酸(R);dddd)在对应于SEQ ID NO:1中氨基酸位置246的位置处的组氨酸(H);eeee)在对应于SEQ ID NO:1中氨基酸位置254的位置处的异亮氨酸(I);ffff)在对应于SEQ ID NO:1中氨基酸位置258的位置处的丝氨酸(S);gggg)在对应于SEQ ID NO:1中氨基酸位置267的位置处的精氨酸(R);hhhh)在对应于SEQ ID NO:1中氨基酸位置278的位置处的异亮氨酸(I);iiii)在对应于SEQ ID NO:1中氨基酸位置281的位置处的酪氨酸(Y);jjjj)在对应于SEQ ID NO:1中氨基酸位置282的位置处的苯丙氨酸(F);kkkk)在对应于SEQ ID NO:1中氨基酸位置289的位置处的苏氨酸(T);llll)在对应于SEQ ID NO:1中氨基酸位置308的位置处的甘氨酸(G);mmmm)在对应于SEQ ID NO:1中氨基酸位置311的位置处的精氨酸(R);nnnn)在对应于SEQ ID NO:1中氨基酸位置312的位置处的丙氨酸(A);oooo)在对应于SEQ ID NO:1中氨基酸位置316的位置处的丙氨酸(A);pppp)在对应于SEQ ID NO:1中氨基酸位置318的位置处的精氨酸(R);qqqq)在对应于SEQ ID NO:1中氨基酸位置334的位置处的丙氨酸(A);rrrr)在对应于SEQ ID NO:1中氨基酸位置339的位置处的苯丙氨酸(F);ssss)在对应于SEQ ID NO:1中氨基酸位置340的位置处的甘氨酸(G)或亮氨酸(L);tttt)在对应于SEQ ID NO:1中氨基酸位置342的位置处的丝氨酸(S);uuuu)在对应于SEQ ID NO:1中氨基酸位置345的位置处的天冬酰胺(N);vvvv)在对应于SEQ ID NO:1中氨基酸位置346的位置处的天冬酰胺(N);wwww)在对应于SEQ ID NO:1中氨基酸位置348的位置处的天冬酰胺(N);或xxxx)a)至wwww)的任何组合。 32.根据权利要求29所述的分离的多肽,其中所述多肽还包含:a)在对应于SEQ ID NO:1中氨基酸位置2的位置处的天冬氨酸(D);b)在对应于SEQ ID NO:1中氨基酸位置12的位置处的组氨酸(H);c)在对应于SEQ ID NO:1中氨基酸位置16的位置处的异亮氨酸(I);d)在对应于SEQ ID NO:1中氨基酸位置19的位置处的丝氨酸(S)或丙氨酸(A);e)在对应于SEQ ID NO:1中氨基酸位置22的位置处的半胱氨酸(C);f)在对应于SEQ ID NO:1中氨基酸位置23的位置处的亮氨酸(L);g)在对应于SEQ ID NO:1中氨基酸位置24的位置处的甲硫氨酸(M);h)在对应于SEQ ID NO:1中氨基酸位置28的位置处的精氨酸(R)或丙氨酸(A);i)在对应于SEQ ID NO:1中氨基酸位置30的位置处的精氨酸(R)、丙氨酸(A)、谷氨酰胺(Q)、半胱氨酸(C)、甘氨酸(G)、丝氨酸(S)、苏氨酸(T)、亮氨酸(L)、谷氨酸(E)或脯氨酸(P);j)在对应于SEQ ID NO:1中氨基酸位置31的位置处的精氨酸(R);k)在对应于SEQ ID NO:1中氨基酸位置32的位置处的精氨酸(R)、丙氨酸(A)、赖氨酸(K)、谷氨酰胺(Q)、甘氨酸(G)或亮氨酸(L);l)在对应于SEQ ID NO:1中氨基酸位置36的位置处的天冬酰胺(N);m)在对应于SEQ ID NO:1中氨基酸位置43的位置处的亮氨酸(L);n)在对应于SEQ ID NO:1中氨基酸位置50的位置处的精氨酸(R)或赖氨酸(K);o)在对应于SEQ ID NO:1中氨基酸位置54的位置处的异亮氨酸(I)或亮氨酸(L);p)在对应于SEQ ID NO:1中氨基酸位置56的位置处的亮氨酸(L);q)在对应于SEQ ID NO:1中氨基酸位置57的位置处的谷氨酸(E);r)在对应于SEQ ID NO:1中氨基酸位置58的位置处的异亮氨酸(I);s)在对应于SEQ ID NO:1中氨基酸位置59的位置处的组氨酸(H)或丙氨酸(A);t)在对应于SEQ ID NO:1中氨基酸位置62的位置处的缬氨酸(V);u)在对应于SEQ ID NO:1中氨基酸位置71的位置处的赖氨酸(K);v)在对应于SEQ ID NO:1中氨基酸位置72的位置处的苏氨酸(T);w)在对应于SEQ ID NO:1中氨基酸位置73的位置处的丙氨酸(A);x)在对应于SEQ ID NO:1中氨基酸位置79的位置处的甘氨酸(G);y)在对应于SEQ ID NO:1中氨基酸位置80的位置处的精氨酸(R);z)在对应于SEQ ID NO:1中氨基酸位置81的位置处的赖氨酸(K);aa)在对应于SEQ ID NO:1中氨基酸位置82的位置处的精氨酸(R);bb)在对应于SEQ ID NO:1中氨基酸位置86的位置处的天冬氨酸(D);cc)在对应于SEQ ID NO:1中氨基酸位置87的位置处的亮氨酸(L);dd)在对应于SEQ ID NO:1中氨基酸位置91的位置处的异亮氨酸(I);ee)在对应于SEQ ID NO:1中氨基酸位置95的位置处的异亮氨酸(I);ff)在对应于SEQ ID NO:1中氨基酸位置98的位置处的精氨酸(R);gg)在对应于SEQ ID NO:1中氨基酸位置103的位置处的缬氨酸(V);hh)在对应于SEQ ID NO:1中氨基酸位置105的位置处的丙氨酸(A);ii)在对应于SEQ ID NO:1中氨基酸位置111的位置处的精氨酸(R);jj)在对应于SEQ ID NO:1中氨基酸位置113的位置处的丝氨酸(S);kk)在对应于SEQ ID NO:1中氨基酸位置114的位置处的脯氨酸(P);ll)在对应于SEQ ID NO:1中氨基酸位置116的位置处的精氨酸(R);mm)在对应于SEQ ID NO:1中氨基酸位置117的位置处的甘氨酸(G);nn)在对应于SEQ ID NO:1中氨基酸位置118的位置处的苏氨酸(T);oo)在对应于SEQ ID NO:1中氨基酸位置121的位置处的甘氨酸(G);pp)在对应于SEQ ID NO:1中氨基酸位置124的位置处的精氨酸(R);qq)在对应于SEQ ID NO:1中氨基酸位置128的位置处的半胱氨酸(C);rr)在对应于SEQ ID NO:1中氨基酸位置129的位置处的丙氨酸(A);ss)在对应于SEQ ID NO:1中氨基酸位置131的位置处的精氨酸(R);tt)在对应于SEQ ID NO:1中氨基酸位置132的位置处的缬氨酸(V);uu)在对应于SEQ ID NO:1中氨基酸位置147的位置处的丝氨酸(S);vv)在对应于SEQ ID NO:1中氨基酸位置151的位置处的丙氨酸(A);ww)在对应于SEQ ID NO:1中氨基酸位置153的位置处的亮氨酸(L)或甲硫氨酸(M);xx)在对应于SEQ ID NO:1中氨基酸位置159的位置处的色氨酸(W);yy)在对应于SEQ ID NO:1中氨基酸位置160的位置处的谷氨酸(E);zz)在对应于SEQ ID NO:1中氨基酸位置161的位置处的缬氨酸(V);aaa)在对应于SEQ ID NO:1中氨基酸位置162的位置处的酪氨酸(Y);bbb)在对应于SEQ ID NO:1中氨基酸位置163的位置处的精氨酸(R);ccc)在对应于SEQ ID NO:1中氨基酸位置164的位置处的组氨酸(H);ddd)在对应于SEQ ID NO:1中氨基酸位置165的位置处的亮氨酸(L);eee)在对应于SEQ ID NO:1中氨基酸位置166的位置处的精氨酸(R);fff)在对应于SEQ ID NO:1中氨基酸位置167的位置处的组氨酸(H);ggg)在对应于SEQ ID NO:1中氨基酸位置168的位置处的脯氨酸(P);hhh)在对应于SEQ ID NO:1中氨基酸位置169的位置处的丙氨酸(A);iii)在对应于SEQ ID NO:1中氨基酸位置170的位置处的脯氨酸(P);jjj)在对应于SEQ ID NO:1中氨基酸位置171的位置处的组氨酸(H);kkk)在对应于SEQ ID NO:1中氨基酸位置172的位置处的脯氨酸(P);lll)在对应于SEQ ID NO:1中氨基酸位置173的位置处的精氨酸(R);mmm)在对应于SEQ ID NO:1中氨基酸位置174的位置处的亮氨酸(L);nnn)在对应于SEQ ID NO:1中氨基酸位置175的位置处的脯氨酸(P);ooo)在对应于SEQ ID NO:1中氨基酸位置176的位置处的谷氨酰胺(Q);ppp)在对应于SEQ ID NO:1中氨基酸位置177的位置处的丙氨酸(A);qqq)在对应于SEQ ID NO:1中氨基酸位置178的位置处的精氨酸(R);rrr)在对应于SEQ ID NO:1中氨基酸位置179的位置处的缬氨酸(V);sss)在对应于SEQ ID NO:1中氨基酸位置180的位置处的谷氨酰胺(Q);ttt)在对应于SEQ ID NO:1中氨基酸位置182的位置处的缬氨酸(V);uuu)在对应于SEQ ID NO:1中氨基酸位置183的位置处的脯氨酸(P);vvv)在对应于SEQ ID NO:1中氨基酸位置184的位置处的赖氨酸(K);www)在对应于SEQ ID NO:1中氨基酸位置185的位置处的苏氨酸(T)或组氨酸(H);xxx)在对应于SEQ ID NO:1中氨基酸位置186的位置处的丝氨酸(S);yyy)在对应于SEQ ID NO:1中氨基酸位置187的位置处的谷氨酸(E);zzz)在对应于SEQ ID NO:1中氨基酸位置188的位置处的亮氨酸(L);aaaa)在对应于SEQ ID NO:1中氨基酸位置189的位置处的谷氨酸(E);bbbb)在对应于SEQ ID NO:1中氨基酸位置190的位置处的谷氨酰胺(Q);cccc)在对应于SEQ ID NO:1中氨基酸位置191的位置处的亮氨酸(L);dddd)在对应于SEQ ID NO:1中氨基酸位置192的位置处的氨基酸缺失;eeee)在对应于SEQ ID NO:1中氨基酸位置194的位置处的脯氨酸(P);ffff)在对应于SEQ ID NO:1中氨基酸位置195的位置处的赖氨酸(K);gggg)在对应于SEQ ID NO:1中氨基酸位置196的位置处的丝氨酸(S);hhhh)在对应于SEQ ID NO:1中氨基酸位置197的位置处的苯丙氨酸(F);iiii)在对应于SEQ ID NO:1中氨基酸位置200的位置处的异亮氨酸(I);jjjj)在对应于SEQ ID NO:1中氨基酸位置203的位置处的缬氨酸(V);kkkk)在对应于SEQ ID NO:1中氨基酸位置204的位置处的亮氨酸(L);llll)在对应于SEQ ID NO:1中氨基酸位置206的位置处的丙氨酸(A)或丝氨酸(S);mmmm)在对应于SEQ ID NO:1中氨基酸位置209的位置处的半胱氨酸(C);nnnn)在对应于SEQ ID NO:1中氨基酸位置222的位置处的亮氨酸(L);oooo)在对应于SEQ ID NO:1中氨基酸位置211的位置处的甲硫氨酸(M);pppp)在对应于SEQ ID NO:1中氨基酸位置232的位置处的异亮氨酸(I);qqqq)在对应于SEQ ID NO:1中氨基酸位置236的位置处的丝氨酸(S);rrrr)在对应于SEQ ID NO:1中氨基酸位置237的位置处的亮氨酸(L)或精氨酸(R);ssss)在对应于SEQ ID NO:1中氨基酸位置241的位置处的异亮氨酸(I)或亮氨酸(L);tttt)在对应于SEQ ID NO:1中氨基酸位置244的位置处的谷氨酸(E);uuuu)在对应于SEQ ID NO:1中氨基酸位置246的位置处的组氨酸(H);vvvv)在对应于SEQ ID NO:1中氨基酸位置253的位置处的天冬氨酸(D)或组氨酸(H);wwww)在对应于SEQ ID NO:1中氨基酸位置254的位置处的异亮氨酸(I);xxxx)在对应于SEQ ID NO:1中氨基酸位置258的位置处的丝氨酸(S);yyyy)在对应于SEQ ID NO:1中氨基酸位置267的位置处的精氨酸(R);zzzz)在对应于SEQ ID NO:1中氨基酸位置278的位置处的异亮氨酸(I);aaaaa)在对应于SEQ ID NO:1中氨基酸位置281的位置处的酪氨酸(Y);bbbbb)在对应于SEQ ID NO:1中氨基酸位置282的位置处的苯丙氨酸(F);ccccc)在对应于SEQ ID NO:1中氨基酸位置289的位置处的苏氨酸(T);ddddd)在对应于SEQ ID NO:1中氨基酸位置292的位置处的丙氨酸(A);eeeee)在对应于SEQ ID NO:1中氨基酸位置308的位置处的甘氨酸(G);fffff)在对应于SEQ ID NO:1中氨基酸位置311的位置处的精氨酸(R);ggggg)在对应于SEQ ID NO:1中氨基酸位置312的位置处的丙氨酸(A);hhhhh)在对应于SEQ ID NO:1中氨基酸位置316的位置处的丙氨酸(A);iiiii)在对应于SEQ ID NO:1中氨基酸位置318的位置处的精氨酸(R);jjjjj)在对应于SEQ ID NO:1中氨基酸位置319的位置处的缬氨酸(V);kkkkk)在对应于SEQ ID NO:1中氨基酸位置334的位置处的丙氨酸(A);lllll)在对应于SEQ ID NO:1中氨基酸位置339的位置处的苯丙氨酸(F);mmmmm)在对应于SEQ ID NO:1中氨基酸位置340的位置处的甘氨酸(G)或亮氨酸(L);nnnnn)在对应于SEQ ID NO:1中氨基酸位置342的位置处的丝氨酸(S);ooooo)在对应于SEQ ID NO:1中氨基酸位置345的位置处的天冬酰胺(N);ppppp)在对应于SEQ ID NO:1中氨基酸位置346的位置处的天冬酰胺(N);或qqqqq)在对应于SEQ ID NO:1中氨基酸位置348的位置处的天冬酰胺(N);或rrrrr)a)至qqqqq)的任何组合。 33.根据权利要求29所述的分离的多肽,其选自SEQ ID NO:14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402、430、431、432和433。 34.根据权利要求29所述的分离的多肽,其中所述多肽能够识别和裂解大范围核酸酶识别位点,所述大范围核酸酶识别位点选自SEQ ID NO:2、SEQ ID NO:85、SEQ ID NO:269、SEQ ID NO:281、SEQ ID NO:331、SEQ ID NO:358、SEQ ID NO:390、SEQ ID NO:423或SEQ ID NO:424。 35.根据权利要求29所述的分离的多肽,其中所述多肽在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时具有提高的大范围核酸酶活性。 36.根据权利要求29所述的分离的多肽,其中所述对照大范围核酸酶选自SEQ ID NO:1、SEQ ID NO:86、SEQ ID NO:250、SEQ ID NO:270、SEQ ID NO:271、SEQ ID NO:282、SEQ ID NO:283、SEQ ID NO:329、SEQ ID NO:356、SEQ ID NO:389、SEQ ID NO:429或SEQ ID NO:435。 37.根据权利要求29所述的分离的多肽,其中所述提高的大范围核酸酶活性的证据是:a)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更高的酵母测定得分;或b)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更高的目标位点突变率;或c)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更高的体外切割;或d)(a)、(b)和(c)的任何组合。 38.一种组合物,其包含权利要求29所述的至少一种或多种多肽。 39.一种制备大范围核酸酶的方法,所述大范围核酸酶在一定温度范围内具有提高的活性,所述方法包括:a)通过在对应于SEQ ID NO:1的位置的氨基酸位置处修饰至少一个氨基酸来制备大范围核酸酶变体,所述SEQ ID NO:1的位置选自位置2、12、16、22、23、31、36、43、50、56、58、59、62、71、72、73、80、81、82、86、91、95、98、103、113、114、116、117、118、121、124、128、129、131、147、151、153、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、194、195、196、197、200、203、204、209、222、232、236、237、246、254、258、267、278、281、282、289、308、311、312、316、318、319、334、339、340、342、345、346、348、以及它们的组合;以及b)选择来自步骤a)的所述大范围核酸酶变体,并且筛选能够在16℃至37℃之间且包括16℃和37℃的温度范围内裂解DNA目标序列的所述大范围核酸酶变体。 40.根据权利要求39所述的方法,其中所述温度范围包括:a)16℃;b)18℃;c)20℃;d)24℃;e)28℃;f)30℃;g)37℃;或h)a)、b)、c)、d)、e)、f)、h)、g)和g)的任何组合。 41.一种制备大范围核酸酶的方法,所述大范围核酸酶在与对照大范围核酸酶进行比较时具有提高的大范围核酸酶活性,所述方法包括:a)通过在对应于SEQ ID NO:1的位置的氨基酸位置处修饰至少一个氨基酸来制备大范围核酸酶变体,所述SEQ ID NO:1的位置选自位置2、12、16、22、23、31、36、43、50、56、58、59、62、71、72、73、80、81、82、86、91、95、98、103、113、114、116、117、118、121、124、128、129、131、147、151、153、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、194、195、196、197、200、203、204、209、222、232、236、237、246、254、258、267、278、281、282、289、308、311、312、316、318、319、334、339、340、342、345、346、348、以及它们的组合;以及b)选择来自步骤a)的所述大范围核酸酶变体,并且筛选在与对照大范围核酸酶进行比较时具有提高的大范围核酸酶活性的所述变体。 42.根据权利要求41所述的方法,其中所述提高的大范围核酸酶活性的证据是:a)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更高的酵母测定得分;或b)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更高的目标位点突变率;或c)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更高的体外切割;或d)(a)、(b)和(c)的任何组合。 43.根据权利要求1所述的分离的或重组的多核苷酸,其中所述大范围核酸酶多肽包含接头多肽,其中所述接头多肽包括:a)SEQ ID NO:420;b)SEQ ID NO:421;c)SEQ ID NO:422;或d)由在对应于SEQ ID NO:1的位置156至193的位置处的任何可能的氨基酸组成的氨基酸序列。 44.一种组合物,其包含权利要求1所述的至少一种或多种多核苷酸。 45.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多肽包含在对应于SEQ ID NO:1的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:1的位置选自位置16、22、50、56、59、71、81、103、121、153、185、209、222、246、258、281、308、316、345、346、以及它们的组合,并且其中所述多肽能够识别和裂解包含SEQ ID NO:2的大范围核酸酶目标位点。 46.根据权利要求45所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码与SEQ ID NO:1具有至少80%的序列同一性的大范围核酸酶多肽。 47.根据权利要求45所述的分离的或重组的多核苷酸,其中所述至少一个氨基酸修饰包括在图5A-5C中所示氨基酸修饰中的任何一个。 48.根据权利要求45所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID NO:14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37和38。 49.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多肽包含在对应于SEQ ID NO:86的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:86的位置选自位置2、12、16、22、23、36、43、50、56、58、59、72、73、81、86、91、95、103、113、114、120、121、124、128、129、131、151、153、200、204、209、232、236、237、246、254、258、267、281、308、311、312、316、319、334、339、340、342、以及它们的组合,并且其中所述多肽能够识别和裂解包含SEQ ID NO:85的大范围核酸酶目标位点。 50.根据权利要求49所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码与SEQ ID NO:86具有至少80%的序列同一性的大范围核酸酶多肽。 51.根据权利要求49所述的分离的或重组的多核苷酸,其中所述至少一个氨基酸修饰包括在图9A-9D中所示氨基酸修饰中的任何一个。 52.根据权利要求49所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID NO:87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252和253。 53.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多肽包含在对应于SEQ ID NO:270的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:270的位置选自位置16、22、50、71、185、246、258、316、以及它们的组合,并且其中所述多肽能够识别和裂解包含SEQ ID NO:269的大范围核酸酶目标位点。 54.根据权利要求53所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID NO:272、273、274和275。 55.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多肽包含在对应于SEQ ID NO:282的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:282的位置选自位置12、16、22、31、50、56、59、62、81、98、103、105、116、118、121、153、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、258、281、308、312、316、319、以及它们的组合,并且其中所述多肽能够识别和裂解包含SEQ ID NO:281的大范围核酸酶目标位点。 56.根据权利要求55所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码与SEQ ID NO:282具有至少80%的序列同一性的大范围核酸酶多肽。 57.根据权利要求55所述的分离的或重组的多核苷酸,其中所述至少一个氨基酸修饰包括在图10A-10C中所示氨基酸修饰中的任何一个。 58.根据权利要求55所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID NO:284、285、286、287、288、289、290、291、292、293、294、295、296、297和298。 59.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多肽包含在对应于SEQ ID NO:329的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:329的位置选自位置12、32、50、56、80、105、124、129、131、153、185、311、316、318、340、以及它们的组合,并且其中所述多肽能够识别和裂解包含SEQ ID NO:328的大范围核酸酶目标位点。 60.根据权利要求59所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码与SEQ ID NO:329具有至少80%的序列同一性的大范围核酸酶多肽。 61.根据权利要求59所述的分离的或重组的多核苷酸,其中所述至少一个氨基酸修饰包括在图11中所示氨基酸修饰中的任何一个。 62.根据权利要求59所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID NO:330、331、332、333、334、335、336、337、338、339、340和341。 63.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多肽包含在对应于SEQ ID NO:356的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:356的位置选自位置12、24、36、50、56、62、73、80、124、129、147、182、203、237、252、311、316、318、340、348、以及它们的组合,并且其中所述多肽能够识别和裂解包含SEQ ID NO:355的大范围核酸酶目标位点。 64.根据权利要求63所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码与SEQ ID NO:356具有至少80%的序列同一性的大范围核酸酶多肽。 65.根据权利要求63所述的分离的或重组的多核苷酸,其中所述至少一个氨基酸修饰包括在图12中所示氨基酸修饰中的任何一个。 66.根据权利要求63所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID NO:357、358、359、360、361、362、363、364、365、366、367、368、369、370和371。 67.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多肽包含在对应于SEQ ID NO:389的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:389的位置选自位置12、50、56、124、129、131、153、211、237、311、316、和位置318、以及它们的组合,并且其中所述多肽能够识别和裂解包含SEQ ID NO:388的大范围核酸酶目标位点。 68.根据权利要求67所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码与SEQ ID NO:389具有至少80%的序列同一性的大范围核酸酶多肽。 69.根据权利要求67所述的分离的或重组的多核苷酸,其中所述至少一个氨基酸修饰包括在图13中所示氨基酸修饰中的任何一个。 70.根据权利要求67所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID NO:390、391、392、393、394、395、396、397、398、399、400、401、402和403。 72.一种酵母、植物、植物细胞、外植体或种子,其包含通过权利要求36-42所述的方法创建的大范围核酸酶。 73.一种在酵母或植物细胞的基因组中导入双链断裂的方法,所述方法包括:a)使至少一种在其基因组中包含大范围核酸酶识别位点的植物或酵母细胞与大范围核酸酶多肽变体接触,所述大范围核酸酶多肽变体选自SEQ ID NO:14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402和403,其中所述大范围核酸酶变体能够在所述识别位点诱导双链断裂;以及b)选择来自a)的酵母或植物细胞,并且针对所述识别序列的任何修饰筛选所述酵母或植物细胞。 74.一种将目的多核苷酸整合至植物或酵母细胞的基因组中的识别位点的方法,所述方法包括:a)使至少一种在其基因组中包含大范围核酸酶识别位点的植物或酵母细胞与下列物质接触:(i)大范围核酸酶多肽变体,所述大范围核酸酶多肽变体选自SEQ ID NO:14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402和403,其中所述大范围核酸酶变体能够在所述识别位点诱导双链断裂;和(ii)包含目的多核苷酸的DNA片段;b)选择至少一种植物或酵母细胞,所述植物或酵母细胞包含在所述识别位点整合的目的多核苷酸盒。 75.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多肽包含在对应于SEQ ID NO:429的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:429的位置选自位置16、22、50、71、185、246、258、316、以及它们的组合,并且其中所述多肽能够识别和裂解包含SEQ ID NO:423的大范围核酸酶目标位点。 76.根据权利要求75所述的分离的或重组的多核苷酸,其中所述核苷酸序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID NO:430、431和432。 77.一种编码SEQ ID NO:436的大范围核酸酶多肽的分离的或重组的多核苷酸,其中所述多肽能够识别和裂解包含SEQ ID NO:424的大范围核酸酶目标位点。

    说明书

    本申请要求提交于2012年5月4日的美国临时申请61/642470和提交 于2012年8月16日的美国临时申请61/683765的权益;两者的全文以引用 方式并入本文。

    技术领域

    本发明涉及分子生物学领域。更具体地,本发明涉及具有大范围核酸 酶活性的序列。

    背景技术

    通过重组DNA技术,很容易将外源DNA序列插入生物体的基因组, 从而改变所述生物体的表型。最常用的植物转化方法是农杆菌感染法和基 因枪粒子轰击法,其中转基因以随机模式和不可预知的拷贝数整合至植物 基因组中。因此,研究人员正在努力控制植物中的转基因整合。

    已经使用了位点特异性整合技术(采用了位置特异性整合系统以及其 它类型的整合系统)以在多个生物体中生成目的基因的靶向插入。

    其它插入和修饰DNA序列的方法涉及通过导入两翼为与基因组靶标同 源的序列的转基因DNA序列的同源DNA重组。美国专利5,527,695描述了 用DNA序列(靶向真核生物DNA的预先确定的序列)转化真核细胞。通 过使用选择性标记(作为被导入的DNA序列中的一部分)鉴定经转化的细 胞。

    虽然两种系统已经提供了对于目的序列的靶向插入可用的技术,但仍 然存在对便于精确改造植物或酵母基因组的核酸酶的需求。此外,存在对 于具有增大的、能在很宽的温度范围内引入双链断裂的大范围核酸酶的需 求。

    发明内容

    提供了包含具有大范围核酸酶活性的多核苷酸和多肽的组合物和方 法。还提供了包含编码变体大范围核酸酶的多核苷酸的组合物,所述变体 大范围核酸酶包含至少一个氨基酸修饰,其中所述变体大范围核酸酶提高 了活性。另外提供了具有大范围核酸酶序列的核酸构建体、酵母、植物、 植物细胞、外植体、种子和谷物。

    提供了使用所述大范围核酸酶序列的各种方法。此类方法包括用于提 高细胞、酵母、植物细胞、植物外植体或种子中的大范围核酸酶活性。还 提供了允许各种大范围核酸酶多核苷酸和变体及其片段在很宽的温度范围 内在酵母或植物细胞中表达的方法和组合物。此类方法和组合物应用于制 备具有改善的大范围核酸酶活性的酵母、植物细胞、植物和外植体。

    因此在第一实施例中,本发明涉及分离的或重组的多核苷酸,其包含 编码大范围核酸酶多肽的核苷酸序列,所述多肽包含:a)在对应于SEQ  ID NO:1的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列,所 述SEQ ID NO:1的位置选自位置2、12、16、22、23、31、36、43、50、 56、58、59、62、71、72、73、80、81、82、86、91、95、98、103、 113、114、116、117、118、121、124、128、129、131、147、151、153、 159、160、161、162、163、164、165、166、167、168、169、170、171、 172、173、174、175、176、177、178、179、180、182、183、184、185、 186、187、188、189、190、191、192、194、195、196、197、200、203、 204、209、222、232、236、237、246、254、258、267、278、281、282、 289、308、311、312、316、318、319、334、339、340、342、345、346、 348、以及它们的组合;或b)具有(a)的任何氨基酸修饰中的1、2、3、 4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、 21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、 37、38、39、40、41、42、43或44个的氨基酸序列。

    在其它实施例中,本发明涉及本公开的分离的或重组的多核苷酸,其 中所述核苷酸序列编码大范围核酸酶多肽,其与SEQ ID NO:1具有至少 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列同一性。

    在另一个实施例中,本发明涉及实施例1的分离的或重组的多核苷酸 和其对应的多肽,其中所述至少一个氨基酸修饰包括:a)在对应于SEQ  ID NO:1中氨基酸位置2的位置处的天冬氨酸(D);b)在对应于SEQ ID  NO:1中氨基酸位置12的位置处的组氨酸(H);c)在对应于SEQ ID  NO:1中氨基酸位置16的位置处的异亮氨酸(I);d)在对应于SEQ ID  NO:1中氨基酸位置22的位置处的半胱氨酸(C);e)在对应于SEQ ID  NO:1中氨基酸位置23的位置处的亮氨酸(L);f)在对应于SEQ ID NO:1 中氨基酸位置31的位置处的精氨酸(R);g)在对应于SEQ ID NO:1中氨 基酸位置36的位置处的天冬酰胺(N);h)在对应于SEQ ID NO:1中氨基 酸位置43的位置处的亮氨酸(L);i)在对应于SEQ ID NO:1中氨基酸位 置50的位置处的精氨酸(R)或赖氨酸(K);j)在对应于SEQ ID NO:1 中氨基酸位置56的位置处的亮氨酸(L);k)在对应于SEQ ID NO:1中氨 基酸位置58的位置处的异亮氨酸(I);l)在对应于SEQ ID NO:1中氨基 酸位置59的位置处的组氨酸(H)或丙氨酸(A);m)在对应于SEQ ID  NO:1中氨基酸位置62的位置处的缬氨酸(V);n)在对应于SEQ ID  NO:1中氨基酸位置71的位置处的赖氨酸(K);o)在对应于SEQ ID  NO:1中氨基酸位置72的位置处的苏氨酸(T);p)在对应于SEQ ID  NO:1中氨基酸位置73的位置处的丙氨酸(A);q)在对应于SEQ ID  NO:1中氨基酸位置80的位置处的精氨酸(R);r)在对应于SEQ ID NO:1 中氨基酸位置81的位置处的赖氨酸(K);s)在对应于SEQ ID NO:1中氨 基酸位置82的位置处的精氨酸(R);t)在对应于SEQ ID NO:1中氨基酸 位置86的位置处的天冬氨酸(D);u)在对应于SEQ ID NO:1中氨基酸位 置91的位置处的异亮氨酸(I);v)在对应于SEQ ID NO:1中氨基酸位置 95的位置处的异亮氨酸(I);w)在对应于SEQ ID NO:1中氨基酸位置98 的位置处的精氨酸(R);x)在对应于SEQ ID NO:1中氨基酸位置103的 位置处的缬氨酸(V);y)在对应于SEQ ID NO:1中氨基酸位置113的位 置处的丝氨酸(S);z)在对应于SEQ ID NO:1中氨基酸位置114的位置 处的脯氨酸(P);aa)在对应于SEQ ID NO:1中氨基酸位置116的位置处 的精氨酸(R);bb)在对应于SEQ ID NO:1中氨基酸位置117的位置处的 甘氨酸(G);cc)在对应于SEQ ID NO:1中氨基酸位置118的位置处的苏 氨酸(T);dd)在对应于SEQ ID NO:1中氨基酸位置121的位置处的甘氨 酸(G);ee)在对应于SEQ ID NO:1中氨基酸位置124的位置处的精氨酸 (R);ff)在对应于SEQ ID NO:1中氨基酸位置128的位置处的半胱氨酸 (C);gg)在对应于SEQ ID NO:1中氨基酸位置129的位置处的丙氨酸 (A);hh)在对应于SEQ ID NO:1中氨基酸位置131的位置处的精氨酸 (R);ii)在对应于SEQ ID NO:1中氨基酸位置147的位置处的丝氨酸 (S);jj)在对应于SEQ ID NO:1中氨基酸位置151的位置处的丙氨酸 (A);kk)在对应于SEQ ID NO:1中氨基酸位置153的位置处的亮氨酸 (L)或甲硫氨酸(M);ll)在对应于SEQ ID NO:1中氨基酸位置159的 位置处的色氨酸(W);mm)在对应于SEQ ID NO:1中氨基酸位置160的 位置处的谷氨酸(E);nn)在对应于SEQ ID NO:1中氨基酸位置161的位 置处的缬氨酸(V);oo)在对应于SEQ ID NO:1中氨基酸位置162的位置 处的酪氨酸(Y);pp)在对应于SEQ ID NO:1中氨基酸位置163的位置处 的精氨酸(R);qq)在对应于SEQ ID NO:1中氨基酸位置164的位置处的 组氨酸(H);rr)在对应于SEQ ID NO:1中氨基酸位置165的位置处的亮 氨酸(L);ss)在对应于SEQ ID NO:1中氨基酸位置166的位置处的精氨 酸(R);tt)在对应于SEQ ID NO:1中氨基酸位置167的位置处的组氨酸 (H);uu)在对应于SEQ ID NO:1中氨基酸位置168的位置处的脯氨酸 (P);vv)在对应于SEQ ID NO:1中氨基酸位置169的位置处的丙氨酸 (A);ww)在对应于SEQ ID NO:1中氨基酸位置170的位置处的脯氨酸 (P);xx)在对应于SEQ ID NO:1中氨基酸位置171的位置处的组氨酸 (H);yy)在对应于SEQ ID NO:1中氨基酸位置172的位置处的脯氨酸 (P);zz)在对应于SEQ ID NO:1中氨基酸位置173的位置处的精氨酸 (R);aaa)在对应于SEQ ID NO:1中氨基酸位置174的位置处的亮氨酸 (L);bbb)在对应于SEQ ID NO:1中氨基酸位置175的位置处的脯氨酸 (P);ccc)在对应于SEQ ID NO:1中氨基酸位置176的位置处的谷氨酸 (Q);ddd)在对应于SEQ ID NO:1中氨基酸位置177的位置处的丙氨酸 (A);eee)在对应于SEQ ID NO:1中氨基酸位置178的位置处的精氨酸 (R);fff)在对应于SEQ ID NO:1中氨基酸位置179的位置处的缬氨酸 (V);ggg)在对应于SEQ ID NO:1中氨基酸位置180的位置处的谷氨酸 (Q);hhh)在对应于SEQ ID NO:1中氨基酸位置182的位置处的缬氨酸 (V);iii)在对应于SEQ ID NO:1中氨基酸位置183的位置处的脯氨酸 (P);jjj)在对应于SEQ ID NO:1中氨基酸位置184的位置处的赖氨酸 (K);kkk)在对应于SEQ ID NO:1中氨基酸位置185的位置处的苏氨酸 (T)或组氨酸(H);lll)在对应于SEQ ID NO:1中氨基酸位置186的位 置处的丝氨酸(S);mmm)在对应于SEQ ID NO:1中氨基酸位置187的 位置处的谷氨酸(E);nnn)在对应于SEQ ID NO:1中氨基酸位置188的 位置处的亮氨酸(L);ooo)在对应于SEQ ID NO:1中氨基酸位置189的 位置处的谷氨酸(E);ppp)在对应于SEQ ID NO:1中氨基酸位置190的 位置处的谷氨酸(Q);qqq)在对应于SEQ ID NO:1中氨基酸位置191的 位置处的亮氨酸(L);rrr)在对应于SEQ ID NO:1中氨基酸位置194的位 置处的脯氨酸(P);sss)在对应于SEQ ID NO:1中氨基酸位置195的位置 处的赖氨酸(K);ttt)在对应于SEQ ID NO:1中氨基酸位置196的位置处 的丝氨酸(S);uuu)在对应于SEQ ID NO:1中氨基酸位置197的位置处 的苯丙氨酸(F);vvv)在对应于SEQ ID NO:1中氨基酸位置200的位置 处的异亮氨酸(I);www)在对应于SEQ ID NO:1中氨基酸位置203的位 置处的缬氨酸(V);xxx)在对应于SEQ ID NO:1中氨基酸位置204的位 置处的亮氨酸(L);yyy)在对应于SEQ ID NO:1中氨基酸位置209的位 置处的半胱氨酸(C);zzz)在对应于SEQ ID NO:1中氨基酸位置222的 位置处的亮氨酸(L);aaaa)在对应于SEQ ID NO:1中氨基酸位置232的 位置处的异亮氨酸(I);bbbb)在对应于SEQ ID NO:1中氨基酸位置236 的位置处的丝氨酸(S);cccc)在对应于SEQ ID NO:1中氨基酸位置237 的R位置处的亮氨酸(L)或精氨酸(R);dddd)在对应于SEQ ID NO:1 中氨基酸位置246的位置处的组氨酸(H);eeee)在对应于SEQ ID NO:1 中氨基酸位置254的位置处的异亮氨酸(I);ffff)在对应于SEQ ID NO:1 中氨基酸位置258的位置处的丝氨酸(S);gggg)在对应于SEQ ID NO:1 中氨基酸位置267的位置处的精氨酸(R);hhhh)在对应于SEQ ID NO:1 中氨基酸位置278的位置处的异亮氨酸(I);iiii)在对应于SEQ ID NO:1 中氨基酸位置281的位置处的酪氨酸(Y);jjjj)在对应于SEQ ID NO:1 中氨基酸位置282的位置处的苯丙氨酸(F);kkkk)在对应于SEQ ID  NO:1中氨基酸位置289的位置处的苏氨酸(T);llll)在对应于SEQ ID  NO:1中氨基酸位置308的位置处的甘氨酸(G);mmmm)在对应于SEQ  ID NO:1中氨基酸位置311的位置处的精氨酸(R);nnnn)在对应于SEQ  ID NO:1中氨基酸位置312的位置处的丙氨酸(A);oooo)在对应于SEQ  ID NO:1中氨基酸位置316的位置处的丙氨酸(A);pppp)在对应于SEQ  ID NO:1中氨基酸位置318的位置处的精氨酸(R);qqqq)在对应于SEQ  ID NO:1中氨基酸位置334的位置处的丙氨酸(A);rrrr)在对应于SEQ  ID NO:1中氨基酸位置339的位置处的苯丙氨酸(F);ssss)在对应于 SEQ ID NO:1中氨基酸位置340的位置处的甘氨酸(G)或亮氨酸(L); tttt)在对应于SEQ ID NO:1中氨基酸位置342的位置处的丝氨酸(S); uuuu)在对应于SEQ ID NO:1中氨基酸位置345的位置处的天冬酰胺 (N);vvvv)在对应于SEQ ID NO:1中氨基酸位置346的位置处的天冬酰 胺(N);wwww)在对应于SEQ ID NO:1中氨基酸位置348的位置处的天 冬酰胺(N);或xxxx)a)至wwww)的任何组合。

    在另一个实施例中,本发明涉及实施例1的分离的或重组的多核苷酸 和其对应的多肽,其中所述核苷酸序列编码大范围核酸酶多肽,其中所述 多肽还包含至少一种本文所述的氨基酸修饰,诸如表5A-5C、表9A-9D、 表10A-10C、表11、表12、表13、表14A-B和表15中所示的那些以及任 何已知的I-Cre1型修饰、以及它们的任何组合。

    在另一个实施例中,本发明涉及分离的或重组的多核苷酸和其对应的 多肽,其中所述核苷酸序列编码大范围核酸酶多肽,其选自SEQ ID  NO:14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、 29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、 93、94、95、96、97、98、99、100、101、102、103、104、105、106、 107、108、109、110、111、112、113、114、115、116、117、118、119、 120、121、122、123、124、125、126、127、128、129、130、131、132、 133、134、135、136、137、138、139、140、141、142、143、144、145、 146、147、148、149、150、151、152、153、154、155、156、157、158、 159、160、161、162、163、164、165、166、167、251、252、253、272、 273、274、275、272、273、274、275、284、285、286、287、288、289、 290、291、292、293、294、295、296、297、298、330、331、332、333、 334、335、336、337、338、339、340、341、357、358、359、360、361、 362、363、364、365、366、367、368、369、370、371、390、391、392、 393、394、395、396、397、398、399、400、401、402、403、430、431、 432和433。

    在另一个实施例中,本发明涉及本公开的分离的或重组的多核苷酸和 其对应的多肽,其中所述核苷酸序列编码大范围核酸酶多肽,其中所述多 肽能够识别并切开大范围核酸酶识别序列,所述大范围核酸酶识别序列选 自SEQ ID NO:2、SEQ ID NO:85、SEQ ID NO:269、SEQ ID NO:281、SEQ  ID NO:331、SEQ ID NO:358、SEQ ID NO:390、SEQ ID NO:423或SEQ ID  NO:424。

    在另一个实施例中,本发明涉及本公开的分离的或重组的多核苷酸和 其对应的多肽,其中所述核苷酸序列编码大范围核酸酶多肽,其中所述多 肽在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时具有提高的大 范围核酸酶活性。所述对照大范围核酸酶可选自SEQ ID NO:1、SEQ ID  NO:86、SEQ ID NO:250、SEQ ID NO:270、SEQ ID NO:271、SEQ ID  NO:282、SEQ ID NO:283、SEQ ID NO:329、SEQ ID NO:356、SEQ ID  NO:389、SEQ ID NO:429或SEQ ID NO:435或任何I-CreI型大范围核酸 酶。提高的大范围核酸酶的活性可以通过任何测量大范围核酸酶活性的方 法来证实,包括但不限于a)在与缺乏所述氨基酸修饰的对照大范围核酸酶 进行比较时酵母测定分数更高;或b)在与缺乏所述氨基酸修饰的对照大范 围核酸酶进行比较时目标位点突变率更高;或c)在与缺乏所述氨基酸修饰 的对照大范围核酸酶进行比较时体外切割更高;或d)那些方法的任何组 合。此外,可在宽泛的温度范围测量提高的活性,诸如温度包括16℃、24 ℃、28℃、30℃或37℃以及在16℃至37℃之间的温度。

    在另一个实施例中,本发明涉及分离的或重组的多核苷酸,其还包括 编码N-末端核转运肽的核苷酸序列和/或编码C-末端组氨酸标签的核苷酸 序列。

    在另一个实施例中,本发明涉及重组DNA构建体,其包含本公开的分 离的或重组的多核苷酸。所述重组DNA构建体可还包含可操作地连接至所 述多核苷酸的启动子。所述启动子相对于所述重组的多核苷酸可以为异源 的。

    在另一个实施例中,本发明涉及包含本公开的重组构建体的细胞、植 物细胞、酵母细胞、植物、酵母或种子。所述植物细胞可以为单子叶植物 或双子叶植物细胞。所述单子叶植物细胞可来自玉米、小麦、稻、大麦、 甜菜、高粱或裸麦。所述双子叶植物细胞可来自大豆、芸苔属植物 (Brassica)、向日葵、棉花或苜蓿。

    在另一个实施例中,本发明涉及包含本公开的重组构建体的植物以及 得自此类植物的种子或植物提取物、外植体。

    在另一个实施例中,本发明涉及制备大范围核酸酶的方法,所述大范 围核酸酶在一定温度范围具有提高的活性,所述方法包括:

    a)通过在对应于SEQ ID NO:1的位置的氨基酸位置处修饰至少一个 氨基酸来制备大范围核酸酶变体,所述SEQ ID NO:1的位置选自 位置2、12、16、22、23、31、36、43、50、56、58、59、62、 71、72、73、80、81、82、86、91、95、98、103、113、114、 116、117、118、121、124、128、129、131、147、151、153、 159、160、161、162、163、164、165、166、167、168、169、 170、171、172、173、174、175、176、177、178、179、180、 182、183、184、185、186、187、188、189、190、191、192、 194、195、196、197、200、203、204、209、222、232、236、 237、246、254、258、267、278、281、282、289、308、311、 312、316、318、319、334、339、340、342、345、346、348、以 及它们的组合;以及

    b)选择来自步骤a)的所述大范围核酸酶变体,并且筛选能够在16 ℃至37℃之间并包括16℃和37℃的温度范围内裂解DNA目标序 列的所述大范围核酸酶变体。

    在另一个实施例中,本发明涉及制备大范围核酸酶的方法,所述大范 围核酸酶在与对照大范围核酸酶进行比较时具有提高的大范围核酸酶活 性,所述方法包括:

    a)通过在对应于SEQ ID NO:1的位置的氨基酸位置处修饰至少一个 氨基酸来制备大范围核酸酶变体,所述SEQ ID NO:1的位置选自 位置2、12、16、22、23、31、36、43、50、56、58、59、62、 71、72、73、80、81、82、86、91、95、98、103、113、114、 116、117、118、121、124、128、129、131、147、151、153、 159、160、161、162、163、164、165、166、167、168、169、 170、171、172、173、174、175、176、177、178、179、180、 182、183、184、185、186、187、188、189、190、191、192、 194、195、196、197、200、203、204、209、222、232、236、 237、246、254、258、267、278、281、282、289、308、311、 312、316、318、319、334、339、340、342、345、346、348、以 及它们的组合;以及

    b)选择来自步骤a)的所述大范围核酸酶变体,并且筛选在与对照大 范围核酸酶进行比较时具有提高的大范围核酸酶活性的所述变 体。

    在另一个实施例中,本发明涉及在酵母或植物细胞的基因组中导入双 链断裂的方法,所述方法包括:

    a)使至少一种在其基因组中包含大范围核酸酶识别位点的植物或酵 母细胞与大范围核酸酶多肽变体接触,所述大范围核酸酶多肽选 自SEQ ID NO:14、15、16、17、18、19、20、21、22、23、24、 25、26、27、28、29、30、31、32、33、34、35、36、37、38、 87、88、89、90、91、92、93、94、95、96、97、98、99、100、 101、102、103、104、105、106、107、108、109、110、111、 112、113、114、115、116、117、118、119、120、121、122、 123、124、125、126、127、128、129、130、131、132、133、 134、135、136、137、138、139、140、141、142、143、144、 145、146、147、148、149、150、151、152、153、154、155、 156、157、158、159、160、161、162、163、164、165、166、 167、251、252、253、272、273、274、275、272、273、274、 275、284、285、286、287、288、289、290、291、292、293、 294、295、296、297、298、330、331、332、333、334、335、 336、337、338、339、340、341、357、358、359、360、361、 362、363、364、365、366、367、368、369、370、371、390、 391、392、393、394、395、396、397、398、399、400、401、 402和403,其中所述大范围核酸酶变体能够在所述识别位点诱导 双链断裂;以及

    b)选择来自a)的酵母或植物细胞,并且针对所述识别序列的任何修 饰筛选所述酵母或植物细胞。

    在另一个实施例中,本发明涉及将目的多核苷酸整合至植物或酵母细 胞的基因组中的识别位点的方法,所述方法包括:

    a)使至少一种在其基因组中包含大范围核酸酶识别位点的植物或酵 母细胞与下列物质接触:

    (i)大范围核酸酶多肽变体,其选自SEQ ID NO:14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、29、 30、31、32、33、34、35、36、37、38、87、88、89、90、 91、92、93、94、95、96、97、98、99、100、101、102、 103、104、105、106、107、108、109、110、111、112、 113、114、115、116、117、118、119、120、121、122、 123、124、125、126、127、128、129、130、131、132、 133、134、135、136、137、138、139、140、141、142、 143、144、145、146、147、148、149、150、151、152、 153、154、155、156、157、158、159、160、161、162、 163、164、165、166、167、251、252、253、272、273、 274、275、272、273、274、275、284、285、286、287、 288、289、290、291、292、293、294、295、296、297、 298、330、331、332、333、334、335、336、337、338、 339、340、341、357、358、359、360、361、362、363、 364、365、366、367、368、369、370、371、390、391、 392、393、394、395、396、397、398、399、400、401、402 和403,

    其中所述大范围核酸酶变体能够在所述识别位点诱导双 链断裂;和

    (ii)包含目的多核苷酸的DNA片段;

    b)选择至少一种植物或酵母细胞,其包含在所述识别位点整合的目 的多核苷酸盒。

    在另一个实施例中,本发明涉及分离的或重组的多核苷酸以及其对应 的多肽,其编码大范围核酸酶多肽,所述多肽包含在对应于SEQ ID NO:1 的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ  ID NO:1的位置选自位置16、22、50、56、59、71、81、103、121、153、 185、209、222、246、258、281、308、316、345、346、以及它们的组 合,并且其中所述多肽能够识别和裂解包含SEQ ID NO:2的大范围核酸酶 目标位点。

    在另一个实施例中,本发明涉及编码大范围核酸酶多肽的分离的或重 组的多核苷酸,所述多肽包含在对应于SEQ ID NO:86的位置的氨基酸位置 处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:86的位置选自 位置2、12、16、22、23、36、43、50、56、58、59、72、73、81、86、 91、95、103、113、114、120、121、124、128、129、131、151、153、 200、204、209、232、236、237、246、254、258、267、281、308、311、 312、316、319、334、339、340、342、以及它们的组合,并且其中所述多 肽能够识别和裂解包含SEQ ID NO:85的大范围核酸酶目标位点。

    在另一个实施例中,本发明涉及编码大范围核酸酶多肽的分离的或重 组的多核苷酸,所述多肽包含在对应于SEQ ID NO:270的位置的氨基酸位 置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:270的位置 选自位置16、22、50、71、185、246、258、316、以及它们的组合,并且 其中所述多肽能够识别和裂解包含SEQ ID NO:269的大范围核酸酶目标位 点。

    在另一个实施例中,本发明涉及编码大范围核酸酶多肽的分离的或重 组的多核苷酸,所述多肽包含在对应于SEQ ID NO:329的位置的氨基酸位 置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:329的位置 选自位置12、32、50、56、80、105、124、129、131、153、185、311、 316、318、340、以及它们的组合,并且其中所述多肽能够识别和裂解包含 SEQ ID NO:328的大范围核酸酶目标位点。

    在另一个实施例中,本发明涉及编码大范围核酸酶多肽的分离的或重 组的多核苷酸,所述多肽包含在对应于SEQ ID NO:356的位置的氨基酸位 置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:356的位置 选自位置12、24、36、50、56、62、73、80、124、129、147、182、203、 237、252、311、316、318、340、348、以及它们的组合,并且其中所述多 肽能够识别和裂解包含SEQ ID NO:355的大范围核酸酶目标位点。

    在另一个实施例中,本发明涉及编码大范围核酸酶多肽的分离的或重 组的多核苷酸,所述多肽包含在对应于SEQ ID NO:389的位置的氨基酸位 置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:389的位置 选自位置12、50、56、124、129、131、153、211、237、311、316、和位 置318、以及它们的组合,并且其中所述多肽能够识别和裂解包含SEQ ID  NO:388的大范围核酸酶目标位点。

    在另一个实施例中,本发明涉及编码大范围核酸酶多肽的分离的或重 组的多核苷酸,所述多肽包含在对应于SEQ ID NO:429的位置的氨基酸位 置处具有至少一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:429的位置 选自位置16、22、50、71、185、246、258、316、以及它们的组合,并且 其中所述多肽能够识别和裂解包含SEQ ID NO:423的大范围核酸酶目标位 点。

    附图说明和序列表

    根据以下的详细描述和附图以及序列清单,可以更全面地理解本发 明,以下的详细描述和附图以及序列清单形成本申请的一部分。序列描述 以及所附序列表遵循37 C.F.R.§§1.8211.825示出的专利申请中核苷酸和氨 基酸序列公开的规定。序列描述包含如37 C.F.R.§§1.8211.825中规定的针 对每种氨基酸的三字母代码,其以引用方式并入本文。

    图1提供了I-CreI大范围核酸酶(SEQ ID NO:3)与来自各个物种的相 关的大范围核酸酶(SEQ ID NO:4-13)的氨基酸比对。加框显示了共享同 一性的氨基酸残基。

    图2显示了表示用于测定酵母中大范围核酸酶活性的酵母筛选系统的 图表。对应于酵母Ade2编码序列的最初1000个核苷酸(Ade25’片段)和 酵母Ade2编码序列的最后1011个核苷酸(Ade23’片段)的基因片段被包 括酵母ura3基因(Ura3)和针对I-SceI的大范围核酸酶识别位点的片段分 开。

    图3显示了用于定量大范围核酸酶活性的酵母菌落的数值刻度与相应 的白色分段。由于分段表型是大范围核酸酶活性的定性测量,采用了0-4的 数字打分系统。0分表明没有观察到白色分段(没有大范围核酸酶切割); 4分表明完全白色菌落(识别位点的完全切割);1-3分表明中间白色分段 表型(和中间程度的识别位点切割)。

    图4显示了大范围核酸酶表达质粒pVER8134。

    图5提供了亲本LIG3-4(LIG3-4.pro,SEQ ID NO:1)和LIG3-4大范 围核酸酶变体(表1A,SEQ ID NO:14-38)的氨基酸比对。在图5中列出 的大范围核酸酶的名称对应于表1A中的名称,但包括“.pro”表明这是一 个蛋白比对。

    图6A-C显示了在0、25、50和75分钟,由实时聚合酶链反应 (PCR)的三次重复平均的、亲本LIG3-4和LIG3-4大范围核酸酶变体 (B65=LIG3-4(B65);hit15=LIG3-4(15);hit7=LIG3-4(7))裂解 质粒DNA底物的百分比。在23℃观察到(A)%的裂解。在28℃观察到 (B)%的裂解。在37℃观察到(C)%的裂解。

    图7显示了在50分钟,由实时聚合酶链反应(PCR)的三次重复平均 的、亲本LIG3-4和LIG3-4大范围核酸酶变体(B65=LIG3-4(B65); hit15=LIG3-4(15);hit7=LIG3-4(7))裂解基因组DNA底物的百分 比。在23℃观察到(A)%的裂解。在28℃观察到(B)%的裂解。在37℃ 观察到(C)%的裂解。

    图8A显示了用于确认UBI:moPAT:PinII盒整合至内源性LIG3-4识别 位点的长片段聚合酶链反应(PCR)的方框图。图8B显示了在所述识别位 点发生整合的情况下,在来自四个事件的愈伤组织上长片段聚合酶链反应 (PCR)的结果。图8B-左显示了在HR1侧使用基因组引物(HRR1)和 moPAT引物(mopatR2)的长连接片段聚合酶链反应(PCR);图8B-右显 示了在HR2侧(mopatF2/HR2R2)的长连接片段聚合酶链反应(PCR)。 引物组mopatF2/HR2R2扩增了4kb片段,其跨越从moPAT基因穿过UBI 内含子、UBI启动子和HR2序列至相邻基因组区。引物组HRR1/mopatR2 扩增了2.2kb的片段,其跨越从moPAT基因穿过HR1至相邻基因组区。这 两个长聚合酶链反应(PCR)产物的大小表明所述供体基因盒完美整合至 LIG3-4识别位点。在来自愈伤组织事件之一T0和T1植物中获得了插入序 列。

    图9A-9D提供了亲本MHP77和MHP77大范围核酸酶变体的氨基酸比 对。显示了在与亲本大范围核酸酶MHP77进行比较时,所述大范围核酸酶 变体的氨基酸修饰。A(-)指出变体和亲本大范围核酸酶的氨基酸残基相 同。

    图10A-10C提供了亲本MHP14和MHP14大范围核酸酶变体的氨基酸 比对。显示了在与亲本大范围核酸酶MHP14进行比较时,所述大范围核酸 酶变体的氨基酸修饰。A(-)指出变体和亲本大范围核酸酶的氨基酸残基 相同。

    图11提供了亲本MHP107和MHP107大范围核酸酶变体的氨基酸比 对。显示了在与亲本大范围核酸酶进行比较时,所述大范围核酸酶变体的 氨基酸修饰。A(-)指出变体和亲本大范围核酸酶的氨基酸残基相同。

    图12提供了亲本ZM6.3和ZM6.3大范围核酸酶变体的氨基酸比对。 显示了在与亲本大范围核酸酶进行比较时,所述大范围核酸酶变体的氨基 酸修饰。A(-)指出变体和亲本大范围核酸酶的氨基酸残基相同。

    图13提供了亲本ZM6.22v2和ZM6.22v2大范围核酸酶变体的氨基酸 比对。显示了在与亲本大范围核酸酶进行比较时,所述大范围核酸酶变体 的氨基酸修饰。A(-)指出变体和亲本大范围核酸酶的氨基酸残基相同。

    图14提供了LIG3-4和多个大范围核酸酶的氨基酸比对。显示了和 SEQ ID NO:1不同的氨基酸修饰。A(-)指出大范围核酸酶的氨基酸残基 与LIG3-4大范围核酸酶(SEQ ID NO:1)相同。

    图15 A)显示了一些大范围核酸酶(其包含接头多肽将两个的重新工 程化的I-CreI单体连成单个氨基链)的氨基酸比对。B)显示了一些变体 (MHP14(10)、MHP77(L9-01)和亲本(LIG3-4、MHP14、MHP77) 大范围核酸酶的百分比同一性。

    图16显示了所述大范围核酸酶的结构因子。

    序列

    SEQ ID NO:1是单链LIG3-4大范围核酸酶融合多肽的氨基酸序列。

    SEQ ID NO:2是LIG3-4识别序列的核苷酸序列。

    SEQ ID NO:3是I-CreI大范围核酸酶单体的氨基酸序列。

    SEQ ID NO:4是gi_18654305的氨基酸序列。

    SEQ ID NO:5是gi_108773071的氨基酸序列。

    SEQ ID NO:6是gi_108773352的氨基酸序列。

    SEQ ID NO:7是gi_108796958的氨基酸序列。

    SEQ ID NO:8是gi_12667512的氨基酸序列。

    SEQ ID NO:9是gi_18654311的氨基酸序列。

    SEQ ID NO:10是gi_150406493的氨基酸序列。

    SEQ ID NO:11是gi_110225678的氨基酸序列。

    SEQ ID NO:12是gi_11467050的氨基酸序列。

    SEQ ID NO:13是gi_18654162的氨基酸序列。

    SEQ ID NO:14是LIG3-4大范围核酸酶的氨基酸序列。

    表1A:亲本和大范围核酸酶变体的SEQ ID NO:(NT=核苷酸序列; AA=氨基酸序列)列表。

    SEQ ID NO:39是LIG3-4的植物最优化的核苷酸序列,其包含核定位 信号和内含子。

    SEQ ID NO:66是MN031引物的核苷酸序列。

    SEQ ID NO:67是MN022引物的核苷酸序列。

    SEQ ID NO:68是质粒pVER8134的核苷酸序列。

    SEQ ID NO:69是核定位信号的核苷酸序列。

    SEQ ID NO:70是核定位信号的氨基酸序列。

    SEQ ID NO:71是6X组氨酸标签的氨基酸序列。

    SEQ ID NO:72是玉米中核定位信号的核苷酸序列。

    SEQ ID NO:73是带有核定位信号和内含子的LIG3-4(7)大范围核酸 酶的植物最优化的核苷酸序列。

    SEQ ID NO:74是带有核定位信号和内含子的LIG3-4(15)大范围核酸 酶的植物最优化的核苷酸序列。

    SEQ ID NO:75是带有核定位信号和内含子的LIG3-4(B65)大范围核 酸酶的植物最优化的核苷酸序列。

    SEQ ID NO:76是质粒PHP46961的核苷酸序列。

    SEQ ID NO:77是LIG3-4(HR1)的核苷酸序列。

    SEQ ID NO:78是LIG3-4(HR2)的核苷酸序列。

    SEQ ID NO:79是LIG3-4目标位点qPCR探针的核苷酸序列。

    SEQ ID NO:80是Lig3-4_正向引物的核苷酸序列。

    SEQ ID NO:81是Lig3-4_反向引物的核苷酸序列。

    SEQ ID NO:82是酵母ade2的核苷酸序列。

    SEQ ID NO:83是酵母ade2的核苷酸编码序列。

    SEQ ID NO:84是质粒pHD1327的核苷酸序列。

    SEQ ID NO:85是MHP77识别位点的核苷酸序列。

    SEQ ID NO:86是MHP77大范围核酸酶的氨基酸序列。

    SEQ ID NO:250是MHP77.3大范围核酸酶的氨基酸序列。

    SEQ ID NO:251是MHP77.3(L9-02)大范围核酸酶的氨基酸序列。

    SEQ ID NO:252是MHP77.3(L9-11)大范围核酸酶的氨基酸序列。

    SEQ ID NO:253是MHP77.3(L9-12)大范围核酸酶的氨基酸序列。

    SEQ ID NO:254是MHP77的植物最优化的核苷酸序列,其包含核定位 信号并且不含内含子。

    SEQ ID NO:255是MHP77.3大范围核酸酶MHP77的植物最优化的核 苷酸序列,其包含核定位信号并且不含内含子。

    SEQ ID NO:256是MHP77(L9-02)大范围核酸酶的植物最优化的核 苷酸序列,其包含核定位信号和内含子。

    SEQ ID NO:257是MHP77(L9-11)大范围核酸酶的植物最优化的核 苷酸序列,其包含核定位信号和内含子。

    SEQ ID NO:258是MHP77(L9-12)大范围核酸酶的植物最优化的核 苷酸序列,其包含核定位信号和内含子。

    SEQ ID NO:259是MHP77.3(L9-02)大范围核酸酶的植物最优化的核 苷酸序列,其包含核定位信号和内含子。

    SEQ ID NO:260是MHP77.3(L9-11)大范围核酸酶的植物最优化的核 苷酸序列,其包含核定位信号和内含子。

    SEQ ID NO:261是MHP77.3(L9-12)大范围核酸酶的植物最优化的核 苷酸序列,其包含核定位信号和内含子。

    SEQ ID NO:262是MHP77.3(15)大范围核酸酶的氨基酸序列。

    SEQ ID NO:263是MHP77.3(15)大范围核酸酶的植物最优化的核苷 酸序列,其包含核定位信号和内含子。

    SEQ ID NO:264是MHP77HR1的核苷酸序列。

    SEQ ID NO:265是MHP77HR2的核苷酸序列。

    SEQ ID NO:266是MHP77目标位点qPCR探针的核苷酸序列。

    SEQ ID NO:267是MHP77_正向引物的核苷酸序列。

    SEQ ID NO:268是MHP77_反向引物的核苷酸序列。

    SEQ ID NO:269是MS26识别位点的核苷酸序列。

    SEQ ID NO:270是MS26+大范围核酸酶的氨基酸序列。

    SEQ ID NO:271是MS26++大范围核酸酶的氨基酸序列。

    SEQ ID NO:272是MS26+(7)大范围核酸酶的氨基酸序列。

    SEQ ID NO:273是MS26+(15)大范围核酸酶的氨基酸序列。

    SEQ ID NO:274是MS26+(B65)大范围核酸酶的氨基酸序列。

    SEQ ID NO:275是MS26++(15)大范围核酸酶的氨基酸序列。

    SEQ ID NO:276是MS26+并且没有内含子的植物最优化的核苷酸序 列。

    SEQ ID NO:419是MS26+(7)并且没有内含子的植物最优化的核苷酸 序列。

    SEQ ID NO:277是MS26+(15)并且没有内含子的植物最优化的核苷 酸序列。

    SEQ ID NO:278是MS26+(B65)并且没有内含子的植物最优化的核 苷酸序列。

    SEQ ID NO:279是MS26++并且没有内含子的植物最优化的核苷酸序 列。

    SEQ ID NO:280是MS26++(15)并且没有内含子的植物最优化的核 苷酸序列。

    SEQ ID NO:281是MHP14识别位点的核苷酸序列。

    表1B:亲本和大范围核酸酶变体的SEQ ID NO:(NT=核苷酸序列; AA=氨基酸序列)的列表。

    SEQ ID NO:315是MHP14+(04)大范围核酸酶的氨基酸序列。

    SEQ ID NO:316是MHP14+(06)大范围核酸酶的氨基酸序列。

    SEQ ID NO:317是MHP14+(08)大范围核酸酶的氨基酸序列。

    SEQ ID NO:318是MHP14+(12)大范围核酸酶的氨基酸序列。

    SEQ ID NO:319是MHP14+(14)大范围核酸酶的氨基酸序列。

    SEQ ID NO:320是MHP14+(15)大范围核酸酶的氨基酸序列。

    SEQ ID NO:321是MHP14和内含子的植物最优化的核苷酸序列。

    SEQ ID NO:322是MHP14+(04)和内含子的植物最优化的核苷酸序 列。

    SEQ ID NO:323是MHP14+(06)和内含子的植物最优化的核苷酸序 列。

    SEQ ID NO:324是MHP14+(08)和内含子的植物最优化的核苷酸序 列。

    SEQ ID NO:325是MHP14+(12)和内含子的植物最优化的核苷酸序 列。

    SEQ ID NO:326是MHP14+(14)和内含子的植物最优化的核苷酸序 列。

    SEQ ID NO:327是MHP14+(15)和内含子的植物最优化的核苷酸序 列。

    SEQ ID NO:328是MHP107识别位点的核苷酸序列。

    表1C:亲本和大范围核酸酶变体的SEQ ID NO:(NT=核苷酸序列; AA=氨基酸序列)列表。

    SEQ ID NO:355是ZM6.3识别位点的核苷酸序列。

    表1D:亲本和大范围核酸酶变体的SEQ ID NO:(NT=核苷酸序列; AA=氨基酸序列)列表。

    SEQ ID NO:388是ZM6.22v2识别位点的核苷酸序列。

    表1E:亲本和大范围核酸酶变体的SEQ ID NO:(NT=核苷酸序列; AA=氨基酸序列)列表。

    SEQ ID NO:419是不带内含子的MS26+(7)大范围核酸酶变体的核苷 酸序列。

    SEQ ID NO:420是LIG3-4、MHP14、MHP77的接头多肽的核苷酸序 列。

    SEQ ID NO:421是MHP14(10)的接头多肽的核苷酸序列。

    SEQ ID NO:422是MHP77(L9-01)的接头多肽的核苷酸序列。

    SEQ ID NO:423是大豆基因组中TS21识别位点的核苷酸序列。

    SEQ ID NO:424是大豆基因组中TS14识别位点的核苷酸序列。

    SEQ ID NO:425是带有核定位信号和内含子的TS21大范围核酸酶的植 物最优化的核苷酸序列。

    SEQ ID NO:426是带有核定位信号和内含子的TS21(7)大范围核酸 酶的植物最优化的核苷酸序列。

    SEQ ID NO:427是带有核定位信号和内含子的TS21(15)大范围核酸 酶的植物最优化的核苷酸序列。

    SEQ ID NO:428是带有核定位信号和内含子的TS21(B65)大范围核 酸酶的植物最优化的核苷酸序列。

    SEQ ID NO:429是TS21大范围核酸酶的氨基酸序列。

    SEQ ID NO:430是TS21(7)大范围核酸酶的氨基酸序列。

    SEQ ID NO:431是TS21(15)大范围核酸酶的氨基酸序列。

    SEQ ID NO:432是TS21(B65)大范围核酸酶的氨基酸序列。

    SEQ ID NO:433是带有核定位信号和内含子的TS14大范围核酸酶的植 物最优化的核苷酸序列。

    SEQ ID NO:434是带有核定位信号和内含子的TS14(15)大范围核酸 酶的植物最优化的核苷酸序列。

    SEQ ID NO:435是TS14大范围核酸酶的氨基酸序列。

    SEQ ID NO:436是TS14(15)大范围核酸酶的氨基酸序列。

    具体实施方式

    现将结合附图在下文中更全面地描述本发明,其中示出了本发明的一 些而非全部实施例。实际上,这些发明可以许多不同的形式来体现,并且 不应理解为受本文所示实施例的限制;相反,提供这些实施例以使本公开 满足适用的法律要求。类似的数字在全文中指代类似的元件。

    这些发明所属领域的技术人员应当理解,本文所示发明的许多修改形 式和其他实施例具有前述说明和相关附图中所示教导的有益效果。因此, 应当了解,本发明不受所公开的具体实施例的限制,并且修改形式和其他 实施例也旨在被包括在所附权利要求的范围内。虽然本文采用了具体术 语,但是这些术语仅以一般性和描述性意义使用而不是为了进行限制。

    说明书中提到的所有公布和专利申请指示了本发明适合的本领域技术 人员的水平。所有公布和专利申请在相同程度上全文以引用方式并入本 文,如同每个单独的公布或专利申请被特定地和个别地指示全文以引用方 式并入本文。

    除非上下文另外明确规定,否则如本文和所附权利要求书中所用的单 数形式“一个”、“一种”以及“所述”包括复数涵义。因此,例如,提 及“植物”包括多个此类植物;提及“细胞”包括一个或多个细胞和本领 域技术人员已知的它们的等同物,等等。

    除非另外指明,本文所用的所有技术和科学术语具有与本发明所属领 域普通技术人员一般理解相同的含义。虽然与本文所述的那些方法和材料 相似或等同的任何方法和材料可用于本发明的测试实践,但本文描述了合 适的材料和方法的具体示例。

    在本公开的上下文中使用了若干术语和缩写。提供了如下定义。

    I.综述:

    提供了包含具有大范围核酸酶活性的多核苷酸和多肽的组合物和方 法。另外提供了具有提高的大范围核酸酶活性的组合物和使用方法。还提 供了具有大范围核酸酶序列的核酸构建体、酵母、植物、植物细胞、外植 体、种子和谷物。这些方法和组合物采用的核酸内切酶能够在酵母细胞、 植物、植物细胞或种子的DNA片段内或在基因组内的识别序列处诱导双链 断裂。

    II.组合物

    如本文所用,“分离的”多核苷酸或多肽,或其生物活性部分,是实 质上或基本上不含在天然存在环境中伴随所述多核苷酸或蛋白质(共存) 或与其相互作用的组分。因此,分离的或经纯化的多核苷酸或多肽基本上 不含其他细胞物质、或当通过重组体技术生产时的培养基、或基本上不含 通过化学合成时的化学前体或其他化学物质。最理想地,“分离的”多核 苷酸不含多核苷酸所来源于的生物的基因组DNA中天然地存在于所述多核 苷酸两翼(即,位于所述多核苷酸的5′和3′端)的序列(最理想地蛋白编 码序列)。例如,在不同的实施例中,所述分离的多核苷酸可包含少于多 核苷酸所来源的细胞的基因组DNA中天然地存在于所述多核苷酸两翼约 5kb、4kb、3kb、2kb、1kb、0.5kb、或0.1kb的多核苷酸。基本上不含细胞 物质的多肽包括制备的具有少于约30%、20%、10%、5%或1%(按干重 计)的污染多肽的多肽。当重组生产本发明的多肽或其生物活性部分时, 最佳的培养基提供少于约30%、20%、10%、5%、或1%(按干重计)的化 学前体或非受关注蛋白的化学品。

    如本文所用,当核酸或多肽为人工制成的或工程化得到、或来源于人 工或工程化的蛋白或核酸时,它们是“重组的”。例如,插入载体或任何 其它异源位置,例如重组生物的基因组中,使得它不与通常侧接天然存在 的多核苷酸的核苷酸序列相关联的多核苷酸为重组的多核苷酸。在体外或 体内从重组的多核苷酸表达的多肽是重组多肽的示例。同样地,天然不存 在的多核苷酸序列,例如天然存在的基因的变体为重组序列。

    “亚序列”或“片段”是整条序列的任一部分。

    术语“目标位点”、“目标序列”、“基因组目标位点”和“基因组 目标序列”本文可互换使用,是指在植物细胞或酵母细胞的基因组中的多 核苷酸序列,其包含用于双链断裂诱导剂的识别序列。

    如本文所用,术语“识别序列”是指在植物细胞基因组中被内切核酸 酶诱导双链断裂处的DNA序列。术语“识别序列”、“识别位点”、“内 切核酸酶识别位点”、“大范围核酸酶识别序列”和“大范围核酸酶识别 位点”本文可互换使用。所述识别位点可以为植物基因组中的内源性位 点,或者,所述识别位点可以为对植物异源性的并因此不是基因组中天然 存在的,或与其天然存在的位置相比所述识别位点可见于异源性的基因组 位置。如本文所用,术语“内源性的识别位点”是指对于植物基因组是内 源性的或原生的内切核酸酶识别位点,并且其位于植物基因组中该识别位 点的内源性的或原生的位置。识别位点的长度可以是变化的,并且包括例 如核苷酸长度为至少4、6、8、10、12、14、16、18、19、20、21、22、 23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、 39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、 55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或 更长的识别位点。还有可能所述识别位点可以是回文序列,也就是说,在 一条链上的序列阅读与互补链的相反方向上相同。切口/裂解位点可以在识 别序列内,或切口/裂解位点可以在识别序列之外。在另一个变体中,可在 紧接彼此相对的核苷酸位置进行裂解以产生钝端切口,或者在其他情况 下,切口可以交错排列以产生单链突出端,也被称为“粘性末端”,其可 为5′突出端或3′突出端。

    在一个实施例中,内切核酸酶的识别序列包括玉米的LIG3-4(SEQ ID  NO:2)、MHP77(SEQ ID NO:85)、MS26(SEQ ID NO:269)、MHP14 (SEQ ID NO:281)、MP107(SEQ ID NO:328)、ZM6.3(SEQ ID  NO:355)和/或ZM6.22V2(SEQ ID NO:388)识别位点,和/或大豆的TS21 (SEQ ID NO:423)和/或TS14(SEQ ID NO:424)识别位点。

    识别(序列)的活性变体和片段可包含与给定识别序列至少65%、 70%、75%、80%、81%、82%、83%、84%85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更 高的序列同一性,其中活性变体保持了生物活性并从而能够被内切核酸酶 识别和裂解。

    “人工目标序列”是被导入植物基因组中的目标序列。此类人工目标 序列可与植物基因组中的内源性或原生目标序列序列相同,但位于植物基 因组中的不同位置(即非内源性或原生的位置)。

    术语“内源性目标序列”和“原生目标序列”本文可互换使用,是指 植物基因组内源性或原生的目标序列,并在植物基因组中目标序列的内源 性或原生的位置处。

    “改变的目标序列”是指在与未改变的目标序列进行比较时,包含至 少一种改变的目标序列。此类“改变”包括,例如:(i)替换至少一个核 苷酸,(ii)缺失至少一个核苷酸,(iii)插入至少一个核苷酸,或(iv) (i)-(iii)的任何组合。

    如本文所用术语“双链断裂诱导剂”是指在目标序列中产生双链断裂 的任何核酸酶。在目标序列或其它DNA中产生双链断裂在本文是指“切 割”或“裂解”目标序列或其它DNA。

    “内切核酸酶”是指在多核苷酸链内裂解磷酸二酯键的酶。

    内切核酸酶包括在特定位点裂解DNA而不损坏碱基的限制内切核酸 酶。限制内切核酸酶包括I型、II型、III型和IV型内切核酸酶,其还包括 亚型。在I型和III型系统中,甲基化酶和限制活性同时包含在单个复合物 中。

    I型和III型限制内切核酸酶识别特异性的识别位点,但通常在距离识 别位点的可变位置处(其能够距离识别位点上百碱基对)裂解。在II型系 统中限制活性与任何甲基化酶活性无关,并且裂解通常在识别位点内或与 之接近的特定位点处进行。大多数II型酶切割回文序列,然而IIa型酶识别 非回文识别位点并且在识别位点之外裂解,IIb型酶在识别位点之外的两个 位点切割序列两次,IIs型酶识别非对称识别位点并且在距离识别位点约1- 20个核苷酸的限定距离处的一侧裂解。IV型限制酶靶向甲基化的DNA。 在例如REBASE数据库(网页rebase.neb.com;Roberts等人,(2003) Nucleic Acids Res 31:418-20),Roberts等人,(2003)Nucleic Acids Res 31:1805-12和Belfort等人,(2002)in Mobile DNA II,761-783页,编辑 Craigie等人,(ASM Press,Washington,DC)中对限制酶进行了进一步描 述和分类。

    “工程化的内切核酸酶”是指从其原生形式经过工程化以特异性识别 并且在期望的识别位点中诱导双链断裂的内切核酸酶。因此,工程化的内 切核酸酶可来源于原生的、天然存在的内切核酸酶或可被人工创建或合 成。所述内切核酸酶的修饰可少至一个核苷酸。在一些实施例中,工程化 的内切核酸酶在识别位点内诱导双链断裂,其中所述识别位点不是已被原 生(非工程化的或非修饰的)内切核酸酶所识别的序列。在识别位点或其 它DNA内产生双链断裂在本文是指在识别位点或其它DNA内“切割”或 “裂解”。

    “大范围核酸酶”是指归巢内切核酸酶,其类似于限制内切核酸酶, 在特定识别位点结合并且切割,然而对于大范围核酸酶的识别位点通常更 长,约18bp或更长。在本发明的一些实施例中,已将大范围核酸酶工程化 (或修饰)以切割特异性内源性识别位点,其中所述内源性目标序列在被 工程化的双链断裂诱导剂切割之前不是被原生(非过程化或非修饰的)内 切核酸酶所识别的序列。

    “大范围核酸酶多肽”是指具有大范围核酸酶活性并且因此能够在所 述识别序列中产生双链断裂的多肽。

    基于保守序列基序将大范围核酸酶分成四个家族,这些家族是 LAGLIDADG、GIY-YIG、H-N-H和His-Cys框家族。这些基序参与了金属 离子的配位和磷酸二酯键的水解。HE酶由于其长识别位点以及容忍其 DNA底物中的一些序列多态性而著名。对于大范围核酸酶的命名惯例与其 它限制内切核酸酶的惯例相似。大范围核酸酶也通过前缀F-、I-或PI-来表 征,分别针对由自立式开放阅读框、内含子和内含肽编码的酶。例如,来 自酿酒酵母(Saccharomyces cerevisiae)的内含子-、内含肽-、和独立式基 因编码大范围核酸酶被分别命名为I-SceI、PI-SceI和F-SceII。大范围核酸 酶结构域、结构和功能是已知的,参见例如,Guhan和Muniyappa(2003) Crit Rev Biochem Mol Biol 38:199-248;Lucas等人,(2001)Nucleic Acids  Res 29:960-9;Jurica和Stoddard,(1999)Cell Mol Life Sci 55:1304-26; Stoddard,(2006)Q Rev Biophys 38:49-95;和Moure等人,(2002)Nat  Struct Biol 9:764。在一些示例中,使用了天然存在的变体和/或大范围核酸 酶的工程化的衍生物。修改动力学、辅因子相互作用、表达、最优化条件 和/或识别位点特异性、以及活性筛选的方法是已知的,参见例如,Epinat 等人,(2003)Nucleic Acids Res 31:2952-62;Chevalier等人,(2002) Mol Cell 10:895-905;Gimble等人,(2003)Mol Biol 334:993-1008; Seligman等人,(2002)Nucleic Acids Res 30:3870-9;Sussman等人, (2004)J Mol Biol 342:31-41;Rosen等人,(2006)Nucleic Acids Res 34:4791-800;Chames等人,(2005)Nucleic Acids Res 33:e178;Smith等 人,(2006)Nucleic Acids Res 34:e149;Gruen等人,(2002)Nucleic  Acids Res 30:e29;Chen和Zhao,(2005)Nucleic Acids Res 33:e154; WO2005105989;WO2003078619;WO2006097854;WO2006097853; WO2006097784;和WO2004031346。

    本文可使用任何大范围核酸酶,包括但不限于I-SceI、I-SceII、I- SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-CeuI、I-CeuAIIP、I-CreI、 I-CrepsbIP、I-CrepsbIIP、I-CrepsbIIIP、I-CrepsbIVP、I-TliI、I-PpoI、PI- PspI、F-SceI、F-SceII、F-SuvI、F-TevI、F-TevII、I-AmaI、I-AniI、I- ChuI、I-CmoeI、I-CpaI、I-CpaII、I-CsmI、I-CvuI、I-CvuAIP、I-DdiI、I- DdiII、I-DirI、I-DmoI、I-HmuI、I-HmuII、I-HsNIP、I-LlaI、I-MsoI、I- NaaI、I-NanI、I-NcIIP、I-NgrIP、I-NitI、I-NjaI、I-Nsp236IP、I-PakI、I- PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrIP、I-PobIP、I-PorI、I-PorIIP、I- PbpIP、I-SpBetaIP、I-ScaI、I-SexIP、I-SneIP、I-SpomI、I-SpomCP、I- SpomIP、I-SpomIIP、I-SquIP、I-Ssp6803I、I-SthPhiJP、I-SthphiST3P、I- SthphiSTe3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、I-UarAP、I- UarHGPAIP、I-UarHGPA13P、I-VinIP、I-ZbiIP、PI-MtuI、PI-MtuHIP PI- MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、PI-PkoII、PI-Rma43812IP、PI- SpBetaIP、PI-SceI、PI-TfuI、PI-TfuII、PI-ThyI、PI-TliI、PI-TliII、或它们 的任一活性变体或片段。在具体的实施例中,经工程化的内切核酸酶来源 于I-Cre-I,其具有如SEQ ID NO:15、21或26所示的或其活性变体或片段 的序列。

    TAL效应子核酸酶是序列特异性核酸酶的新类,其能够在植物或其它 生物体的基因组中的特定目标位点处生成双链断裂。TAL效应子核酸酶是 将原生或工程化的转录因子样(TAL)效应子或其功能部件与内切核酸酶 (诸如,例如FokI)融合而成的。独特的模块化的TAL效应子DNA结合 结构域使得蛋白的设计具有潜在的任何给定的DNA识别特异性。因此, TAL效应子核酸酶的DNA结合结构域能被工程化以识别特定DNA目标位 点,并且因此能用于在期望的目标序列处产生双链断裂。参见WO 2010/079430;Morbitzer等人(2010)PNAS 10.1073/pnas.1013133107; Scholze & Boch(2010)Virulence 1:428-432;Christian等人Genetics (2010)186:757-761;Li等人(2010)Nuc.Acids Res.(2010) doi:10.1093/nar/gkq704;和Miller等人(2011)Nature Biotechnology 29:143-148;所有这些文献以引用方式并入本文。

    如本文所用,术语“大范围核酸酶活性”是指大范围核酸酶在期望的 识别序列处切割并且因此保持诱导双链断裂活性的能力。

    大范围核酸酶活性的测定方法是已知的,大体测量总体活性和在包含 所述识别位点的DNA底物上的大范围核酸酶的特异性。例如,使用如本文 所述的酵母筛选测定法测量大范围核酸酶活性。带有功能性Ade2基因的酵 母细胞是白色的,而缺乏Ade2功能的那些由于在腺嘌呤生物合成途径早期 积累代谢物表现出红色的色素沉着,导致如图2和3中显示的带有白色分 段的红色菌落。白色分段的程度,有时延伸至整个菌落,表明了大范围核 酸酶切割活性的量。由于分段表型是大范围核酸酶活性的定性测量,采用 了0-4的数字打分系统。如图3所示,0分表明没有观察到白色分段(没有 大范围核酸酶切割);4分表明完全白色菌落(识别位点的完全切割);1- 3分表明中间白色分段表型(和中间程度的识别位点切割)。如本文所述也 可体外测量大范围核酸酶活性。简而言之,在37℃、28℃和23℃,在包含 所述大范围核酸酶识别位点的质粒DNA上进行时程消化,能通过实时聚合 酶链反应(PCR)测定每个样品的%消化或大范围核酸酶识别位点的损耗 (表明了大范围核酸酶活性)。此外,在植物中能通过测定目标位点 (TS)突变率来测量大范围核酸酶活性。目标位点突变率定义为:(带有 目标位点修饰的事件数量/事件总数)*100%。

    “提高了”或“增大了”活性本文互换使用。在通过本文所述任一活 性测定法进行测定时,“提高了”或“增大了”大范围核酸酶活性包括亲 本大范围核酸酶多肽的活性在任何统计意义上的显著性提高。

    能通过编码内切核酸酶的多核苷酸提供所述大范围核酸酶。相比于天 然存在的多核苷酸序列,此类编码内切核酸酶的多核苷酸可被修饰以替换 在植物中具有更高使用频率的密码子。例如,相比于天然存在的多核苷酸 序列,编码所述大范围核酸酶的多核苷酸可被修饰以替换在玉米或大豆植 物中具有更高使用频率的密码子。

    提供了各种方法和组合物,其采用具有大范围核酸酶活性的多核苷酸 和多肽。

    在一个实施例中,本发明涉及分离的或重组的多核苷酸,其包含编码 大范围核酸酶多肽的核苷酸序列,所述多肽包含:a)在对应于SEQ ID  NO:1的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列,所述 SEQ ID NO:1的位置选自位置2、12、16、22、23、31、36、43、50、56、 58、59、62、71、72、73、80、81、82、86、91、95、98、103、113、 114、116、117、118、121、124、128、129、131、147、151、153、159、 160、161、162、163、164、165、166、167、168、169、170、171、172、 173、174、175、176、177、178、179、180、182、183、184、185、186、 187、188、189、190、191、192、194、195、196、197、200、203、204、 209、222、232、236、237、246、254、258、267、278、281、282、289、 308、311、312、316、318、319、334、339、340、342、345、346、348、 以及它们的组合;或b)具有(a)的任何氨基酸修饰的1、2、3、4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、 39、40、41、42、43或44个的氨基酸序列。

    在另一个实施例中,本发明涉及本公开的分离的或重组的多核苷酸和 其对应的多肽,其中所述核苷酸序列编码大范围核酸酶多肽,其中所述多 肽还包含至少一种本文所述的氨基酸修饰,诸如在图5A-5C、图9A-9D、 图10A-10C、图11、图12、图13、图14A-B、图15中所示的那些以及任 何已知的I-Crel型修饰、以及它们的任何组合。

    还提供了方法和组合物,其采用在与适当对照进行比较时具有提高的 大范围核酸酶活性的多核苷酸和多肽。此类大范围核酸酶多肽包括如SEQ  ID NO:14-38(LIG3-4变体)、SEQ ID NO:87-167(MHP77变体,SEQ ID  NO:251、252、253、262(MHP77.3变体)、SEQ ID NO:272-275(MS26+ 变体),SEQ ID NO:284-298(MHP14变体),SEQ ID NO:315-320 (MHP14+变体)、SEQ ID NO:330-341(MH107变体)、SEQ ID NO:357- 371(ZM6.3变体)、SEQ ID NO:390-403(ZM6.22V2变体)或SEQ ID  NO:430-432的任何之一所示的那些以及它们的生物活性变体。还提供了编 码这些各种多肽及其活性变体的多核苷酸。

    术语蛋白“变体”旨在表示来源于所述蛋白(被称为亲本蛋白)通过 缺失(即,在5′和/或3′末端截短)和/或在亲本蛋白中的一个或多个内部位 点缺失或加入一个或多个氨基酸和/或在亲本蛋白中的一个或多个位点替换 一个或多个氨基酸。如本文所用,“亲本”多核苷酸、多肽(蛋白)可分 别得自人工操纵或来自包含天然存在的核苷酸序列或氨基酸序列的原生蛋 白。涵盖的蛋白变体是有生物活性的,它们能持续具有亲本蛋白的期望的 生物活性,即具有大范围核酸酶活性。此类变体可得自例如遗传多态性或 得自人工操纵。

    术语“大范围核酸酶变体”是指具有大范围核酸酶活性的蛋白变体。 大范围核酸酶变体来源于亲本大范围核酸酶,其中所述大范围核酸酶变体 在与亲本大范围核酸酶多肽进行比较时包含至少一个氨基酸修饰。

    本发明的大范围核酸酶多肽变体包括如SEQ ID NO:14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、 34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、 98、99、100、101、102、103、104、105、106、107、108、109、110、 111、112、113、114、115、116、117、118、119、120、121、122、123、 124、125、126、127、128、129、130、131、132、133、134、135、136、 137、138、139、140、141、142、143、144、145、146、147、148、149、 150、151、152、153、154、155、156、157、158、159、160、161、162、 163、164、165、166、167、251、252、253、262、272、273、274、275、 284、285、286、287、288、289、290、291、292、293、294、295、296、 297、298、315、316、317、318、319、320、330、331、332、334、335、 336、337、338、339、340、341、357、358、359、360、361、362、363、 364、365、366、367、368、369、370、370、371、390、391、392、393、 394、395、396、397、398、399、400、401、402、403、430、431、432或 433的任何之一所示的那些以及它们的生物活性变体和片段。还提供了编码 这些各种多肽及其活性变体和片段的多核苷酸。

    在实例3-23中所鉴定的氨基酸修饰中的任何一个可转移至亲本大范围 核酸酶以创建大范围核酸酶变体。可通过本文所述的方法,针对提高的活 性来筛选这些大范围核酸酶。

    本发明的一个实施例涉及将至少一个氨基酸修饰转移至亲本大范围核 酸酶从而提高所述亲本大范围核酸酶的活性,所述氨基酸修饰选自Y12至 H、G19至S或A、Q50至K或R、F54至I、D56至L、V105至A、E124 至R、V129至A、I132至V或T、D153至M或L、V316至A或I319至 V。另一个实施例涉及将1、2、3、4、5、6、7、8、9、10、11或12个基 酸修饰转移至亲本大范围核酸酶从而提高所述亲本大范围核酸酶的活性, 所述氨基酸修饰选自Y12至H、G19至S或A、Q50至K或R、F54至I、 D56至L、V105至A、E124至R、V129至A、I132至V或T、D153至M 或L、V316至A或I319至V。

    本文所述的修饰中的任何一个可与其它已知的I-CreI型大范围核酸酶 的修饰进行组合。

    如本文所用,相对于编码重组蛋白的重组的多核苷酸,术语“修饰” 是指相对于参考或对照序列,在重组蛋白序列中一个氨基酸残基的任一插 入、缺失或替换。

    “变体”旨在表示基本上类似的序列。对于多核苷酸,保守变体包括 那些因为遗传密码的简并性、编码本发明的大范围核酸酶多肽之一的氨基 酸序列的序列。诸如这些天然存在的变体可以使用熟知的分子生物学技术 (例如使用如下文所述的聚合酶链反应(PCR)、和杂交技术)进行鉴 定。变体多核苷酸还包括合成来源的多核苷酸,诸如例如通过使用定点诱 变或基因合成产生的那些(多核苷酸),但其仍然编码大范围核酸酶多 肽。

    还提供了大范围核酸酶(即大范围核酸酶变体)的生物活性变体。大 范围核酸酶变体是大范围核酸酶多肽的生物活性变体(以及编码相同(变 体)的多核苷酸),与对照大范围核酸酶的多肽具有至少约80%、81%、 82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、95.5%、95.7%、95.9%、96%、96.3%、96.5%、 96.9%、97%、97.3%、97.5%、97.9%、98%、98.3%、98.5%、98.9%、 99%、99.3%、99.5%、99.6%或更高的序列同一性,其中所述活性变体保持 了在期望的识别位点处切割的能力。例如,本文所述的大范围核酸酶变体 的任一个可以从亲本内切核酸酶序列进行修饰,并且设计来在所述亲本大 范围核酸酶的相同的识别位点处进行识别和诱导双链断裂。因此在一些实 施例中,所述大范围核酸酶变体在与亲本大范围核酸酶进行比较时包含至 少一个氨基酸修饰,并且具有在与对应的亲本大范围核酸酶识别序列相同 的识别序列处诱导双链断裂的特异性。

    “对照大范围核酸酶”或“参考大范围核酸酶”可互换使用,是指与 大范围核酸酶进行比较的任一大范围核酸酶。对照大范围核酸酶可包括但 不限于亲本或对应的大范围核酸酶或任何野生型I-Crel型大范围核酸酶。

    当聚合物的给定单体组分(氨基酸残基、结合的核苷酸等)的位置对 应于所选择的参考多肽或多核苷酸中相同残基位置时,氨基酸或核苷酸聚 合物的编号,诸如本发明的大范围核酸酶的任何之一,对应于所选择的氨 基酸聚合物或核酸的编号。

    还提供了大范围核酸酶多肽的生物活性变体(以及编码相同(变体) 的多核苷酸),其与SEQ ID NO:14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、 87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、 102、103、104、105、106、107、108、109、110、111、112、113、114、 115、116、117、118、119、120、121、122、123、124、125、126、127、 128、129、130、131、132、133、134、135、136、137、138、139、140、 141、142、143、144、145、146、147、148、149、150、151、152、153、 154、155、156、157、158、159、160、161、162、163、164、165、166、 167、251、252、253、262、272、273、274、275、284、285、286、287、 288、289、290、291、292、293、294、295、296、297、298、315、316、 317、318、319、320、330、331、332、334、335、336、337、338、339、 340、341、357、358、359、360、361、362、363、364、365、366、367、 368、369、370、370、371、390、391、392、393、394、395、396、397、 398、399、400、401、402、403、430、431、432或433或参考任何通过序 列比对确定的本文所公开的大范围核酸酶多肽的任何之一的多肽具有至少 约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、95.5%、95.7%、95.9%、96%、96.3%、 96.5%、96.9%、97%、97.3%、97.5%、97.9%、98%、98.3%、98.5%、 98.9%、99%、99.3%、99.5%、99.6%或更高的序列同一性。

    在一个实施例中本发明的大范围核酸酶变体包含接头多肽,其中所述 接头多肽包括:a)SEQ ID NO:420;b)SEQ ID NO:421;c)SEQ ID  NO:422;或d)由在对应于SEQ ID NO:1的位置156至193的位置处的任 何可能的氨基酸组成的氨基酸序列。还应当理解这些接头序列可被同时连 接I-Cre型单体的其他接头序列所替换,而仍使得单个大范围核酸酶能在目 标序列处提供双链断裂。

    如本文所用,“目的基因组区”是期望用于导入目的多核苷酸或目的 性状的植物基因组中的染色体片段。目的基因组区可包括,例如,一个或 多个目的多核苷酸。一般来讲,本发明的目的基因组区包括0-15cM(厘 摩)的染色体片段。

    如本文所用,在目的基因组区内的“目的多核苷酸”是所述目的基因 组区的任一编码和/或非编码部分,包括但不限于转基因、原生基因、突变 基因以及遗传标记,诸如,例如单核苷酸多态性(SNP)和简单序列重复 (SSR)标记。

    如本文所用,“物理连接的”、“物理连锁的”、和“遗传连锁的” 用于指相同DNA分子或染色体部分的任何两个或更多个基因、转基因、原 生基因、突变基因、改变、目标位点、标记等。

    序列比较

    以下术语被用于描述在两种或更多种多核苷酸或多肽之间的序列关 系:(a)“参考序列”,(b)“比对窗口”,(c)“序列同一性”,和 (d)“序列同一性百分比”。

    (a)如本文所用,“参考序列”是用作序列比对基准的定义序列。参 考序列可以是指定序列的一部分或全部;例如,全长cDNA或基 因序列,或全长cDNA或基因序列或蛋白序列的片段。

    (b)如本文所用,“比对窗口”比较参考序列和多肽序列的连续的指 定片段,其中在所述比对窗口中的多肽序列与参考序列(不包含 插入或缺失)相比可以包含插入或缺失(即间隙),以获得两段 多肽之间的最大匹配。一般来讲,比对窗口的长度为至少5、 10、15、或20个邻接氨基酸,或可为30、40、50、100个或者更 长。本领域的技术人员懂得为了避免由于在多肽序列中包含空位 导致的它与参考序列的高度相似,通常导入空位罚分并从匹配数 目中减去空位罚分。

    用于比对的序列比对方法是本领域熟知的。因此,能使用数学算法测 定任意两个序列之间的序列同一性百分比。此类数学算法的非限制性实例 是Myers和Miller(1988)CABIOS 4:11-17的算法;Smith等人(1981) Adv.Appl.Math.2:482的局部比对算法;Needleman和Wunsch(1970)J. Mol.Biol.48:443-453的全局比对算法;Pearson和Lipman(1988)Proc. Natl.Acad.Sci.85:2444-2448的局部搜寻比对方法;Karlin和Altschul (1990)Proc.Natl.Acad.Sci.USA 872264的算法,由Karlin和Altschul改 进(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877。能利用计算机实施这些 数学算法,以比对序列、测定序列同一性。此类具体实施包括但不限于: 在PC/Gene程序中的CLUSTAL(可得自Intelligenetics,Mountain View, California);ALIGN程序(版本2.0)和GCG Wisconsin Genetics Software  Package,版本10(可自Accelrys Inc.,9685Scranton Road,San Diego, California,USA获得)中的GAP、BESTFIT、BLAST、FASTA和 TFASTA。能够使用默认参数进行使用这些程序的比对。以下文献很好地描 述了CLUSTAL程序:Higgins等人(1988)Gene 73:237-244(1988); Higgins等人(1989)CABIOS 5:151-153;Corpet等人(1988)Nucleic  Acids Res.16:10881-90;Huang等人(1992)CABIOS 8:155-65;以及 Pearson等人(1994)Meth.Mol.Biol.24:307-331。ALIGN程序基于Myers 和Miller(1988,同上)的算法。当比对氨基酸序列时,PAM120权重残基 表、空位长度罚分12、以及空位罚分4能与ALIGN程序一起使用。 Altschul等人(1990)J.Mol.Biol.215:403的BLAST程序基于Karlin和 Altschul的算法(1990,同上)。可使用BLASTN程序进行BLAST核苷酸 搜索,得分=100,字长=12,以获取与编码本发明的蛋白质的核苷酸序列 同源的核苷酸序列。可使用BLASTX程序进行BLAST搜索,得分=50,字 长=3,以获取与本发明的蛋白或多肽多肽同源的氨基酸序列。可使用默认 参数进行BLASTP蛋白搜索。参见blast.ncbi.nlm.nih.gov/Blast.cgi。

    可使用LASARGENE生物信息学计算套件(DNASTAR Inc.,Madison, WI)的Megalign程序或使用Vector生物信息学计算套件(Invitrogen, Carlsbad,CA)的AlignX程序进行序列比对和相似度百分比计算。用带默 认参数(空位罚分=10,空位长度罚分=10)的Clustal比对方法(Higgins和 Sharp,CABIOS 5:151-153(1989))进行序列的多重比对。用Clustal方法 进行成对比对和蛋白质序列的百分比同一性计算的默认参数为 KTUPLE=1、空位罚分=3、窗口=5和DIAGONALS SAVED=5。就核酸而 言,这些参数为空位罚分=10,空位长度罚分=10,KTUPLE=2,空位罚分 =5,窗口=4,和DIAGONALS SAVED=4。氨基酸或核苷酸序列的“主要 部分”包含足够的多肽的氨基酸序列或基因的核苷酸序列以提供该多肽或 基因的推定鉴定,所述序列可由本领域技术人员来人工评估,或使用计算 机自动化的序列比较和鉴定工具进行评估,所述工具使用算法如BLAST (Altschul,S.F.等人,J.Mol.Biol.215:403-410(1993))和Gapped Blast (Altschul,S.F.等人,Nucleic Acids Res.25:3389-3402(1997))。BLASTN 是指针对核苷酸序列数据库比较核苷酸查询序列的BLAST程序。

    “基因”是指能够表达特定蛋白质的核酸片段,其包括编码序列前的 调控序列(5′非编码序列)和编码序列后的调控序列(3′非编码序列)。 “天然基因”指自然状态下与其自身的调控序列一起的基因。“嵌合基 因”或“重组表达构建体”(可互换使用)是指非原生基因的任何基因, 其包含非天然同时存在的调控和编码序列。因此,嵌合基因可包含源自不 同来源的调控序列和编码序列,或者源自相同来源、但排列方式与天然存 在的排列方式不同的调控序列和编码序列。“内源性基因”指在生物体基 因组中处于其天然位置的天然基因。“外来基因”是指正常情况下不存在 于宿主生物中的基因,它通过基因转移导入宿主生物内。外来基因可以包 含插入到非天然生物体内的天然基因或嵌合基因。“转基因”是已通过转 化方法导入基因组内的基因。

    “编码序列”指编码特定氨基酸序列的DNA序列。“调控序列”指位 于编码序列的上游(5′非编码序列)、中间或下游(3′非编码序列),并且 影响相关编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。调 控序列可包括但不限于启动子、翻译前导序列、内含子和多腺苷酸化识别 序列。

    “密码子简并性”指允许核苷酸序列在不影响所编码的多肽的氨基酸 序列的情况下发生变化的遗传密码的趋异度。因此,本发明涉及包含编码 本文示出的氨基酸序列的全部或主要部分的核苷酸序列的任何核酸片段。 技术人员非常了解特定宿主细胞在使用核苷酸密码子来确定给定氨基酸时 所表现出的“密码子偏好性”。因此,当合成核酸片段用于提高宿主细胞 中的表达时,希望设计该核酸片段使得其密码子使用频率接近宿主细胞使 用的优选密码子的频率。

    如本文所用,涉及两种多核苷酸或多肽序列时的“序列同一性”或 “同一性”是指两序列中的残基当在指定比较窗口中比对最大匹配时是相 同的。已经认识到当序列同一性百分比用于蛋白质时,不同的残基位置常 常存在保守氨基酸取代的差异,其中氨基酸残基被取代为具有相似化学性 质(例如电荷或疏水性)的其他氨基酸残基。当序列出现保守取代差异 时,可上调序列同一性百分比进行纠正以保持取代的保守性质。存在此类 保守取代差异的序列被称为具有“序列相似性”或“相似性”。进行此类 调整的方法为本领域的技术人员所熟知。通常这涉及给一个保守取代评分 为部分而不是完全错配,因此提高序列同一性百分比。因此例如其中一个 相同氨基酸得分为1,而非保守取代得分为零,保守取代得分介于零和1之 间。例如在程序PC/GENE(Intelligenetics,Mountain View,California)中 进行保守取代的得分计算。

    如本文所用,“序列同一性百分比”是指通过在比较窗口中比较两个 比对序列而测定的值,其中比较窗口中的多核苷酸或多肽序列部分与参考 序列(参考序列不包括添加或删除)相比可包括添加或删除(即间隙)以 达到两序列的最佳比对效果。所述百分比的计算方法是,统计相同的核酸 碱基或氨基酸残基在两段序列中同时出现的位置的数量以得到匹配位置 数,将此匹配位置数除以比对窗口中的总位置数,再将结果乘以100,从而 得到序列同一性百分比。

    多核苷酸构建体

    本文提供了包含所述大范围核酸酶或其任一活性变体或片段的多核苷 酸或核酸分子。本文可互换使用术语“多核苷酸”、“多核苷酸序列”、 “核酸序列”和“核酸片段”。这些术语涵盖核苷酸序及类似的范围。术 语“多核苷酸”的使用并非旨在将本发明限制为包含DNA的多核苷酸。本 领域的一般技术人员将认识到,多核苷酸可包括核糖核苷酸以及核糖核苷 酸和脱氧核糖核苷酸的组合。此类脱氧核苷酸和核糖核苷酸包括天然存在 的分子和合成类似物。本发明所述多核苷酸也涵盖所有形式的序列,包括 但不限于单链形式、双链形式、发夹结构、茎环结构等。

    还提供了包含大范围核酸酶变体的重组的多核苷酸。术语“重组的多 核苷酸”、“重组核苷酸”、“重组DNA”和“重组DNA构建体”本文 互换使用。重组构建体包含人工的或异源的核酸序列的组合例如非天然共 存的调控和编码序列。例如,转移盒可包含限制位点和目的异源多核苷 酸。在其它实施例中,重组构建体可包含来源于不同来源的调控序列和编 码序列,或来源于相同来源但以不同于天然存在的方式排列的调控序列和 编码序列。此类构建体可独自使用或与载体组合使用。如果使用载体,则 载体的选择取决于用以转化宿主细胞的方法,该宿主细胞是本领域的技术 人员所熟知的。例如可以使用质粒载体。技术人员熟知为了成功地转化、 筛选和繁殖包括本文提供的任何分离的核酸片段的宿主细胞,必须存在于 载体上的遗传因子。技术人员还将认识到,不同的独立转化事件将导致不 同水平和模式的表达(Jones等人,EMBO J.4:2411-2418(1985);De  Almeida等人,Mol.Gen.Genetics 218:78-86(1989)),因此为了获得显 示期望的表达水平和模式的细胞系必须筛选多个事件。这种筛选可通过 DNA的Southern印迹分析、mRNA表达的Northern印迹分析、蛋白表达的 免疫印迹分析或表型分析等完成。

    在表达盒中可提供本文所公开的大范围核酸酶多核苷酸用于在目的植 物中表达。所述盒可包括5′和3′调控序列,其可操作地连接至大范围核酸 酶多核苷酸或其活性变体或片段。“可操作地连接”旨在表示两个或更多 个元件之间的功能性连接。例如,目的多核苷酸和调控序列(即一个启动 子)之间的可操作的连接为允许该目的多核苷酸的表达的功能性连接。可 操作地连接的元件可以是连续的或不连续的。当用于指两个蛋白质编码区 的连接时,“可操作地连接”意指所述编码区处于同一阅读框。所述盒可 附加地包含至少一个将被转化到生物体中的附加基因。作为另外一种选 择,能通过多个表达盒提供附加基因。这样的表达框具有多个限制性位点 和/或重组位点,用以将大范围核酸酶多核苷酸或其活性变体或片段插入至 使其处于所述调控区的转录调控之下的位置。所述表达盒可附加地包含选 择性标记基因。

    所述表达盒可包括在转录的5′-3′方向中,转录和翻译起始区(即启动 子)、大范围核酸酶多核苷酸或其活性变体或片段、以及在植物中起作用 的转录和翻译终止区(即终止区)。所述调控区(即,启动子、转录调控 区和翻译终止区)和/或大范围核酸酶多核苷酸或其活性变体或片段可以对 于宿主细胞或彼此是原生的/类似的。另选的,所述调控区和/或大范围核酸 酶多核苷酸或其活性变体或片段可以对于对于宿主细胞或彼此是异源的。

    本文在序列方面所用的“异源”是指,源自外来物种的序列,或者, 如果源自相同物种,则为通过蓄意的人为干预而从其天然形式在组成和/或 基因组基因座方面受到充分修饰的序列。例如,可操作地连接至异源多核 苷酸的一个启动子所来自的物种,不同于所述多核苷酸所来源自的物种; 或者,如果二者来自相同的/类似的物种,则二者之一或二者均为从其原始 形式和/或基因组基因座经过充分修饰的,或者所述启动子并非针对可操作 地连接的多核苷酸的天然启动子。

    虽然使用异源启动子表达所述序列是最佳的,也可以使用原生的启动 子序列。此类构建体可改变植物或植物细胞中大范围核酸酶多核苷酸的表 达水平。因此,可改变所述植物或植物细胞的表型。

    所述终止区可以与转录起始区是原生的,可以与可操作地链接的大范 围核酸酶多核苷酸或其活性变体或片段是原生的,可以与植物宿主是原生 的,或可来源对于所述启动子、所述大范围核酸酶多核苷酸或其活性片段 或变体、或其任何组合是另一个源(即,外源的或异源的)。使用方便的 终止区得自根癌农杆菌(A.tumefaciens)的Ti质粒,诸如章鱼碱合成酶和 胭脂碱合成酶终止区。还可参见Guerineau等人(1991)Mol.Gen.Genet. 262:141-144;Proudfoot(1991)Cell 64:671-674;Sanfacon等人 (1991)Genes Dev.5:141-149;Mogen等人(1990)Plant Cell 2:1261- 1272;Munroe等人(1990)Gene 91:151-158;Ballas等人(1989) Nucleic Acids Res.17:7891-7903;以及Joshi等人(1987)Nucleic Acids Res. 15:9627-9639。

    在适当情况下,可对多核苷酸进行优化以提高其在转化过的植物中的 表达。即,能够使用植物优选的密码子合成多核苷酸用于改善表达。参见 例如,Campbell和Gowri(1990)Plant Physiol.92:1-11针对宿主优选的密 码子使用的讨论。本领域有合成植物优选基因的方法可用。参见例如,美 国专利5,380,831和5,436,391,以及Murray等人(1989)Nucleic Acids Res. 17:477-498,以引用方式并入本文。

    在细胞宿主中促进基因表达的附加序列的修改形式是已知的。这些序 列包括消除编码伪聚腺苷酸化信号的序列、外显子-内含子接合位点信号的 序列、转座子样重复序列、和其他此类对基因表达不利的特征明显的序 列。就一个给定的细胞宿主而言,可以将所述序列的G-C含量调节至平均 水平,所述平均水平通过参考宿主细胞中表达的已知基因进行计算。当可 能的时候,修饰所述序列以避免经推测可能发生的mRNA发夹二级结构。

    所述表达盒可附加地包含5′前导序列。此类前导序列能够促进翻译。 翻译前导序列是本领域已知的,包括:小核糖核酸病毒前导序列,例如 EMCV前导序列(脑心肌炎5′非编码区)(Elroy-Stein等人(1989)Proc. Natl.Acad.Sci.USA 86:6126-6130);马铃薯Y病毒前导序列,例如,TEV 前导序列(烟草蚀纹病毒)(Gallie等人(1995)Gene 165(2):233- 238)、MDMV前导序列(玉米矮小花叶病毒)(Virology 154:9-20)、以 及人免疫球蛋白重链结合蛋白(BiP)(Macejak等人(1991)Nature 353: 90-94);非翻译前导序列,来自苜蓿花叶病毒的外壳蛋白mRNA(AMV  RNA 4)(Jobling等人(1987)Nature 325:622-625);烟草花叶病毒前 导序列(TMV)(Gallie等人(1989)in Molecular Biology of RNA,ed.Cech (Liss,New York),pp.237-256);和玉米褪绿斑驳病毒前导序列 (MCMV)(Lommel等人(1991)Virology81:382-385。还可参见Della- Cioppa等人(1987)Plant Physiol.84:965-968。

    在制备表达盒的过程中,可操作多个DNA片段以在正确方向上,以 及,如果适当的话,在正确阅读框中提供DNA序列。为了这一目的,可使 用衔接子或接头以接合DNA片段,或者使用其他操作方法提供方便的限制 位点以移除冗余DNA、移除限制位点等。为了这一目的,可使用体外诱 变、引物修复、限制性酶切、退火、再取代,例如转换和颠换。

    可使用多个启动子表达本文所公开的各种大范围核酸酶序列,包括目 的多核苷酸序列的原生启动子。可基于期望结果选择启动子。此类启动子 包括,例如,针对在植物中表达的组成型、组织优选的或其他启动子。

    组成型启动子包括例如,Rsyn7启动子和在WO 99/43838和美国专利 6,072,050中公开的其他组成型启动子的核心启动子;核心CaMV 35S启动 子(Odell等人(1985)Nature 313:810-812);稻肌动蛋白启动子 (McElroy等人(1990)Plant Cell 2:163-171);泛素启动子(Christensen 等人(1989)Plant Mol.Biol.12:619-632和Christensen等人(1992)Plant  Mol.Biol.,18:675-689);pEMU(Last等人(1991)Theor.Appl.Genet. 81:581-588);MAS(Velten等人(1984)EMBO J.3:2723-2730);ALS 启动子(美国专利5,659,026)等。其它组成型启动子包括例如,美国专利 5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680; 5,268,463;5,608,142;和6,177,611中的讨论的那些(启动子)。

    组织优选的启动子可用于靶向增强在特定植物组织内的大范围核酸酶 的表达。组织优先的启动子包括在Yamamoto等人.(1997)Plant J.12 (2):255-265;Kawamata等人(1997)Plant Cell Physlot.38(7):792- 803;Hansen等人(1997)Mol.Gen Genet.254(3):337-343;Russell等 人(1997)Transgenic Res.6(2):157-168;Rinehart等人(1996)Plant  Physiol.112(3):1331-1341;Van Camp等人(1996)Plant Physiol.112 (2):525-535;Canevascini等人(1996)Plant Physiol.112(2):513- 524;Yamamoto等人(1994)Plant Cell Physiol.35(5):773-778;Lam (1994)Results Probl.Cell Differ.20:181-196;Orozco等人(1993)Plant  Mol Biol.23(6):1129-1138;Matsuoka等人(1993)Proc Natl.Acad.Sci. USA 90(20):9586-9590;以及Guevara-Garcia等人(1993)Plant J.4 (3):495-505中描述的那些。如果需要的话,可修饰这样的启动子以进 行弱表达。

    叶优选的启动子是本领域已知的。参见例如,Yamamoto等人(1997) Plant J.12(2):255-265;Kwon等人(1994)Plant Physiol.105:357-67; Yamamoto等人(1994)Plant Cell Physiol.35(5):773-778;Gotor等人 (1993)Plant J.3:509-18;Orozco等人(1993)Plant Mol.Biol.23 (6):1129-1138;以及Matsuoka等人(1993)Proc.Natl.Acad.Sci.USA 90(20):9586-9590。

    可使用合成启动子来表达大范围核酸酶序列或其生物活性变体和片 段。

    表达盒也可包含选择性标记基因,用于选择转化过的细胞。利用选择 性标记基因以选择转化过的细胞或组织。标记基因包括编码抗生素抗性的基 因,诸如那些编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶 (HPT)的基因,以及赋予除草化合物抗性的基因,除草化合物诸如草甘 膦、草胺磷铵、溴苯腈、磺脲类药物、麦草畏、和2,4-二氯苯氧乙酸(2,4- D)。附加的可选择的标记包括表型标记诸如β-半乳糖苷酶,和荧光蛋白诸 如绿色荧光蛋白(GFP)(Su等人(2004)BiotechnolBioeng 85:610-9和 Fetter等人(2004)Plant Cell 16:215-28)、蓝绿色荧光蛋白(CYP) (Bolte等人(2004)J.Cell Science 117:943-54和Kato等人(2002)Plant  Physiol 129:913-42)、以及黄色荧光蛋白(来自Evrogen的PhiYFPTM,参 见Bolte等人(2004)J.Cell Science 117:943-54)。关于其他选择性标 记,一般参见Yarranton(1992)Curr.Opin.Biotech.3:506-511; Christopherson等人(1992)Proc.Natl.Acad.Sci.USA 89:6314-6318;Yao 等人(1992)Cell 71:63-72;Reznikoff(1992)Mol.Microbiol.6:2419- 2422;Barkley等人(1980)The Operon,177-220页;Hu等人(1987)Cell  48:555-566;Brown等人(1987)Cell 49:603-612;Figge等人(1988) Cell 52:713-722;Deuschle等人(1989)Proc.Natl.Acad.Aci.USA 86: 5400-5404;Fuerst等人(1989)Proc.Natl.Acad.Sci.USA 86:2549-2553; Deuschle等人(1990)Science 248:480-483;Gossen(1993)博士学位论 文,University of Heidelberg;Reines等人(1993)Proc.Natl.Acad.Sci.USA  90:1917-1921;Labow等人(1990)Mol.Cell.Biol.10:3343-3356; Zambretti等人(1992)Proc.Natl.Acad.Sci.USA 89:3952-3956;Baim等人 (1991)Proc.Natl.Acad.Sci.USA 88:5072-5076;Wyborski等人(1991) Nucleic Acids Res.19:4647-4653;Hillenand-Wissman(1989)Topics Mol. Struc.Biol.10:143-162;Degenkolb等人(1991)Antimicrob.Agents  Chemother.35:1591-1595;Kleinschnidt等人(1988)Biochemistry 27: 1094-1104;Bonin(1993)博士学位论文,University of Heidelberg;Gossen 等人(1992)Proc.Natl.Acad.Sci.USA 89:5547-5551;Oliva等人(1992) Antimicrob.Agents Chemother.36:913-919;Hlavka等人(1985)Handbook  of Experimental Pharmacology,第78卷(Springer-Verlag,Berlin);Gill等 人(1988)Nature 334:721-724。此类公开以引用方式并入本文。上文的选 择性标记基因列表并不意味是限制性的。本发明能使用任何选择性标记基 因。

    导入的方法

    可通过任何本领域已知的方法导入所述大范围核酸酶。例如,提供了 在其基因组中具有所述识别位点的细胞、酵母或植物。所述大范围核酸酶 可以为瞬时表达的或所述多肽本身可以为直接提供给细胞的。另选地,能 够表达所述大范围核酸酶的核苷酸序列可以稳定地整合进植物的基因组。 在对应的识别位点和所述大范围核酸酶存在下,可将供体DNA插入至被转 化的植物基因组。另选地,可通过将转化的植物有性杂交将不同的组分集 合在一起。因此编码大范围核酸酶和/或目标位点的序列可彼此有性杂交以 允许该系统的每个组分存在于单个植物中。所述大范围核酸酶可在组成型 或诱导型启动子的控制下。此类目的启动子在本文其它地方进一步详细讨 论。

    可使用各种方法将目的序列,诸如本发明的大范围核酸酶的任一个, 导入植物或植物部分。“导入”旨在表示将多核苷酸或多肽呈现至植物、 植物细胞或植物部分的方式使得所述序列进入到植物细胞的内部。本发明 的方法不依赖于将序列导入植物或植物部分的特定方法,只要使多核苷酸 或多肽进入植物的至少一个细胞的内部即可。用于将核苷酸或多肽导入植 物的方法是本领域已知的,包括但不限于稳定转化方法、瞬时转化方法、 和病毒介导的方法。

    “稳定转化”旨在表示将核苷酸构建体导入植物并整合进植物基因组 中,并且能够由其后代继承。“瞬时转化”旨在表示多核苷酸被引入植物 并且不整合进该植物的基因组中或者多肽被引入植物中。

    转化规程以及用于将多肽或多核苷酸序列导入植物内的规程可以根据 被作为转化目标的植物或植物细胞的类型,例如单子叶植物或双子叶植物 而改变。将多肽和多核苷酸导入植物细胞的合适方法包括显微注射 (Crossway等人,(1986)Biotechniques 4:320-334)、电穿孔(Riggs等 人(1986)Proc.Natl.Acad.Sci.USA 83:5602-5606,农杆菌属菌介导的转化 (美国专利5,563,055和美国专利5,981,840),直接基因转移(Paszkowski 等人.(1984)EMBO J.3:2717-2722)、以及微粒加速(参见例如,美国 专利4,945,050;美国专利5,879,918;美国专利5,886,244;和5,932,782; Tomes等人,(1995)Plant Cell,Tissue,and Organ Culture:Fundamental  Methods,ed.Gamborg和Phillips(Springer-Verlag,Berlin);McCabe等人, (1988)Biotechnology 6:923-926);和Lecl transformation(WO  00/28058)。也参见Weissinger等人(1988)Ann.Rev.Genet.22:421- 477;Sanford等人,(1987)Particulate Science and Technology 5:27-37 (洋葱);Christou等人,(1988)Plant Physiol.87:671-674(大豆); McCabe等人,(1988)Bio/Technology 6:923-926(大豆);Finer和 McMullen(1991)In Vitro Cell Dev.Biol.27P:175-182(大豆);Singh等 人,(1998)Theor.Appl.Genet.96:319-324(大豆);Datta等人, (1990)Biotechnology 8:736-740(水稻);Klein等人,(1988)Proc. Natl.Acad.Sci.USA 85:4305-4309(玉米);Klein等人,(1988) Biotechnology 6:559-563(玉米);美国专利5,240,855;5,322,783;和 5,324,646;Klein等人,(1988)Plant Physiol.91:440-444(玉米); Fromm等人,(1990)Biotechnology 8:833-839(玉米);Hooykaas-Van  Slogteren等人,(1984)Nature(London)311:763-764;美国专利 5,736,369(谷物);Bytebier等人,(1987)Proc.Natl.Acad.Sci.USA  84:5345-5349(百合科(Liliaceae));De Wet等人,(1985)The  Experimental Manipulation of Ovule Tissues,编辑Chapman等人, (Longman,New York),第197-209页(花粉);Kaeppler等人, (1990)Plant Cell Reports 9:415-418以及Kaeppler等人(1992)Theor. Appl.Genet.84:560-566(颈须介导的转化);D′Halluin等人,(1992) Plant Cell 4:1495-1505(电穿孔);Li等人,(1993)Plant Cell Reports  12:250-255以及Christou和Ford(1995)Annals of Botany 75:407-413 (水稻);Osjoda等人(1996)Nature Biotechnology 14:745-750(经由根 癌农杆菌(Agrobacterium tumefaciens)的玉米);所有这些文献以引用方 式并入本文。

    在具体的实施例中,可使用多种瞬时转化方法将所述大范围核酸酶序 列或其活性变体或片段提供至酵母细胞或植物。此类瞬时转化方法包括但 不限于将大范围核酸酶蛋白或其活性变体以及片段直接导入酵母细胞或植 物。此类方法包括例如显微注射或微粒轰击法。参见例如Crossway等人 (1986)Mol Gen.Genet.202:179-185;Nomura等人(1986)Plant Sci. 44:53-58;Hepler等人(1994)Proc.Natl.Acad.Sci.91:2176-2180和Hush 等人(1994)The Journal of Cell Science 107:775-784,所有文献以引用方 式并入本文。

    在其它实施例中,可通过将植物与病毒或病毒核酸接触操作将本发明 的多核苷酸导入酵母细胞或植物。一般来讲,这样的方法包括将本发明的 核苷酸构建体掺入DNA或RNA分子内。已经认识到可以初始合成大范围 核酸酶序列作为病毒的多聚蛋白的一部分,其随后可通过体内或体外蛋白 水解进行处理以产生期望的重组蛋白。此外,已经认识到本发明的启动子 也包括用于病毒RNA聚合酶转录的启动子。涉及病毒DNA或RNA分子的 用于将多核苷酸导入植物内并且表达其中编码的蛋白的方法是本领域已知 的。参见例如美国专利5,889,191、5,889,190、5,866,785、5,589,367、 5,316,931、以及Porta等人(1996)Molecular Biotechnology5:209-221; 该参考文献以引用方式并入本文。

    用于在植物基因组的特定位置定向插入多核苷酸的方法是本领域中已 知的。在一个实施方案中,多核苷酸在期望的基因组位置的插入利用位点 特异性重组系统实现。参见例如WO99/25821、WO99/25854、 WO99/25840、WO99/25855、和WO99/25853,它们均以引用方式并入本 文。简而言之,本发明的多核苷酸被包含在转移盒中,其侧翼与两个非重 组产生的重组位点相连。所述转移盒被导入植物中,所述植物的基因组中 已稳定地掺入了一个目标位点,所述目标位点的两翼是对应于转移盒的所 述位点的两个非重组产生的重组位点。提供了适当的重组酶,并且所述转 移盒被整合至所述目标位点。目的多核苷酸从而被整合至所述植物基因组 的特定染色体位置。靶向多核苷酸的其它方法如WO 2009/114321(以引用 方式并入本文)中所示,其描述了具体地在玉米基因组中生成“定制的” 大范围核酸酶以修饰植物基因组。也参见,Gao等人(2010)Plant Journal  1:176-187。

    已经被转化的细胞可根据常规方法生长为植物。参见例如McCormick 等人(1986)Plant Cell Reports 5:81-84。然后可培养这些植物,并用相同 的或不同的转化过的植物进行授粉,具有期望表型特征的组成型表达的所 得到的子代被鉴定。可以生长两代或多代以保证所希望的表型特征的表达 稳定地保持和遗传,然后收获种子以保证所希望的表型特征的表达已经实 现。以这种方式,本发明提供了转化的种子(也称为“转基因种子”), 所述转化的种子具有稳定地掺入至其基因组中的本发明的多核苷酸,例如 所述实施方案的表达盒。

    检测方法

    提供了检测大范围核酸酶多肽或其活性变体或片段。此类方法包括分 析植物组织以检测此类多肽或编码相同(多肽)的多核苷酸。所述检测方 法能直接测定大范围核酸酶多肽或多核苷酸的存在,或所述检测方法能通 过测定表达该序列的细胞、酵母、植物、植物细胞或植物外植体的表型来 直接测定所述序列。

    在其它实施例中,在植物组织中可通过检测编码各种大范围核酸酶多 肽或其活性变体和片段的任一个的多核苷酸的存在检测所述大范围核酸酶 多肽或其活性变体或片段。在一个实施例中,所述检测方法包括使用聚合 酶链反应(PCR)扩增测定植物组织。

    如本文所用,“引物”是分离的多核苷酸,其通过核酸杂交与互补目 标DNA链退火在引物和所述目标DNA链之间以形成杂交体,然后通过聚 合酶,例如DNA聚合酶,沿着所述目标DNA链延伸。本发明的引物对是 指其用于通过聚合酶链反应(PCR)或其他常规核酸扩增方法扩增目的多 核苷酸。“PCR”或“聚合酶链反应”是用于扩增特定DNA片段的技术 (参见美国专利4,683,195和4,800,159;其以引用方式并入本文)。

    如本文其他地方所述,探针和引物有足够的核苷酸长度以结合目标 DNA序列并且特异性检测和/或鉴定编码大范围核酸酶多肽或其活性变体或 片段的多核苷酸。已经认识到可通过操作者确定杂交条件或反应条件以获 得这种结果。所述长度可以是可用于所选择的检测方法的足够长度的任何 长度。此类探针和引物能在高严格性杂交条件下特异性杂交至目标序列。 根据本发明的实施例,探针和引物可与目标序列具有连续的核苷酸的完全 序列同一性,虽然可通过常规方法设计与目标DNA序列不同并且保持了特 异性检测和/或鉴定目标DNA序列的能力的探针。因此,探针和引物可与 目标多核苷酸共有约80%、85%、90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%或更高的序列同一性或互补性。

    在例如,Molecular Cloning:A Laboratory Manual,2.sup.nd版,卷1- 3,编辑Sambrook等人,Cold Spring Harbor Laboratory Press,Cold Spring  Harbor,N.Y.1989(hereinafter,“Sambrook等人,1989”);Current  Protocols in Molecular Biology,ed.Ausubel等人,Greene Publishing and  Wiley-Interscience,New York,1992(定期更新)(在下文,“Ausubel等 人,1992”);和Innis等人,PCR Protocols:A Guide to Methods and  Applications,Academic Press:San Diego,1990中描述了制备和使用探针和引 物的方法。聚合酶链反应(PCR)引物对可来源于已知的序列,例如,通 过使用旨在用于该目的的计算机程序,诸如在Vector NTI version 10 (Invitrogen)中的PCR引物分析工具;PrimerSelect(DNASTAR Inc., Madison,Wis.);和Primer(Version 0.5.COPYRGT.,1991,Whitehead  Institute for Biomedical Research,Cambridge,Mass.)。另外,可使用对于本 领域技术人员已知的准则目视扫描所述序列和手动鉴定引物。

    鉴定大范围核酸酶变体的方法。

    可使用各种方法鉴定另外的大范围核酸酶变体。除了其用于如,例如 Ausubel、Berger和Sambrook所示的标准克隆方法以生成另外的具有期望 的属性大范围核酸酶多核苷酸和多肽,任选地使用本发明的多核苷酸作为 底物用于多种多样性生成程序,例如,突变、重组和递归重组反应,可使 用多种多样性生成规程。可单独和/或组合使用所述程序以产生多核苷酸或 多核苷酸组的一个或多个变体,以及所编码蛋白的变体。单独地和集体 地,这些程序提供了稳固的、广泛的应用方法以生成多样化的多核苷酸和 多核苷酸组(包括,例如多核苷酸文库),用于例如多核苷酸、蛋白、途 径、细胞和/或生物体的工程化或快速进化使其带有新的和/或改善的特性。 改变序列的方法可导致例如,单个核苷酸替换、多个核苷酸替换以及核酸 序列区域的插入或缺失。

    虽然为清楚起见在随后的讨论过程中进行了区分和分类,但应当理解 为,这些技术往往并不互相排斥。实际上,各种方法可单独或组合使用、 并行或串联使用以获得各种不同的序列变体。

    在应用于多核苷酸时,术语“多元化”和“多样性”是指生成亲本多 核苷酸的多个修饰的形式,或多个亲本多核苷酸。在多核苷酸编码一种多 肽的情况下,所述多核苷酸的核苷酸序列的多样性可导致其对应编码的多 肽的多样性,例如编码多个多肽变体的多核苷酸的各种不同的组。在本发 明的一些实施例中,这种序列多样性的利用是通过针对带有期望的功能属 性的变体(例如,编码具有增强的功能特性的大范围核酸酶的多核苷酸) 来筛选/选择多样化的多核苷酸的文库。

    任一本文所述多样性生成程序的结果可以为生成一个或多个多核苷 酸,可以选择或筛选编码具有或赋予期望的属性的蛋白的多核苷酸。在通 过本文的,或换句话讲技术人员可用的一个或多个方法进行多元化后,针 对期望的活性或属性(例如变化的Km、使用替代的辅因子、提高的Kcat 等)选择生成的任何多核苷酸。这可包括鉴定任何能被检测的活性,例 如,通过本领域的任何测定法,以自动化的或可自动化的形式。例如,可 通过测定大范围核酸酶活性来检测修饰的大范围核酸酶多肽。在本文其他 地方描述了测量此类活性的测定法。可对多种相关的(或甚至不相关的) 属性以串行或并行方式进行评估,由从业人员酌情决定。

    对多种多样性生成程序,包括家族改组,和生成编码多个酶结构域的 修饰的核酸序列的方法的描述存在与下列出版物和本文引用的参考文献 中:Soong N.等人(2000)Nat Genet 25(4):436-39;Stemmer等人 (1999)Tumor Targeting 4:1-4;Ness等人(1999)Nature Biotechnology  17:893-896;Chang等人(1999)Nature Biotechnology 17:793-797;Minshull  and Stemmer(1999)Current Opinion in Chemical Biology 3:284-290; Christians等人(1999)Nature Biotechnology 17:259-264;Crameri等人 (1998)Nature 391:288-291;Crameri等人(1997)Nature Biotechnology  15:436-438;Zhang等人(1997)Proc.Natl.Acad.Sci.USA 94:4504-4509; Patten等人(1997)Current Opinion in Biotechnology 8:724-733;Crameri等 人(1996)Nature Medictne 2:100-103;Crameri等人(1996)Nature  Biotechnology 14:315-319;Gates等人(1996)Journal of Molecular Biology  255:373-386;Stemmer(1996)“Sexual PCR and Assembly PCR”In:The  Encyclopedia of Molecular Biology.VCH Publishers,New York.447-457页; Crameri and Stemmer(1995)Bio Techniques 18:194-195;Stemmer等人 (1995)Gene:164:49-53;Stemmer(1995)Science 270:1510;Stemmer (1995)Bio/Technology 13:549-553;Stemmer(1994)Nature 370:389- 391;以及Stemmer(1994)Proc.Natl.Acad.Sci.USA 91:10747-10751。还 可参见WO2008/073877和US 20070204369,两者其全文以引用方式并入本 文。

    生成多样性的突变方法包括,例如,定点诱变(Ling等人(1997) Anal Biochem.254(2):157-178;Dale等人(1996)Methods Mol.Biol. 57:369-374;Smith(1985)Ann.Rev.Genet.19:423-462;Botstein &  Shortle(1985)Science 229:1193-1201;Carter(1986)Biochem.J.237:1- 7;和Kunkel(1987)Nucleic Acids & Molecular Biology(Eckstein,F.and  Lilley,D.M.J.eds.,Springer Verlag,Berlin));使用含尿嘧啶的模板诱变 (Kunkel(1985)Proc.Natl.Acad.Sci.USA 82:488-492;Kunkel等人 (1987)Methods in Enzymol.154,367-382;he Bass等人(1988)Science  242:240-245);寡核苷酸指导的诱变(Methods in Enzymol.100:468-500 (1983);Methods in Enzymol.154:329-350(1987);Zoller & Smith (1982)Nucleic Acids Res.10:6487-6500;Zoller & Smith(1983)Methods  in Enzymol.100:468-500;和Zoller & Smith(1987)Methods in Enzymol. 154:329-350);硫代磷酸酯修饰的DNA诱变(Taylor等人(1985)Nucl. Acids Res.13:8749-8764;Taylor等人(1985)Nucl.Acids Res.13:8765-8787 (1985);Nakamaye & Eckstein(1986)Nucl.Acids Res.14:9679-9698; Sayers等人(1988)Nucl.Acids Res.16:791-802;和Sayers等人(1988) Nucl.Acids Res.16:803-814);利用缺口双链DNA诱变(Kramer等人 (1984)Nucl.Acids Res.12:9441-9456;Kramer & Fritz(1987)Methods in  Enzymol.154:350-367;Kramer等人(1988)Nucl.Acids Res.16:7207;和 Fritz等人(1988)Nucl.Acids Res.16:6987-6999)。

    另外合适的方法包括但不限于点错配修复(Kramer等人(1984)Cell  38:879-887)、使用修复缺陷型宿主品系的诱变(Carter等人(1985)Nucl. Acids Res.13:4431-4443;和Carter(1987)Methods in Enzymol.154:382- 403)、缺失诱变(Eghtedarzadeh & Henikoff(1986)Nucl.Acids Res.14: 5115)、限制选择和限制纯化(Wells等人(1986)Phil.Trans.R.Soc.Lond. A 317:415-423)、通过全基因合成的诱变(Nambiar等人(1984)Science  223:1299-1301;Sakamar和Khorana(1988)Nucl.Acids Res.14:6361- 6372;Wells等人(1985)Gene 34:315-323;和等人(1985) Nucl.Acids Res.13:3305-3316)、以及双链断裂修复(Mandecki(1986); Arnold(1993)Current Opinion in Biotechnology4:450-455 and Proc.Natl. Acad.Sci.USA,83:7177-7181)。许多上述方法的更多细节可见于Methods  in Enzymology 154卷,其也描述了针对各种诱变方法的故障排除问题可用 的对照。

    关于各种多样性生成方法的更多细节可见于下列美国专利、PCT公开 和EPO公开:美国专利5,605,793、美国专利5,811,238、美国专利 5,830,721、美国专利5,834,252、美国专利5,837,458、WO 95/22625、WO  96/33207、WO 97/20078、WO 97/35966、WO 99/41402、WO 99/41383、 WO 99/41369、WO 99/41368、EP 752008、EP 0932670、WO 99/23107、 WO 99/21979、WO 98/31837、WO 98/27230、WO 98/13487、WO  00/00632、WO 00/09679、WO 98/42832、WO 99/29902、WO 98/41653、 WO 98/41622、WO 98/42727、WO 00/18906、WO 00/04190、WO 00/42561、WO 00/42559、WO 00/42560、WO 01/23401、和 PCT/US01/06775。还可参见WO20074303,以引用方式并入本文。

    简而言之,若干不同通用类别的序列修饰方法,诸如突变、重组等, 适用于本发明并且如例如上述参考中所示。即,在所述序列的连接之前或 在连接步骤之后,可通过任何数量的上述规程来改变组分核酸序列以生成 修饰的基因融合构建体。下文举例说明了针对本发明的上下文中的多样性 生成的优选形式的一些不同类型,包括例如,某些基于重组的多样性生成 形式。

    可通过上述参考文献中讨论的多种技术的任一个进行核酸体外重组, 包括例如,将要重组的核酸用DNA酶消化,之后是连接和/或PCR组装核 酸。例如,可使用有性PCR诱变,其中所述DNA分子的随机(或伪随机 或甚至非随机)片段和之后是体外重组(基于DNA分子与不同但相关联的 DNA序列之间的序列相似性),之后是通过在聚合酶链反应中延伸将交叉 固定。在若干上述参考文献中描述了这个方法和许多方法变体,例如在 Stemmer(1994)Proc.Natl.Acad.Sci.USA 91:10747-10751中。

    相似地,可在体内递归重组核酸,例如,通过允许重组发生在细胞中 的核酸之间。许多此类体内重组形式如上述提到的参考文献所述。此类形 式任选地提供了在目的核酸之间直接重组,或提供了在包含目的核酸的载 体、病毒、质粒等以及其他形式之间的重组。有关此类程序的细节可见于 上文提到的参考文献中。

    也可使用全基因组重组方法,其中将细胞或其他生物体的整个基因组 重组,任选地包括以及基因组重组混合物掺加期望的文库部件(例如,对 应于本发明的途径的基因)。这些方法有许多应用,包括目标基因的同一 性未知的那些。关于此类方法的细节可见于例如WO 98/31837和 PCT/US99/15972。因此,用于重组、递归重组和全基因组重组的这些方法 和技术的任一个可用于生成本发明的修饰的核酸序列和/或修饰的基因融合 构建体。

    也可使用合成重组方法,其中对应于目的靶标的寡核苷酸被合成并且 在聚合酶链反应(PCR)或连接反应中重新组装,所述反应包括对应于多 于一种亲本核酸的寡核苷酸,从而生成新的重组的核酸。可通过标准核苷 酸添加方法,或例如通过三核苷酸合成方法制备寡核苷酸。有关此类方法 的细节可见于上文提到的参考文献,包括,例如WO 00/42561、WO 01/23401、WO 00/42560和WO 00/42559。

    重组的计算机方法可能会受到影响,其中计算机中使用遗传算法以重 组对应于同源的(或甚至非同源的)核酸的序列字符串。通过合成核酸 (其对应于重组序列)将所得的重组序列字符串任选地转变为核酸,例 如,与寡核苷酸合成/基因重新组装技术相一致。这个方法可生成随机的、 部分随机的或设计的变种。在WO 00/42560和WO 00/42559中描述了有关 计算机重组的许多细节,包括在计算机系统中使用了遗传算法、遗传运算 子等,混合了对应的核酸(和/或蛋白)的生成,以及设计的核酸和/或蛋白 的组合(例如,基于交叉位点选择),以及设计的、伪随机或随机重组方 法。

    可类似地使用许多获得天然多样性的方法,例如通过将各种不同的核 酸或核酸片段与单链模板杂交,之后通过聚合和/或连接以再生全长序列, 任选地之后通过降解所述模板并且回收所得的修饰的核酸。在一种方法中 采用了单链模板,来源于基因组文库的片段群体与对应于相反链的部分或 通常约全长ssDNA或RNA退火。然后通过核酸酶去除未杂交的片段末 端、聚合以填补此类片段之间空位以及后续的单链连接来介导来自这个群 体的复杂嵌合基因的组装。所述亲本多核苷酸链可通过消化(例如,如果 包含RNA或尿嘧啶)、在变性条件下磁力分离(如果标记的方式有利于此 类分离)和其他可用的分离/纯化方法而去除。另选地,所述亲本链任选地 与嵌合链共纯化并且在后续筛选和处理步骤过程中被去除。关于这种方法 的更多细节可见于,例如PCT/US01/06775。

    在另一个方法中,单链分子被转变为双链DNA(dsDNA),并且所述 dsDNA分子通过配体介导的结合固定在固体支撑物上。在分离了未固定的 DNA后,所选择的DNA分子从支撑物上释放并被导入合适的宿主细胞以 生成文库,其富集了杂交至所述探针的序列以这种方法制备的文库提供了 合适的底物,使用本文所述的任一程序进一步多样化。

    任何前述一般性重组形式可以以反复的方式来实施(例如,突变/重组 或其他多样性生成方法的一个或多个循环,任选地之后是一种或多种选择 方法),生成重组核酸的更加多样性的组。

    也已提出诱变采用多核苷酸链终止方法(参见例如,美国专利 5,965,408和上述参考文献),并且可应用于本发明。在这个方法中,在存 在或不存在基因特异性引物的情况下,将双链DNA(对应于共享序列相似 性区域的一个或多个基因)混合并变性。然后在聚合酶和链终止试剂(例 如,紫外线、γ或X-射线辐射;溴化乙锭或其它嵌入剂;DNA结合蛋白, 诸如单链结合蛋白、转录激活因子或组蛋白;多环芳烃类;三价铬或三价 铬盐;或由快速热循环介导的简略聚合;等)的存在下将单链多核苷酸退 火并温育,导致产生部分双链分子。然后将所述部分双链分子(例如包含 部分延伸的链的)变性并在后续的复制或部分复制轮次中重新退火,产生 的多核苷酸共享不同程度的序列相似性并且相对于DNA分子的起始群体是 多样化的。任选地,可在所述方法的一个或多个阶段扩增所述产物或产物 的部分组。通过链终止方法(诸如上述的那些)制备的多核苷酸对于任何 其它所述重组形式是合适的底物。

    也可使用在Ostermeier等人(1999)Nature Biotech 17:1205中所述的 名为“渐增切割法产生杂和酶”(“ITCHY”)的重组方法在核酸或核酸 群体中生成多样性。这个方法也可用于生成变体的起始文库,其可任选地 被用作一个或多个体外或体内重组方法的底物。还可参见,Ostermeier等人 (1999)Proc.Natl.Acad.Sci.USA,96:3562-67;Ostermeier等人(1999), Biological and Medicinal Chem istry 7:2139-44。

    可优选采用突变方法(其导致各个核苷酸或邻接的或非邻接的核苷酸 组的改变)将核苷酸多样性导乳本发明的核酸序列和/或基因融合构建体。 许多诱变方法可见于上文引用的参考文献;有关诱变方法的另外的细节可 见于下文,其也可应用于本发明。

    例如,错误倾向聚合酶链反应(PCR)可用于生成核酸变体。使用这 种技术,在DNA聚合酶的拷贝保真性低的条件下进行聚合酶链反应 (PCR),使得沿着所述聚合酶链反应(PCR)产物的整个长度获得了很高 的点突变率。此类技术的例子可见于上述参考文献和例如,Leung等人 (1989)Technique 1:11-15和Caldwell等人(1992)PCR MethodsApplic. 2:28-33中。相似的,在方法中可使用装配聚合酶链反应(PCR),其涉及 从小DNA片段的混合物组装聚合酶链反应(PCR)产物。在相同的反应混 合物中可平行地进行大量不同的聚合酶链反应(PCR)反应,一个反应的 产物引发另一个反应。

    可使用寡核苷酸定向诱变以在目的核酸序列中导入位点特异性突变。 此类技术的示例可见于上述参考文献和例如,Reidhaar-Olson等人(1988) Science 241:53-57中。相似的,在方法中可使用盒诱变,其用不同于原生序 列的合成寡核苷酸盒替换了一小段区域的双链DNA分子。所述寡核苷酸可 包含,例如,完全和/或部分随机化的原生序列。

    递归集合诱变是使用针对蛋白诱变的算法以生成各种不同的表型相关 的突变体的群体(其成员在氨基酸序列上不同)的方法。该方法使用反馈 机制以监控连续轮次的组合盒诱变。该方法的示例可见于Arkin & Youvan (1992)Proc.Natl.Acad.Sci.USA 89:7811-7815。

    可使用指数集合诱变以生成具有高百分比的独特的功能性突变体组合 文库。在目的序列中残基的小基团被平行地随机化以在每个改变的位置处 识别导致功能性蛋白的氨基酸。此类程序的示例可见于Delegrave & Youvan (1993)Biotechnology Research 11:1548-1552。

    可使用体内诱变,通过例如,在一个或多个DNA修复途径中带有突变 的大肠杆菌(E.coli)菌株中传播DNA,在任何克隆的目的DNA中生成随 机突变。这些“增变基因”菌株较野生型亲本具有更高的随机突变率。在 这些菌株之一中传播所述DNA会最终在DNA内生成随机突变。此类程序 在上文提到的参考文献中有所描述。

    其它在基因组(例如细菌、真菌、动物植物基因组)中导入多样性的 方法可与前述的和/或参考的方法一起使用。例如,除了上述方法外,已经 提出了制备适用于转化多种物种的核酸多聚体的技术(参见例如,美国专 利5,756,316和上述参考文献)。用此类多聚体转化合适的宿主提供了一种 针对DNA多元化的核酸多样性来源(例如通过如上文所指出的体内重组方 法),所述多聚体由相对于彼此不同的基因组成(例如,来源于天然的多 样性或通过应用定点诱变、易错聚合酶链反应(PCR)、通过致突变细菌 菌株的通道等等)。

    另选地,可将共享部分序列相似性区域的多个单体多核苷酸转化进宿 主物种并被宿主细胞体内重组。可使用后续轮次的细胞分裂生成文库,其 成员包括单一、均一化群体或单体多核苷酸组。另选地,可通过标准技术 回收所述单体核酸,例如,聚合酶链反应(PCR)和/或克隆,并且以任一 重组形式(包括上文所述递归从组形式)重组。

    已经描述了生成多物种表达文库的方法(除了上文提到的参考文献, 参见例如,美国专利5,783,431和美国专利5,824,485),并且已经提出了将 其用于鉴定目的蛋白活性(除了上文提到的参考文献,参见美国专利 5,958,672)。一般来讲,多物种表达文库包括包含来自多个物种或品系的 cDNA或基因组序列(可操作地连接至合适的调控序列、在表达盒中)的文 库。所述cDNA和/或基因组序列任选地是随机连接的以另外增强多样性。 所述载体可以为适用于在多余一种宿主生物体物种(例如,细菌物种,真 核细胞)中转化和表达的穿梭载体。在一些情况下,由于对序列(编码目 的蛋白或杂交至目的核酸)进行了预选择,所述文库是有偏差的。任何此 类文库可作为本文所述任一方法的底物。

    前述的程序主要涉及提高核酸和/或编码的蛋白质的多样性。然而,在 许多情况下,并非所有的多样性都有用,例如功能性,并且仅有助于提高 变体的背景,所述变体必须经过筛选或选择以鉴定少数有利变体。在一些 应用中,希望在多元化(例如通过基于重组的诱变程序),或在以其他方 式使底物偏向编码功能性产物的核酸之前对文库(例如,扩增的文库、基 因组文库、cDNA文库、标准化的文库)或其他底物核酸分子进行预选择或 预筛选。例如,就抗体工程而言,有可能在通过任一所述方法进行操纵之 前利用体内重组事件将多样性生成方法偏向具有功能性抗原结合位点的抗 体。例如,在按照任一本文所述方法进行多样化之前,可扩增来源于B细 胞cDNA文库的重组CDR并组装为框架区域(例如,Jirholt等人(1998) Gene 215:471)。

    可将文库偏置向编码具有期望的酶活性的蛋白的核酸。例如,在鉴定 来自文库、表现出指定活性的变体后,可使用任何已知的用于导入DNA改 变的方法诱变所述变体。然后针对期望的活性对包含所述诱变的同源物的 文库进行筛选,所述活性可与初始指定的活性相同或不同。美国专利 5,939,250提出了此类程序的一个示例。可通过本领域任何已知方法鉴定期 望的活性。例如,WO 99/10539提出通过将来自基因文库的提取物与得自 代谢丰富的细胞的组分混合、鉴定表现出期望活性的组合来筛选基因文 库。还已经提出(例如,WO 98/58085)可通过在文库的样品中插入生物活 性底物、使用荧光分析仪(例如,流式细胞仪、CCD、荧光计或分光光度 计)来检测对应于期望活性的产物的生物活性荧光来鉴定具有期望活性的 克隆。

    文库也可被偏置向具有指定特性(例如,杂交至所选择的核酸探针) 的核酸。例如,应用WO 99/10539提出可以下列方式从基因组DNA序列中 鉴定编码期望活性(例如,酶活性,例如:脂肪酶、酯酶、蛋白酶、糖苷酶、 糖基转移酶、磷酸酶、激酶、加氧酶、过氧化物酶、水解酶、水合酶、腈 水解酶、转氨酶、酰胺酶或酰化酶)的多核苷酸。间给来自一组基因组 DNA的单链DNA分子与配体偶联的探针杂交。所述基因组DNA可来源于 养殖的或非养殖的微生物体,或来自环境样本。另选地,所述基因组DNA 可来源于多细胞生物体或由其衍生的组织。之前从或不从捕获介质上释放 或通过本领域已知的各种各样的其他策略,第二链合成可直接从捕获物中 所用的杂交探针进行。另选地,如上所述,所述分离的单链的基因组DNA 群体可以为片段化而不进一步克隆并且直接用于,例如,基于重组的方法 (其使用单链模板)。

    生成核酸和多肽的“非随机”方法可见于WO 00/46344。将这些方 法,包括提议的非随机多核苷酸重新组装和位点饱和诱变方法应用至本发 明为好。在例如,Arkin和Youvan(1992)Biotechnology 10:297-300; Reidhaar-Olson等人(1991)Methods Enzymol.208:564-86;Lim和Sauer (1991)J.Mol.Biol.219:359-76;Breyer和Sauer(1989)J.Biol.Chem. 264:13355-60);和美国专利5,830,650和5,798,208,EP专利0527809B1 中也描述了使用掺杂的或简并的寡核苷酸的随机或半随机诱变。

    很容易理解,也可在多样化之前使用任何前述的适用于富集文库的技 术来筛选通过多样性生成方法制备的产物或产物的文库。可递归地或组合 地实施任一前述的方法以改变核酸,例如编码大范围核酸酶的多核苷酸。

    前述参考文献提供了许多突变的形式,包括重组、递归重组和组合或 带有其他诱变形式的重组,以及这些形式的许多修饰。不管所用的多样性 生成形式,可将本发明的核酸(彼此,或与相关的(或甚至不相关的)序 列)重组以制备用于基因融合构建体和本发明的改性的基因融合构建体的 重组核酸的各种不同的组,包括,例如同源核酸以及对应的多肽的组。

    用于生成修饰的多核苷酸的许多前述的方法学生成了亲本序列或序列 的大量各种不同的变体。在一些实施例中,修饰技术(例如,一些基因改 组的形式)被用于生成变体文库,然后筛选修饰的多核苷酸或编码一些期 望的功能属性(例如提高大范围核酸酶活性)的改性多核苷酸组。

    为了方便和高通量,通常期望在微生物(例如诸如大肠杆菌(E.coli) 的细菌)体中筛选/选择期望的改性核酸。另一方面,在最终目标是生成用 于在植物系统中表达的改性核酸的情况下,在植物细胞或植物中筛选可以 为优选的。

    在本发明的一些优选的实例中通过筛选表达单独的或作为基因融合构 建体一部分的不同改性核酸宿主细胞组提高生产能力。可将任何显示显著 活性的组进行去卷积以鉴定表达期望活性的单个变体。

    在高通量测定在,有可能在一天筛选最多至数千个不同的变体。例 如,微升板的每个孔可用于运行一个独立的测定,或者,如果要观察浓度 或温育时间效应,每5-10个孔可测试单个变体。

    除了流体方法,如上所述,有可能简单地让细胞生长在培养基平板上 来筛选期望的酶功能或代谢功能。该方法提供了一种简单并且高通量的筛 选方法。

    针对测试系统中可用的溶液相化学已经开发了多个熟知的机器人系 统。这些系统包括类似由Takeda Chemical Industries,LTD.(Osaka, Japan)开发的自动化合成设备的自动化工作站,和许多利用机械臂的机器 人系统(Zymate II,Zymark Corporation,Hopkinton,MA.;Orca,Hewlett- Packard,Palo Alto,CA),其模拟科学家进行的手动合成操作。上述设备的 任一个适用于本发明的应用。这些设备的本质和具体实施的修改(如果有 的话)使得它们能如本文讨论的、参照对于相关领域的技术人员显而易见 的整合系统进行操作。

    高通量筛选系统可商购获得(参见,例如,Zymark Corp.,Hopkinton, MA;Air Technical Industries,Mentor,OH;Beckman Instruments,Inc. Fullerton,CA;Precision Systems,Inc.,Natick,MA等)。这些系统通常 自动化整个的流程,包括全部的样品和试剂移液、液体的分配、定时孵 育、以及最终在适合该检测的检测器中对微孔板的读数。这些可配置的系 统提供了高通量和快速启动以及高度的灵活度和用户定制化。

    此类系统的制造商提供了针对各种高通量设备的详细规程。因此,例 如,Zymark Corp.提供技术公告描述了用于检测基因转录的调节、配体结合 等的筛选系统。试剂操纵的微流体方法也已被例如,Caliper Technologies (Mountain View,CA)开发。

    酵母和植物

    提供了本文所公开的具有所述大范围核酸酶序列的酵母、植物、植物 细胞、种子和谷物。在具体实施例中,所述酵母、植物和/或植物部分稳定 地掺入了至少一种本文所公开的异源大范围核酸酶多肽或其活性变体或片 段。因此,提供了酵母、植物、植物细胞和种子,其包含至少一种异源大 范围核酸酶序列,所述序列为SEQ ID NO:14、15、16、17、18、19、20、 21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、 37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、 101、102、103、104、105、106、107、108、109、110、111、112、113、 114、115、116、117、118、119、120、121、122、123、124、125、126、 127、128、129、130、131、132、133、134、135、136、137、138、139、 140、141、142、143、144、145、146、147、148、149、150、151、152、 153、154、155、156、157、158、159、160、161、162、163、164、165、 166、167、251、252、253、262、272、273、274、275、284、285、286、 287、288、289、290、291、292、293、294、295、296、297、298、315、 316、317、318、319、320、330、331、332、334、335、336、337、338、 339、340、341、357、358、359、360、361、362、363、364、365、366、 367、368、369、370、370、371、390、391、392、393、394、395、396、 397、398、399、400、401、402或403的任何一个或本文所公开的其他变 体(诸如在实例3-23中的那些)或所述大范围核酸酶序列的生物活性片段 和/或变体的任何一个。在具体实施例中,所述大范围核酸酶序列的特征在 于具有大范围核酸酶活性。

    在具体实施例中,植物或植物部分中的异源多核苷酸可操作地连接至 组成型的、组织优选的或用于在植物中表达的其他启动子。

    所述酵母、植物、植物细胞和种子可包含任一本文提供的识别序列。 例如,所述识别位点可选自LIG3-4(SEQ ID NO:2)、MHP77(SEQ ID  NO:85)、MS26(SEQ ID NO:269)、MHP14(SEQ ID NO:281)、MP107 (SEQ ID NO:328)、ZM6.3(SEQ ID NO:355)、ZM6.22V2(SEQ ID  NO:388)、TS21(SEQ ID NO:423)和/或TS14(SEQ ID NO:424)识别序 列或其活性变体。

    如本文所用,术语植物包括植物细胞、植物原生质体、从其中再生植 物的植物细胞组织培养物、植物愈伤组织、植物,植物丛生物、以及在植 物或植物部分中完整的植物细胞如胚芽、花粉、胚珠、种子、叶片、花、 仁、穗、芯、壳、茎、根、根尖、花药等。谷物旨在表示商业化种植者出 于栽培或繁殖物种之外的目的生产的成熟种子。再生植物的子代、变体和 突变体也包括在本发明的范围内,前提条件是这些部分包含导入的多核苷 酸。

    本文提供的转化的植物或转化的植物细胞是指其遗传改变,诸如转 化,已被目的基因影响,或来自这种改性的植物或细胞的后代并包含这种 改性的植物或植物细胞。“转基因”是已通过转化方法导入基因组内的基 因。因此,“转基因植物”是指包含转基因的植物,不论是通过转化或通 过育种将转基因引入特定植物的;因此,该定义涵盖了最初转化的植物的 后代。“对照”或“对照植物”或“对照植物细胞”为测量受试植物或植 物细胞的表型变化提供了基准点。对照植物或植物细胞可包括例如:(a) 野生型植物或细胞,即,与用于遗传改性生成受试植物或细胞的起始材料 具有相同基因型的;(b)与起始材料具有相同基因型、但用空构建体转化 了的植物或细胞(即,用不表达转基因的构建体,诸如包含标记基因的构 建体);(c)为受试植物或植物细胞子代中的非转化的分离体的植物或植 物细胞;(d)与受试植物或植物细胞遗传上相同、但未暴露于将导致转基 因表达的条件或刺激的植物或植物细胞;或(e)处于构建体不表达条件下 的受试植物或植物细胞自身。

    经转化以表达本文提供的大范围核酸酶的植物细胞可长成完整植物。 从单个植物原生质体转化体或从多种经转化的外植体再生、发育和培育植 物是本领域所熟知的。参见例如McCormick等人(1986)Plant Cell Reports 5:81-84;Weissbach和Weissbach,In:Methods for Plant Molecular  Biology,(编辑),Academic Press,Inc.San Diego,Calif.,(1988)。 该再生和生长方法通常包括如下步骤:选择转化的细胞、培养这些单独化 的细胞通过胚发育的通常阶段以及通过生根小植物阶段。转基因胚以及种 子以类似的方式再生。随后将所得的转基因的生根小苗种植在诸如土壤之 类的合适植物生长培养基中。优选地,将再生的植物进行自花授粉以产生 纯合的转基因植物。或者,将得自再生植物的花粉与农学上重要的品系的 产生种子的植物进行杂交。相反,将来自这些重要品系的植物用于给再生 植物授粉。可以生长两代或多代以保证所希望的表型特征的表达稳定地保 持和遗传,然后收获种子以保证所希望的表型特征的表达已经实现。这 样,本文介绍的组合物提供了转化的种子(也被称为“转基因种子”), 其具有本文提供的稳定地掺入在其基因组中的多核苷酸(例如目标位 点)。

    本文所公开的大范围核酸酶序列及其活性变体和片段可被用于转化任 何植物物种,包括但不限于单子叶植物和双子叶植物。目的植物种类的例子 包括但不限于玉米(Zea mays)、芸苔属植物(例如油菜(B.napus)、芜 菁(B.rapa)、芥菜(B.juncea)),尤其是那些用作种子油源的芸苔属植 物物种、苜蓿(Medicago sativa)、稻(Oryza sativa)、黑麦(Secale  cereale)、高粱(蜀黍(Sorghum bicolor)、南非蜀黍(Sorghum  vulgar))、小米(例如珍珠粟(Pennisetum glaucum)、黄米(Panicum  miliaceum)、粟(Setaria italica)、龙爪稷(Eleusine coracana))、向日葵 (Helian因此annuus)、红花(Carthamus tinctorius)、小麦(Triticum  aestivum)、大豆(Glycine max)、烟草属植物(Nicotiana tabacum)、马铃 薯(Solanum tuberosum)、花生(Arachis hypogaea)、棉花(海岛棉 (Gossypium barbadense)、陆地棉(Gossypium hirsutum))、甘薯 (Ipomoea batatus)、木薯(Manihot esculenta)、咖啡(Coffea属物种)、 椰子(Cocos nucifera)、菠萝(Ananas comosus)、柑橘(Citrus属物 种)、可可(Theobroma cacao)、茶(Camellia sinensis)、香蕉(Musa属 物种)、鳄梨(Persea americana)、无花果(Ficus casica)、番石榴 (Psidium guajava)、芒果(Mangifera indica)、橄榄(Olea europaea)、 番木瓜果(Carica papaya)、腰果(Anacardium occidentale)、澳大利亚坚 果(Macadamia integrifolia)、杏(Prunus amygdalus)、甜菜(Beta  vulgaris)、甘蔗(Saccharum属物种)、燕麦、大麦、蔬菜、观赏植物、和 针叶树。

    蔬菜包括西红柿(Lycopersicon esculentum)、莴苣(例如叶用莴苣 (Lactuca sativa))、菜豆(Phaseolus vulgaris)、利马豆(Phaseolus  limensis)、豌豆(香豌豆属物种(Lathyrus spp.))、和黄瓜属(Cucumis) 物种如黄瓜(C.sativus)、香瓜(C.cantalupensis)和甜瓜(C.melo)。观 赏植物包括杜鹃花(Rhododendron属物种)、八仙花(Macrophylla  hydrangea)、木槿(Hibiscus rosasanensis)、蔷薇(Rosa属物种)、郁金 香(Tulipa属物种)、水仙花(Narcissus)属物种、矮牵牛花(Petunia  hybrida)、康乃馨(Dian因此caryophyllus)、一品红(Euphorbia  pulcherrima)、和菊花。

    实施本发明时可使用的针叶树包括例如松树如火炬松(Pinus taeda)、 沼泽松(Pinus elliotii)、北美黄松(Pinus ponderosa)、黑松(Pinus  contorta)、和辐射松(Pinus radiata);花旗松(Pseudotsuga menziesii); 异叶铁杉(Tsuga canadensis);北美云杉(Picea glauca);红杉(Sequoia  sempervirens);真冷杉如银枞(Abies amabilis)和香脂冷杉(Abies  balsamea);和雪松诸如西岸红雪松(Thuja plicata)和阿拉斯加黄桧 (Chamaecyparis nootkatensis),以及杨树和桉树。在具体的实施例中,本 发明的植物为作物植物(例如,玉米、苜蓿、向日葵、芸苔属植物、大豆、 红花、豌豆、高粱、小麦、粟、烟草属植物等)。在其它实施例中,玉米和 大豆植物是最佳的,在另外的实施例中玉米植物是最佳的。

    其他目的植物包括提供所关注种子的谷物植物、油料种子植物和豆科 植物。目的种子包括谷物种子,诸如玉米、小麦、大麦、稻、高粱、黑麦 等。油料种子植物包括棉花、大豆、红花、向日葵、芸苔属植物、玉米、 苜蓿、棕榈、椰子等。豆科植物包括菜豆和豌豆。菜豆包括瓜尔胶、刺槐 豆胶、胡芦巴、大豆、花园豆、豇豆、绿豆、利马豆、蚕豆、扁豆、鹰嘴 豆等。

    本文所公开的组合物和方法的非限制性例子如下述:

    1.一种分离的或重组的多核苷酸,其包含编码大范围核酸酶多肽的 核苷酸序列,所述多肽包含:

    a)在对应于SEQ ID NO:1的位置的氨基酸位置处具有至少一个 氨基酸修饰的氨基酸序列,所述SEQ ID NO:1的位置选自位 置2、12、16、22、23、31、36、43、50、56、58、59、 62、71、72、73、80、81、82、86、91、95、98、103、 113、114、116、117、118、121、124、128、129、131、 147、151、153、159、160、161、162、163、164、165、 166、167、168、169、170、171、172、173、174、175、 176、177、178、179、180、182、183、184、185、186、 187、188、189、190、191、192、194、195、196、197、 200、203、204、209、222、232、236、237、246、254、 258、267、278、281、282、289、308、311、312、316、 318、319、334、339、340、342、345、346、348、以及它们 的组合;或

    b)具有(a)的任何氨基酸修饰中的至少1、2、3、4、5、6、 7、8、9、10、11、12、13、14、15、16、17、18、19、20、 21、22、23、24、25、26、27、28、29、30、31、32、33、 34、35、36、37、38、39、40、41、42、43或44个的氨基酸 序列。

    2.根据实施例1所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码与SEQ ID NO:1具有至少80%、81,%、82%、83%、 84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%的序列同一性的大范围核酸 酶多肽。

    3.根据实施例1所述的分离的或重组的多核苷酸,其中所述至少一 个氨基酸修饰包含:

    a)在对应于SEQ ID NO:1中氨基酸位置2的位置处的天冬氨 酸(D);

    b)在对应于SEQ ID NO:1中氨基酸位置12的位置处的组氨 酸(H);

    c)在对应于SEQ ID NO:1中氨基酸位置16的位置处的异亮 氨酸(I);

    d)在对应于SEQ ID NO:1中氨基酸位置22的位置处的半胱 氨酸(C);

    e)在对应于SEQ ID NO:1中氨基酸位置23的位置处的亮氨 酸(L);

    f)在对应于SEQ ID NO:1中氨基酸位置31的位置处的精氨 酸(R);

    g)在对应于SEQ ID NO:1中氨基酸位置36的位置处的天冬 酰胺(N);

    h)在对应于SEQ ID NO:1中氨基酸位置43的位置处的亮氨 酸(L);

    i)在对应于SEQ ID NO:1中氨基酸位置50的位置处的精氨 酸(R)或赖氨酸(K);

    j)在对应于SEQ ID NO:1中氨基酸位置56的位置处的亮氨 酸(L);

    k)在对应于SEQ ID NO:1中氨基酸位置58的位置处的异亮 氨酸(I);

    l)在对应于SEQ ID NO:1中氨基酸位置59的位置处的组氨 酸(H)或丙氨酸(A);

    m)在对应于SEQ ID NO:1中氨基酸位置62的位置处的缬氨 酸(V)

    n)在对应于SEQ ID NO:1中氨基酸位置71的位置处的赖氨 酸(K);

    o)在对应于SEQ ID NO:1中氨基酸位置72的位置处的苏氨 酸(T);

    p)在对应于SEQ ID NO:1中氨基酸位置73的位置处的丙氨 酸(A);

    q)在对应于SEQ ID NO:1中氨基酸位置80的位置处的精氨 酸(R);

    r)在对应于SEQ ID NO:1中氨基酸位置81的位置处的赖氨 酸(K);

    s)在对应于SEQ ID NO:1中氨基酸位置82的位置处的精氨 酸(R);

    t)在对应于SEQ ID NO:1中氨基酸位置86的位置处的天冬 氨酸(D);

    u)在对应于SEQ ID NO:1中氨基酸位置91的位置处的异亮 氨酸(I);

    v)在对应于SEQ ID NO:1中氨基酸位置95的位置处的异亮 氨酸(I);

    w)在对应于SEQ ID NO:1中氨基酸位置98的位置处的精氨 酸(R);

    x)在对应于SEQ ID NO:1中氨基酸位置103的位置处的缬氨 酸(V);

    y)在对应于SEQ ID NO:1中氨基酸位置113的位置处的丝氨 酸(S);

    z)在对应于SEQ ID NO:1中氨基酸位置114的位置处的脯氨 酸(P);

    aa)在对应于SEQ ID NO:1中氨基酸位置116的位置处的精氨 酸(R);

    bb)在对应于SEQ ID NO:1中氨基酸位置117的位置处的甘氨 酸(G);

    cc)在对应于SEQ ID NO:1中氨基酸位置118的位置处的苏氨 酸(T);

    dd)在对应于SEQ ID NO:1中氨基酸位置121的位置处的甘氨 酸(G);

    ee)在对应于SEQ ID NO:1中氨基酸位置124的位置处的精氨 酸(R);

    ff)在对应于SEQ ID NO:1中氨基酸位置128的位置处的半胱 氨酸(C);

    gg)在对应于SEQ ID NO:1中氨基酸位置129的位置处的丙氨 酸(A);

    hh)在对应于SEQ ID NO:1中氨基酸位置131的位置处的精氨 酸(R);

    ii)在对应于SEQ ID NO:1中氨基酸位置147的位置处的丝氨 酸(S);

    jj)在对应于SEQ ID NO:1中氨基酸位置151的位置处的丙氨 酸(A);

    kk)在对应于SEQ ID NO:1中氨基酸位置153的位置处的亮氨 酸(L)或甲硫氨酸(M);

    ll)在对应于SEQ ID NO:1中氨基酸位置159的位置处的色氨 酸(W);

    mm)在对应于SEQ ID NO:1中氨基酸位置160的位置处的谷氨 酸(E);

    nn)在对应于SEQ ID NO:1中氨基酸位置161的位置处的缬氨 酸(V);

    oo)在对应于SEQ ID NO:1中氨基酸位置162的位置处的酪氨 酸(Y);

    pp)在对应于SEQ ID NO:1中氨基酸位置163的位置处的精氨 酸(R);

    qq)在对应于SEQ ID NO:1中氨基酸位置164的位置处的组氨 酸(H);

    rr)在对应于SEQ ID NO:1中氨基酸位置165的位置处的亮氨 酸(L);

    ss)在对应于SEQ ID NO:1中氨基酸位置166的位置处的精氨 酸(R);

    tt)在对应于SEQ ID NO:1中氨基酸位置167的位置处的组氨 酸(H);

    uu)在对应于SEQ ID NO:1中氨基酸位置168的位置处的脯氨 酸(P);

    vv)在对应于SEQ ID NO:1中氨基酸位置169的位置处的丙氨 酸(A);

    ww)在对应于SEQ ID NO:1中氨基酸位置170的位置处的脯氨 酸(P);

    xx)在对应于SEQ ID NO:1中氨基酸位置171的位置处的组氨 酸(H);

    yy)在对应于SEQ ID NO:1中氨基酸位置172的位置处的脯氨 酸(P);

    zz)在对应于SEQ ID NO:1中氨基酸位置173的位置处的精氨 酸(R);

    aaa)在对应于SEQ ID NO:1中氨基酸位置174的位置处的亮氨 酸(L);

    bbb)在对应于SEQ ID NO:1中氨基酸位置175的位置处的脯氨 酸(P);

    ccc)在对应于SEQ ID NO:1中氨基酸位置176的位置处的谷氨 酰胺(Q);

    ddd)在对应于SEQ ID NO:1中氨基酸位置177的位置处的丙氨 酸(A);

    eee)在对应于SEQ ID NO:1中氨基酸位置178的位置处的精氨 酸(R);

    fff)在对应于SEQ ID NO:1中氨基酸位置179的位置处的缬氨 酸(V);

    ggg)在对应于SEQ ID NO:1中氨基酸位置180的位置处的谷氨 酰胺(Q);

    hhh)在对应于SEQ ID NO:1中氨基酸位置182的位置处的缬氨 酸(V);

    iii)在对应于SEQ ID NO:1中氨基酸位置183的位置处的脯氨 酸(P);

    jjj)在对应于SEQ ID NO:1中氨基酸位置184的位置处的赖氨 酸(K);

    kkk)在对应于SEQ ID NO:1中氨基酸位置185的位置处的苏氨 酸(T)或组氨酸(H);

    lll)在对应于SEQ ID NO:1中氨基酸位置186的位置处的丝氨 酸(S);

    mmm)在对应于SEQ ID NO:1中氨基酸位置187的位置处的谷氨 酸(E);

    nnn)在对应于SEQ ID NO:1中氨基酸位置188的位置处的亮氨 酸(L);

    ooo)在对应于SEQ ID NO:1中氨基酸位置189的位置处的谷氨 酸(E);

    PPP)在对应于SEQ ID NO:1中氨基酸位置190的位置处的谷氨 酰胺(Q);

    qqq)在对应于SEQ ID NO:1中氨基酸位置191的位置处的亮氨 酸(L);

    rrr)在对应于SEQ ID NO:1中氨基酸位置194的位置处的脯氨 酸(P);

    sss)在对应于SEQ ID NO:1中氨基酸位置195的位置处的赖氨 酸(K);

    ttt)在对应于SEQ ID NO:1中氨基酸位置196的位置处的丝氨 酸(S);

    uuu)在对应于SEQ ID NO:1中氨基酸位置197的位置处的苯丙 氨酸(F);

    vvv)在对应于SEQ ID NO:1中氨基酸位置200的位置处的异亮 氨酸(I);

    www)在对应于SEQ ID NO:1中氨基酸位置203的位置处的缬氨 酸(V);

    xxx)在对应于SEQ ID NO:1中氨基酸位置204的位置处的亮氨 酸(L);

    yyy)在对应于SEQ ID NO:1中氨基酸位置209的位置处的半胱 氨酸(C);

    zzz)在对应于SEQ ID NO:1中氨基酸位置222的位置处的亮氨 酸(L);

    aaaa)在对应于SEQ ID NO:1中氨基酸位置232的位置处的异亮 氨酸(I);

    bbbb)在对应于SEQ ID NO:1中氨基酸位置236的位置处的丝氨 酸(S);

    cccc)在对应于SEQ ID NO:1中氨基酸位置237的位置处的亮氨 酸(L)或精氨酸(R);

    dddd)在对应于SEQ ID NO:1中氨基酸位置246的位置处的组氨 酸(H);

    eeee)在对应于SEQ ID NO:1中氨基酸位置254的位置处的异亮 氨酸(I);

    ffff)在对应于SEQ ID NO:1中氨基酸位置258的位置处的丝氨 酸(S);

    gggg)在对应于SEQ ID NO:1中氨基酸位置267的位置处的精氨 酸(R);

    hhhh)在对应于SEQ ID NO:1中氨基酸位置278的位置处的异亮 氨酸(I);

    iiii)在对应于SEQ ID NO:1中氨基酸位置281的位置处的酪氨 酸(Y);

    jjjj)在对应于SEQ ID NO:1中氨基酸位置282的位置处的苯丙 氨酸(F);

    kkkk)在对应于SEQ ID NO:1中氨基酸位置289的位置处的苏氨 酸(T);

    llll)在对应于SEQ ID NO:1中氨基酸位置308的位置处的甘氨 酸(G);

    mmmm)在对应于SEQ ID NO:1中氨基酸位置311的位置处 的精氨酸(R);

    nnnn)在对应于SEQ ID NO:1中氨基酸位置312的位置处的丙氨 酸(A);

    oooo)在对应于SEQ ID NO:1中氨基酸位置316的位置处的丙氨 酸(A);

    PPPP)在对应于SEQ ID NO:1中氨基酸位置318的位置处的精氨 酸(R);

    qqqq)在对应于SEQ ID NO:1中氨基酸位置334的位置处的丙氨 酸(A);

    rrrr)在对应于SEQ ID NO:1中氨基酸位置339的位置处的苯丙 氨酸(F);

    ssss)在对应于SEQ ID NO:1中氨基酸位置340的位置处的甘氨 酸(G)或亮氨酸(L);

    tttt)在对应于SEQ ID NO:1中氨基酸位置342的位置处的丝氨 酸(S);

    uuuu)在对应于SEQ ID NO:1中氨基酸位置345的位置处的天冬 酰胺(N);

    vvvv)在对应于SEQ ID NO:1中氨基酸位置346的位置处的天冬 酰胺(N);

    wwww)在对应于SEQ ID NO:1中氨基酸位置348的位置处的天冬 酰胺(N);或

    xxxx)a)至wwww)的任何组合。

    根据实施例1所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码大范围核酸酶多肽,其中所述多肽还包含:

    a)在对应于SEQ ID NO:1中氨基酸位置2的位置处的天冬 氨酸(D);

    b)在对应于SEQ ID NO:1中氨基酸位置12的位置处的组 氨酸(H);

    c)在对应于SEQ ID NO:1中氨基酸位置16的位置处的异 亮氨酸(I);

    d)在对应于SEQ ID NO:1中氨基酸位置19的位置处的丝 氨酸(S)或丙氨酸(A);

    e)在对应于SEQ ID NO:1中氨基酸位置22的位置处的半 胱氨酸(C);

    f)在对应于SEQ ID NO:1中氨基酸位置23的位置处的亮 氨酸(L);

    g)在对应于SEQ ID NO:1中氨基酸位置24的位置处的甲 硫氨酸(M);

    h)在对应于SEQ ID NO:1中氨基酸位置28的位置处的精 氨酸(R)或丙氨酸(A);

    i)在对应于SEQ ID NO:1中氨基酸位置30的位置处的精 氨酸(R)、丙氨酸(A)、谷氨酰胺(Q)、半胱氨酸 (C)、甘氨酸(G)、丝氨酸(S)、苏氨酸(T)、 亮氨酸(L)、谷氨酸(E)或脯氨酸(P);

    j)在对应于SEQ ID NO:1中氨基酸位置31的位置处的精 氨酸(R);

    k)在对应于SEQ ID NO:1中氨基酸位置32的位置处的精 氨酸(R)、丙氨酸(A)、赖氨酸(K)、谷氨酰胺 (Q)、甘氨酸(G)或亮氨酸(L);

    l)在对应于SEQ ID NO:1中氨基酸位置36的位置处的天 冬酰胺(N);

    m)在对应于SEQ ID NO:1中氨基酸位置43的位置处的亮 氨酸(L);

    n)在对应于SEQ ID NO:1中氨基酸位置50的位置处的精 氨酸(R)或赖氨酸(K);

    o)在对应于SEQ ID NO:1中氨基酸位置54的位置处的异 亮氨酸(I)或亮氨酸(L);

    p)在对应于SEQ ID NO:1中氨基酸位置56的位置处的亮 氨酸(L);

    q)在对应于SEQ ID NO:1中氨基酸位置57的位置处的谷 氨酸(E);

    r)在对应于SEQ ID NO:1中氨基酸位置58的位置处的异 亮氨酸(I);

    s)在对应于SEQ ID NO:1中氨基酸位置59的位置处的组 氨酸(H)或丙氨酸(A);

    t)在对应于SEQ ID NO:1中氨基酸位置62的位置处的缬 氨酸(V);

    u)在对应于SEQ ID NO:1中氨基酸位置71的位置处的赖 氨酸(K);

    v)在对应于SEQ ID NO:1中氨基酸位置72的位置处的苏 氨酸(T);

    w)在对应于SEQ ID NO:1中氨基酸位置73的位置处的丙 氨酸(A);

    x)在对应于SEQ ID NO:1中氨基酸位置79的位置处的甘 氨酸(G);

    y)在对应于SEQ ID NO:1中氨基酸位置80的位置处的精 氨酸(R);

    z)在对应于SEQ ID NO:1中氨基酸位置81的位置处的赖 氨酸(K);

    aa)在对应于SEQ ID NO:1中氨基酸位置82的位置处的精 氨酸(R);

    bb)在对应于SEQ ID NO:1中氨基酸位置86的位置处的天 冬氨酸(D);

    cc)在对应于SEQ ID NO:1中氨基酸位置87的位置处的亮 氨酸(L);

    dd)在对应于SEQ ID NO:1中氨基酸位置91的位置处的异 亮氨酸(I);

    ee)在对应于SEQ ID NO:1中氨基酸位置95的位置处的异 亮氨酸(I);

    ff)在对应于SEQ ID NO:1中氨基酸位置98的位置处的精 氨酸(R);

    gg)在对应于SEQ ID NO:1中氨基酸位置103的位置处的缬 氨酸(V);

    hh)在对应于SEQ ID NO:1中氨基酸位置105的位置处的丙 氨酸(A);

    ii)在对应于SEQ ID NO:1中氨基酸位置111的位置处的精 氨酸(R);

    jj)在对应于SEQ ID NO:1中氨基酸位置113的位置处的丝 氨酸(S);

    kk)在对应于SEQ ID NO:1中氨基酸位置114的位置处的脯 氨酸(P);

    ll)在对应于SEQ ID NO:1中氨基酸位置116的位置处的精 氨酸(R);

    mm)在对应于SEQ ID NO:1中氨基酸位置117的位置处的甘 氨酸(G);

    nn)在对应于SEQ ID NO:1中氨基酸位置118的位置处的苏 氨酸(T);

    oo)在对应于SEQ ID NO:1中氨基酸位置121的位置处的甘 氨酸(G);

    pp)在对应于SEQ ID NO:1中氨基酸位置124的位置处的精 氨酸(R);

    qq)在对应于SEQ ID NO:1中氨基酸位置128的位置处的半 胱氨酸(C);

    rr)在对应于SEQ ID NO:1中氨基酸位置129的位置处的丙 氨酸(A);

    ss)在对应于SEQ ID NO:1中氨基酸位置131的位置处的精 氨酸(R);

    tt)在对应于SEQ ID NO:1中氨基酸位置132的位置处的缬 氨酸(V);

    uu)在对应于SEQ ID NO:1中氨基酸位置147的位置处的丝 氨酸(S);

    vv)在对应于SEQ ID NO:1中氨基酸位置151的位置处的丙 氨酸(A);

    ww)在对应于SEQ ID NO:1中氨基酸位置153的位置处的亮 氨酸(L)或甲硫氨酸(M);

    xx)在对应于SEQ ID NO:1中氨基酸位置159的位置处的色 氨酸(W);

    yy)在对应于SEQ ID NO:1中氨基酸位置160的位置处的谷 氨酸(E);

    zz)在对应于SEQ ID NO:1中氨基酸位置161的位置处的缬 氨酸(V);

    aaa)在对应于SEQ ID NO:1中氨基酸位置162的位置处的酪 氨酸(Y);

    bbb)在对应于SEQ ID NO:1中氨基酸位置163的位置处的精 氨酸(R);

    ccc)在对应于SEQ ID NO:1中氨基酸位置164的位置处的组 氨酸(H);

    ddd)在对应于SEQ ID NO:1中氨基酸位置165的位置处的亮 氨酸(L);

    eee)在对应于SEQ ID NO:1中氨基酸位置166的位置处的精 氨酸(R);

    fff)在对应于SEQ ID NO:1中氨基酸位置167的位置处的组 氨酸(H);

    ggg)在对应于SEQ ID NO:1中氨基酸位置168的位置处的脯 氨酸(P);

    hhh)在对应于SEQ ID NO:1中氨基酸位置169的位置处的丙 氨酸(A);

    iii)在对应于SEQ ID NO:1中氨基酸位置170的位置处的脯 氨酸(P);

    jjj)在对应于SEQ ID NO:1中氨基酸位置171的位置处的组 氨酸(H);

    kkk)在对应于SEQ ID NO:1中氨基酸位置172的位置处的脯 氨酸(P);

    lll)在对应于SEQ ID NO:1中氨基酸位置173的位置处的精 氨酸(R);

    mmm)在对应于SEQ ID NO:1中氨基酸位置174的位置处的亮 氨酸(L);

    nnn)在对应于SEQ ID NO:1中氨基酸位置175的位置处的脯 氨酸(P);

    ooo)在对应于SEQ ID NO:1中氨基酸位置176的位置处的谷 氨酰胺(Q);

    ppp)在对应于SEQ ID NO:1中氨基酸位置177的位置处的丙 氨酸(A);

    qqq)在对应于SEQ ID NO:1中氨基酸位置178的位置处的精 氨酸(R);

    rrr)在对应于SEQ ID NO:1中氨基酸位置179的位置处的缬 氨酸(V);

    sss)在对应于SEQ ID NO:1中氨基酸位置180的位置处的谷 氨酰胺(Q);

    ttt)在对应于SEQ ID NO:1中氨基酸位置182的位置处的缬 氨酸(V);

    uuu)在对应于SEQ ID NO:1中氨基酸位置183的位置处的脯 氨酸(P);

    vvv)在对应于SEQ ID NO:1中氨基酸位置184的位置处的赖 氨酸(K);

    www)在对应于SEQ ID NO:1中氨基酸位置185的位置处的苏 氨酸(T)或组氨酸(H);

    xxx)在对应于SEQ ID NO:1中氨基酸位置186的位置处的丝 氨酸(S);

    yyy)在对应于SEQ ID NO:1中氨基酸位置187的位置处的谷 氨酸(E);

    zzz)在对应于SEQ ID NO:1中氨基酸位置188的位置处的亮 氨酸(L);

    aaaa)在对应于SEQ ID NO:1中氨基酸位置189的位置处的谷 氨酸(E);

    bbbb)在对应于SEQ ID NO:1中氨基酸位置190的位置处的谷 氨酰胺(Q);

    cccc)在对应于SEQ ID NO:1中氨基酸位置191的位置处的亮 氨酸(L);

    dddd)在对应于SEQ ID NO:1中氨基酸位置192的位置处的氨 基酸缺失;

    eeee)在对应于SEQ ID NO:1中氨基酸位置194的位置处的脯 氨酸(P);

    ffff)在对应于SEQ ID NO:1中氨基酸位置195的位置处的赖 氨酸(K);

    gggg)在对应于SEQ ID NO:1中氨基酸位置196的位置处的丝 氨酸(S);

    hhhh)在对应于SEQ ID NO:1中氨基酸位置197的位置处的苯 丙氨酸(F);

    iiii)在对应于SEQ ID NO:1中氨基酸位置200的位置处的异 亮氨酸(I);

    jjjj)在对应于SEQ ID NO:1中氨基酸位置203的位置处的缬 氨酸(V);

    kkkk)在对应于SEQ ID NO:1中氨基酸位置204的位置处的亮 氨酸(L);

    llll)在对应于SEQ ID NO:1中氨基酸位置206的位置处的丙 氨酸(A)或丝氨酸(S);

    mmmm)在对应于SEQ ID NO:1中氨基酸位置209的位置处的半 胱氨酸(C);

    nnnn)在对应于SEQ ID NO:1中氨基酸位置222的位置处的亮 氨酸(L);

    oooo)在对应于SEQ ID NO:1中氨基酸位置211的位置处的甲 硫氨酸(M);

    pppp)在对应于SEQ ID NO:1中氨基酸位置232的位置处的异 亮氨酸(I);

    qqqq)在对应于SEQ ID NO:1中氨基酸位置236的位置处的丝 氨酸(S);

    rrrr)在对应于SEQ ID NO:1中氨基酸位置237的位置处的亮 氨酸(L)或精氨酸(R);

    ssss)在对应于SEQ ID NO:1中氨基酸位置241的位置处的异 亮氨酸(I)或亮氨酸(L);

    tttt)在对应于SEQ ID NO:1中氨基酸位置244的位置处的谷 氨酸(E);

    uuuu)在对应于SEQ ID NO:1中氨基酸位置246的位置处的组 氨酸(H);

    vvvv)在对应于SEQ ID NO:1中氨基酸位置253的位置处的天 冬氨酸(D)或组氨酸(H);

    wwww)在对应于SEQ ID NO:1中氨基酸位置254的位置处的异 亮氨酸(I);

    xxxx)在对应于SEQ ID NO:1中氨基酸位置258的位置处的丝 氨酸(S);

    yyyy)在对应于SEQ ID NO:1中氨基酸位置267的位置处的精 氨酸(R);

    zzzz)在对应于SEQ ID NO:1中氨基酸位置278的位置处的异 亮氨酸(I);

    aaaaa)在对应于SEQ ID NO:1中氨基酸位置281的位置处的酪 氨酸(Y);

    bbbbb)在对应于SEQ ID NO:1中氨基酸位置282的位置处的苯 丙氨酸(F);

    ccccc)在对应于SEQ ID NO:1中氨基酸位置289的位置处的苏 氨酸(T);

    ddddd)在对应于SEQ ID NO:1中氨基酸位置292的位置处的丙 氨酸(A);

    eeeee)在对应于SEQ ID NO:1中氨基酸位置308的位置处的甘 氨酸(G);

    fffff)在对应于SEQ ID NO:1中氨基酸位置311的位置处的精 氨酸(R);

    ggggg)在对应于SEQ ID NO:1中氨基酸位置312的位置处的丙 氨酸(A);

    hhhhh)在对应于SEQ ID NO:1中氨基酸位置316的位置处的丙 氨酸(A);

    iiiii)在对应于SEQ ID NO:1中氨基酸位置318的位置处的精 氨酸(R);

    jjjjj)在对应于SEQ ID NO:1中氨基酸位置319的位置处的缬 氨酸(V);

    kkkkk)在对应于SEQ ID NO:1中氨基酸位置334的位置处的丙 氨酸(A);

    lllll)在对应于SEQ ID NO:1中氨基酸位置339的位置处的苯 丙氨酸(F);

    mmmmm)在对应于SEQ ID NO:1中氨基酸位置340的位置处的甘 氨酸(G)或亮氨酸(L);

    nnnnn)在对应于SEQ ID NO:1中氨基酸位置342的位置处的丝 氨酸(S);

    ooooo)在对应于SEQ ID NO:1中氨基酸位置345的位置处的天 冬酰胺(N);

    ppppp)在对应于SEQ ID NO:1中氨基酸位置346的位置处的天 冬酰胺(N);或

    qqqqq)在对应于SEQ ID NO:1中氨基酸位置348的位置处的天 冬酰胺(N);或

    rrrrr)a)至qqqqq)的任何组合。

    5.根据实施例1所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID  NO:14、15、16、17、18、19、20、21、22、23,24、25、26、 27、28、29、30、31、32、33、34、35、36、37、38、87、88、 89、90、91、92、93、94、95、96、97、98、99、100、101、 102、103、104、105、106、107、108、109、110、111、112、 113、114、115、116、117、118、119、120、121、122、123、 124、125、126、127、128、129、130、131、132、133、134、 135、136、137、138、139、140、141、142、143、144、145、 146、147、148、149、150、151、152、153、154、155、156、 157、158、159、160、161、162、163、164、165、166、167、 251、252、253、272、273、274、275、272、273、274、275、 284、285、286、287、288、289、290、291、292、293、294、 295、296、297、298、330、331、332、333、334、335、336、 337、338、339、340、341、357、358、359、360、361、362、 363、364、365、366、367、368、369、370、371、390、391、 392、393、394、395、396、397、398、399、400、401、402、 403、430、431、432和433。

    6.根据实施例1所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码大范围核酸酶多肽,其中所述多肽能够识别和裂解大范 围核酸酶识别序列,所述大范围核酸酶识别序列选自SEQ ID  NO:2(LIG3-4)、SEQ ID NO:85(MHP77)、SEQ ID NO:269 (MS26)、SEQ ID NO:281(MHP14)、SEQ ID NO:331 (MP107)、SEQ ID NO:358(ZM6.3)、SEQ ID NO:390 (ZM6.22v2)、SEQ ID NO:423或SEQ ID NO:424。

    7.根据实施例1所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码大范围核酸酶多肽,其中所述多肽在与缺乏所述氨基酸 修饰的对照大范围核酸酶进行比较时具有提高的大范围核酸酶活 性。

    8.根据实施例7所述的分离的或重组的多核苷酸,其中所述对照大 范围核酸酶选自SEQ ID NO:1(LIG3-4)、SEQ ID NO:86 (MHP77)、SEQ ID NO:250(MHP77.3)、SEQ ID NO:270 (MS26+)、SEQ ID NO:271、SEQ ID NO:282(MHP14)、SEQ  ID NO:283(MHP14+)、SEQ ID NO:329(MP107)、SEQ ID  NO:356(ZM6.3)、SEQ ID NO:389(ZM6.22v2)、SEQ ID  NO:429或SEQ ID NO:435。

    9.根据实施例7所述的分离的或重组的多核苷酸,其中所述提高的 大范围核酸酶活性的证据是:

    a)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更 高的酵母测定得分;或

    b)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更 高的目标位点突变率;或

    c)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更 高的体外切割;或

    d)(a)、(b)和(c)的任何组合。

    10.根据实施例1所述的分离的或重组的多核苷酸,其还包含编码N- 末端核转运肽的核苷酸序列。

    11.根据实施例1所述的分离的或重组的多核苷酸,其还包含编码C- 末端组氨酸标签的核苷酸序列。

    12.根据实施例7所述的分离的或重组的多核苷酸,其中所述提高的 大范围核酸酶活性是在16℃、24℃、28℃、30℃或37℃下测定 的。

    13.一种重组DNA构建体,其包含实施例1所述的分离的或重组的 多核苷酸。

    14.根据实施例13所述的重组DNA构建体,其还包含可操作地连接 至所述多核苷酸的启动子。

    15.根据实施例14所述的重组DNA构建体,其中所述启动子相对于 所述多核苷酸是异源的,或所述启动子相对于所述多核苷酸是同 源的。

    16.一种细胞,其包含至少一种实施例1所述的多核苷酸或实施例13 所述的重组DNA构建体,其中所述多核苷酸对于所述细胞是异 源的。

    17.根据实施例16所述的细胞,其中所述细胞是酵母细胞。

    18.根据实施例16所述的细胞,其中所述细胞是植物细胞。

    19.根据实施例16所述的细胞,其中所述多核苷酸或所述重组DNA 构建体稳定地掺入至所述植物细胞的基因组中。

    20.根据实施例16所述的细胞,其中所述多核苷酸或所述重组DNA 构建体稳定地掺入至所述植物细胞的叶绿体基因组中。

    21.根据实施例18所述的细胞,其中所述植物细胞来自单子叶植物。

    22.根据实施例21所述的细胞,其中所述单子叶植物为玉米、小麦、 稻、大麦、甘蔗、高粱或黑麦。

    23.根据实施例18所述的细胞,其中所述植物细胞来自双子叶植物。

    24.根据实施例23所述的细胞,其中所述双子叶植物为大豆、芸苔属 植物(Brassica)、向日葵、棉花或苜蓿。

    25.一种植物,其包含实施例18所述的植物细胞。

    26.一种植物外植体,其包含实施例18所述的植物细胞。

    27.根据实施例26所述的植物、所述外植体或所述植物细胞,其中所 述植物、外植体或植物细胞在与相同物种、品系或品种的植物、 外植体或植物细胞(不包含至少一种实施例1所述的多核苷酸) 进行比较时表现出提高的大范围核酸酶活性。

    28.一种转基因种子,其由实施例25所述的植物产生。

    29.一种具有大范围核酸酶活性的分离的多肽,所述多肽包含:

    a)在对应于SEQ ID NO:1的位置的氨基酸位置处具有至少一个 氨基酸修饰的氨基酸序列,所述SEQ ID NO:1的位置选自位 置2、12、16、22、23、31、36、43、50、56、58、59、62、 71、72、73、80、81、82、86、91、95、98、103、113、 114、116、117、118、121、124、128、129、131、147、 151、153、159、160、161、162、163、164、165、166、 167、168、169、170、171、172、173、174、175、176、 177、178、179、180、182、183、184、185、186、187、 188、189、190、191、192、194、195、196、197、200、 203、204、209、222、232、236、237、246、254、258、 267、278、281、282、289、308、311、312、316、318、 319、334、339、340、342、345、346、348、以及它们的组 合;或

    b)具有(a)的任何氨基酸修饰中的至少1、2、3、4、5、6、 7、8、9、10、11、12、13、14、15、16、17、18、19、20、 21、22、23、24、25、26、27、28、29、30、31、32、33、 34、35、36、37、38、39、40、41、42、43或44个的氨基酸 序列。

    30.根据实施例29所述的分离的多肽,其中所述多肽与SEQ ID NO:1 具有至少80%的序列同一性。

    31.根据实施例29所述的分离的多肽,其中所述至少一个氨基酸修饰 包括:

    a)在对应于SEQ ID NO:1中氨基酸位置2的位置处的天冬氨 酸(D);

    b)在对应于SEQ ID NO:1中氨基酸位置12的位置处的组氨 酸(H);

    c)在对应于SEQ ID NO:1中氨基酸位置16的位置处的异亮 氨酸(I);

    d)在对应于SEQ ID NO:1中氨基酸位置22的位置处的半胱 氨酸(C);

    e)在对应于SEQ ID NO:1中氨基酸位置23的位置处的亮氨 酸(L);

    f)在对应于SEQ ID NO:1中氨基酸位置31的位置处的精氨 酸(R);

    g)在对应于SEQ ID NO:1中氨基酸位置36的位置处的天冬 酰胺(N);

    h)在对应于SEQ ID NO:1中氨基酸位置43的位置处的亮氨 酸(L);

    i)在对应于SEQ ID NO:1中氨基酸位置50的位置处的精氨 酸(R)或赖氨酸(K);

    j)在对应于SEQ ID NO:1中氨基酸位置56的位置处的亮氨 酸(L);

    k)在对应于SEQ ID NO:1中氨基酸位置58的位置处的异亮 氨酸(I);

    l)在对应于SEQ ID NO:1中氨基酸位置59的位置处的组氨 酸(H)或丙氨酸(A);

    m)在对应于SEQ ID NO:1中氨基酸位置62的位置处的缬氨 酸(V);

    n)在对应于SEQ ID NO:1中氨基酸位置71的位置处的赖氨 酸(K);

    o)在对应于SEQ ID NO:1中氨基酸位置72的位置处的苏氨 酸(T);

    p)在对应于SEQ ID NO:1中氨基酸位置73的位置处的丙氨 酸(A);

    q)在对应于SEQ ID NO:1中氨基酸位置80的位置处的精氨 酸(R);

    r)在对应于SEQ ID NO:1中氨基酸位置81的位置处的赖氨 酸(K);

    s)在对应于SEQ ID NO:1中氨基酸位置82的位置处的精氨 酸(R);

    t)在对应于SEQ ID NO:1中氨基酸位置86的位置处的天冬 氨酸(D);

    u)在对应于SEQ ID NO:1中氨基酸位置91的位置处的异亮 氨酸(I);

    v)在对应于SEQ ID NO:1中氨基酸位置95的位置处的异亮 氨酸(I);

    w)在对应于SEQ ID NO:1中氨基酸位置98的位置处的精氨 酸(R);

    x)在对应于SEQ ID NO:1中氨基酸位置103的位置处的缬氨 酸(V);

    y)在对应于SEQ ID NO:1中氨基酸位置113的位置处的丝氨 酸(S);

    z)在对应于SEQ ID NO:1中氨基酸位置114的位置处的脯氨 酸(P);

    aa)在对应于SEQ ID NO:1中氨基酸位置116的位置处的精氨 酸(R);

    bb)在对应于SEQ ID NO:1中氨基酸位置117的位置处的甘氨 酸(G);

    cc)在对应于SEQ ID NO:1中氨基酸位置118的位置处的苏氨 酸(T);

    dd)在对应于SEQ ID NO:1中氨基酸位置121的位置处的甘氨 酸(G);

    ee)在对应于SEQ ID NO:1中氨基酸位置124的位置处的精氨 酸(R);

    ff)在对应于SEQ ID NO:1中氨基酸位置128的位置处的半胱 氨酸(C);

    gg)在对应于SEQ ID NO:1中氨基酸位置129的位置处的丙氨 酸(A);

    hh)在对应于SEQ ID NO:1中氨基酸位置131的位置处的精氨 酸(R);

    ii)在对应于SEQ ID NO:1中氨基酸位置147的位置处的丝氨 酸(S);

    jj)在对应于SEQ ID NO:1中氨基酸位置151的位置处的丙氨 酸(A);

    kk)在对应于SEQ ID NO:1中氨基酸位置153的位置处的亮氨 酸(L)或甲硫氨酸(M);

    ll)在对应于SEQ ID NO:1中氨基酸位置159的位置处的色氨 酸(W);

    mm)在对应于SEQ ID NO:1中氨基酸位置160的位置处的谷氨 酸(E);

    nn)在对应于SEQ ID NO:1中氨基酸位置161的位置处的缬氨 酸(V);

    oo)在对应于SEQ ID NO:1中氨基酸位置162的位置处的酪氨 酸(Y);

    pp)在对应于SEQ ID NO:1中氨基酸位置163的位置处的精氨 酸(R);

    qq)在对应于SEQ ID NO:1中氨基酸位置164的位置处的组氨 酸(H);

    rr)在对应于SEQ ID NO:1中氨基酸位置165的位置处的亮氨 酸(L);

    ss)在对应于SEQ ID NO:1中氨基酸位置166的位置处的精氨 酸(R);

    tt)在对应于SEQ ID NO:1中氨基酸位置167的位置处的组氨 酸(H);

    uu)在对应于SEQ ID NO:1中氨基酸位置168的位置处的脯氨 酸(P);

    vv)在对应于SEQ ID NO:1中氨基酸位置169的位置处的丙氨 酸(A);

    ww)在对应于SEQ ID NO:1中氨基酸位置170的位置处的脯氨 酸(P);

    xx)在对应于SEQ ID NO:1中氨基酸位置171的位置处的组氨 酸(H);

    yy)在对应于SEQ ID NO:1中氨基酸位置172的位置处的脯氨 酸(P);

    zz)在对应于SEQ ID NO:1中氨基酸位置173的位置处的精氨 酸(R);

    aaa)在对应于SEQ ID NO:1中氨基酸位置174的位置处的亮氨 酸(L);

    bbb)在对应于SEQ ID NO:1中氨基酸位置175的位置处的脯氨 酸(P);

    ccc)在对应于SEQ ID NO:1中氨基酸位置176的位置处的谷氨 酰胺(Q);

    ddd)在对应于SEQ ID NO:1中氨基酸位置177的位置处的丙氨 酸(A);

    eee)在对应于SEQ ID NO:1中氨基酸位置178的位置处的精氨 酸(R);

    fff)在对应于SEQ ID NO:1中氨基酸位置179的位置处的缬氨 酸(V);

    ggg)在对应于SEQ ID NO:1中氨基酸位置180的位置处的谷氨 酰胺(Q);

    hhh)在对应于SEQ ID NO:1中氨基酸位置182的位置处的缬氨 酸(V);

    iii)在对应于SEQ ID NO:1中氨基酸位置183的位置处的脯氨 酸(P);

    jjj)在对应于SEQ ID NO:1中氨基酸位置184的位置处的赖氨 酸(K);

    kkk)在对应于SEQ ID NO:1中氨基酸位置185的位置处的苏氨 酸(T)或组氨酸(H);

    lll)在对应于SEQ ID NO:1中氨基酸位置186的位置处的丝氨 酸(S);

    mmm)在对应于SEQ ID NO:1中氨基酸位置187的位置处的谷氨 酸(E);

    nnn)在对应于SEQ ID NO:1中氨基酸位置188的位置处的亮氨 酸(L);

    ooo)在对应于SEQ ID NO:1中氨基酸位置189的位置处的谷氨 酸(E);

    PPP)在对应于SEQ ID NO:1中氨基酸位置190的位置处的谷氨 酰胺(Q);

    qqq)在对应于SEQ ID NO:1中氨基酸位置191的位置处的亮氨 酸(L);

    rrr)在对应于SEQ ID NO:1中氨基酸位置194的位置处的脯氨 酸(P);

    sss)在对应于SEQ ID NO:1中氨基酸位置195的位置处的赖氨 酸(K);

    ttt)在对应于SEQ ID NO:1中氨基酸位置196的位置处的丝氨 酸(S);

    uuu)在对应于SEQ ID NO:1中氨基酸位置197的位置处的苯丙 氨酸(F);

    vvv)在对应于SEQ ID NO:1中氨基酸位置200的位置处的异亮 氨酸(I);

    www)在对应于SEQ ID NO:1中氨基酸位置203的位置处的缬氨 酸(V);

    xxx)在对应于SEQ ID NO:1中氨基酸位置204的位置处的亮氨 酸(L);

    yyy)在对应于SEQ ID NO:1中氨基酸位置209的位置处的半胱 氨酸(C);

    zzz)在对应于SEQ ID NO:1中氨基酸位置222的位置处的亮氨 酸(L);

    aaaa)在对应于SEQ ID NO:1中氨基酸位置232的位置处的异亮 氨酸(I);

    bbbb)在对应于SEQ ID NO:1中氨基酸位置236的位置处的丝氨 酸(S);

    cccc)在对应于SEQ ID NO:1中氨基酸位置237的位置处的亮氨 酸(L)或精氨酸(R);

    dddd)在对应于SEQ ID NO:1中氨基酸位置246的位置处的组氨 酸(H);

    eeee)在对应于SEQ ID NO:1中氨基酸位置254的位置处的异亮 氨酸(I);

    ffff)在对应于SEQ ID NO:1中氨基酸位置258的位置处的丝氨 酸(S);

    gggg)在对应于SEQ ID NO:1中氨基酸位置267的位置处的精氨 酸(R);

    hhhh)在对应于SEQ ID NO:1中氨基酸位置278的位置处的异亮 氨酸(I);

    iiii)在对应于SEQ ID NO:1中氨基酸位置281的位置处的酪氨 酸(Y);

    jjjj)在对应于SEQ ID NO:1中氨基酸位置282的位置处的苯丙 氨酸(F);

    kkkk)在对应于SEQ ID NO:1中氨基酸位置289的位置处的苏氨 酸(T);

    llll)在对应于SEQ ID NO:1中氨基酸位置308的位置处的甘氨 酸(G);

    mmmm)在对应于SEQ ID NO:1中氨基酸位置311的位置处 的精氨酸(R);

    nnnn)在对应于SEQ ID NO:1中氨基酸位置312的位置处的丙氨 酸(A);

    oooo)在对应于SEQ ID NO:1中氨基酸位置316的位置处的丙氨 酸(A);

    PPPP)在对应于SEQ ID NO:1中氨基酸位置318的位置处的精氨 酸(R);

    qqqq)在对应于SEQ ID NO:1中氨基酸位置334的位置处的丙氨 酸(A);

    rrrr)在对应于SEQ ID NO:1中氨基酸位置339的位置处的苯丙 氨酸(F);

    ssss)在对应于SEQ ID NO:1中氨基酸位置340的位置处的甘氨 酸(G)或亮氨酸(L);

    tttt)在对应于SEQ ID NO:1中氨基酸位置342的位置处的丝氨 酸(S);

    uuuu)在对应于SEQ ID NO:1中氨基酸位置345的位置处的天冬 酰胺(N);

    vvvv)在对应于SEQ ID NO:1中氨基酸位置346的位置处的天冬 酰胺(N);

    wwww)在对应于SEQ ID NO:1中氨基酸位置348的位置处的天冬 酰胺(N);或

    xxxx)a)至wwww)的任何组合。

    32.根据实施例29所述的分离的多肽,其中所述多肽还包含:

    a)在对应于SEQ ID NO:1中氨基酸位置2的位置处的天冬 氨酸(D);

    b)在对应于SEQ ID NO:1中氨基酸位置12的位置处的组 氨酸(H);

    c)在对应于SEQ ID NO:1中氨基酸位置16的位置处的异 亮氨酸(I);

    d)在对应于SEQ ID NO:1中氨基酸位置19的位置处的丝 氨酸(S)或丙氨酸(A);

    e)在对应于SEQ ID NO:1中氨基酸位置22的位置处的半 胱氨酸(C);

    f)在对应于SEQ ID NO:1中氨基酸位置23的位置处的亮 氨酸(L);

    g)在对应于SEQ ID NO:1中氨基酸位置24的位置处的甲 硫氨酸(M);

    h)在对应于SEQ ID NO:1中氨基酸位置28的位置处的精 氨酸(R)或丙氨酸(A);

    i)在对应于SEQ ID NO:1中氨基酸位置30的位置处的精 氨酸(R)、丙氨酸(A)、谷氨酰胺(Q)、半胱氨酸 (C)、甘氨酸(G)、丝氨酸(S)、苏氨酸(T)、 亮氨酸(L)、谷氨酸(E)或脯氨酸(P);

    j)在对应于SEQ ID NO:1中氨基酸位置31的位置处的精 氨酸(R);

    k)在对应于SEQ ID NO:1中氨基酸位置32的位置处的精 氨酸(R)、丙氨酸(A)、赖氨酸(K)、谷氨酰胺 (Q)、甘氨酸(G)或亮氨酸(L);

    l)在对应于SEQ ID NO:1中氨基酸位置36的位置处的天 冬酰胺(N);

    m)在对应于SEQ ID NO:1中氨基酸位置43的位置处的亮 氨酸(L);

    n)在对应于SEQ ID NO:1中氨基酸位置50的位置处的精 氨酸(R)或赖氨酸(K);

    o)在对应于SEQ ID NO:1中氨基酸位置54的位置处的异 亮氨酸(I)或亮氨酸(L);

    p)在对应于SEQ ID NO:1中氨基酸位置56的位置处的亮 氨酸(L);

    q)在对应于SEQ ID NO:1中氨基酸位置57的位置处的谷 氨酸(E);

    r)在对应于SEQ ID NO:1中氨基酸位置58的位置处的异 亮氨酸(I);

    s)在对应于SEQ ID NO:1中氨基酸位置59的位置处的组 氨酸(H)或丙氨酸(A);

    t)在对应于SEQ ID NO:1中氨基酸位置62的位置处的缬 氨酸(V);

    u)在对应于SEQ ID NO:1中氨基酸位置71的位置处的赖 氨酸(K);

    v)在对应于SEQ ID NO:1中氨基酸位置72的位置处的苏 氨酸(T);

    w)在对应于SEQ ID NO:1中氨基酸位置73的位置处的丙 氨酸(A);

    x)在对应于SEQ ID NO:1中氨基酸位置79的位置处的甘 氨酸;

    y)在对应于SEQ ID NO:1中氨基酸位置80的位置处的精 氨酸(R);

    z)在对应于SEQ ID NO:1中氨基酸位置81的位置处的赖 氨酸(K);

    aa)在对应于SEQ ID NO:1中氨基酸位置82的位置处的精 氨酸(R);

    bb)在对应于SEQ ID NO:1中氨基酸位置86的位置处的天 冬氨酸(D);

    cc)在对应于SEQ ID NO:1中氨基酸位置87的位置处的亮 氨酸(L);

    dd)在对应于SEQ ID NO:1中氨基酸位置91的位置处的异 亮氨酸(I);

    ee)在对应于SEQ ID NO:1中氨基酸位置95的位置处的异 亮氨酸(I);

    ff)在对应于SEQ ID NO:1中氨基酸位置98的位置处的精 氨酸(R);

    gg)在对应于SEQ ID NO:1中氨基酸位置103的位置处的缬 氨酸(V);

    hh)在对应于SEQ ID NO:1中氨基酸位置105的位置处的丙 氨酸(A);

    ii)在对应于SEQ ID NO:1中氨基酸位置111的位置处的精 氨酸(R);

    jj)在对应于SEQ ID NO:1中氨基酸位置113的位置处的丝 氨酸(S);

    kk)在对应于SEQ ID NO;1中氨基酸位置114的位置处的脯 氨酸(P);

    ll)在对应于SEQ ID NO:1中氨基酸位置116的位置处的精 氨酸(R);

    mm)在对应于SEQ ID NO:1中氨基酸位置117的位置处的甘 氨酸(G);

    nn)在对应于SEQ ID NO:1中氨基酸位置118的位置处的苏 氨酸(T);

    oo)在对应于SEQ ID NO:1中氨基酸位置121的位置处的甘 氨酸(G);

    pp)在对应于SEQ ID NO:1中氨基酸位置124的位置处的精 氨酸(R);

    qq)在对应于SEQ ID NO:1中氨基酸位置128的位置处的半 胱氨酸(C);

    rr)在对应于SEQ ID NO:1中氨基酸位置129的位置处的丙 氨酸(A);

    ss)在对应于SEQ ID NO:1中氨基酸位置131的位置处的精 氨酸(R);

    tt)在对应于SEQ ID NO:1中氨基酸位置132的位置处的缬 氨酸(V);

    uu)在对应于SEQ ID NO:1中氨基酸位置147的位置处的丝 氨酸(S);

    vv)在对应于SEQ ID NO:1中氨基酸位置151的位置处的丙 氨酸(A);

    ww)在对应于SEQ ID NO:1中氨基酸位置153的位置处的亮 氨酸(L)或甲硫氨酸(M);

    xx)在对应于SEQ ID NO:1中氨基酸位置159的位置处的色 氨酸(W);

    yy)在对应于SEQ ID NO:1中氨基酸位置160的位置处的谷 氨酸(E);

    zz)在对应于SEQ ID NO:1中氨基酸位置161的位置处的缬 氨酸(V);

    aaa)在对应于SEQ ID NO:1中氨基酸位置162的位置处的酪 氨酸(Y);

    bbb)在对应于SEQ ID NO:1中氨基酸位置163的位置处的精 氨酸(R);

    ccc)在对应于SEQ ID NO:1中氨基酸位置164的位置处的组 氨酸(H);

    ddd)在对应于SEQ ID NO:1中氨基酸位置165的位置处的亮 氨酸(L);

    eee)在对应于SEQ ID NO:1中氨基酸位置166的位置处的精 氨酸(R);

    fff)在对应于SEQ ID NO:1中氨基酸位置167的位置处的组 氨酸(H);

    ggg)在对应于SEQ ID NO:1中氨基酸位置168的位置处的脯 氨酸(P);

    hhh)在对应于SEQ ID NO:1中氨基酸位置169的位置处的丙 氨酸(A);

    iii)在对应于SEQ ID NO:1中氨基酸位置170的位置处的脯 氨酸(P);

    jjj)在对应于SEQ ID NO:1中氨基酸位置171的位置处的组 氨酸(H);

    kkk)在对应于SEQ ID NO:1中氨基酸位置172的位置处的脯 氨酸(P);

    lll)在对应于SEQ ID NO:1中氨基酸位置173的位置处的精 氨酸(R);

    mmm)在对应于SEQ ID NO:1中氨基酸位置174的位置处的亮 氨酸(L);

    nnn)在对应于SEQ ID NO:1中氨基酸位置175的位置处的脯 氨酸(P);

    ooo)在对应于SEQ ID NO:1中氨基酸位置176的位置处的谷 氨酰胺(Q);

    ppp)在对应于SEQ ID NO:1中氨基酸位置177的位置处的丙 氨酸(A);

    qqq)在对应于SEQ ID NO:1中氨基酸位置178的位置处的精 氨酸(R);

    rrr)在对应于SEQ ID NO:1中氨基酸位置179的位置处的缬 氨酸(V);

    sss)在对应于SEQ ID NO:1中氨基酸位置180的位置处的谷 氨酰胺(Q);

    ttt)在对应于SEQ ID NO:1中氨基酸位置182的位置处的缬 氨酸(V);

    uuu)在对应于SEQ ID NO:1中氨基酸位置183的位置处的脯 氨酸(P);

    vvv)在对应于SEQ ID NO:1中氨基酸位置184的位置处的赖 氨酸(K);

    www)在对应于SEQ ID NO:1中氨基酸位置185的位置处的苏 氨酸(T)或组氨酸(H);

    xxx)在对应于SEQ ID NO:1中氨基酸位置186的位置处的丝 氨酸(S);

    yyy)在对应于SEQ ID NO:1中氨基酸位置187的位置处的谷 氨酸(E);

    zzz)在对应于SEQ ID NO:1中氨基酸位置188的位置处的亮 氨酸(L);

    aaaa)在对应于SEQ ID NO:1中氨基酸位置189的位置处的谷 氨酸(E);

    bbbb)在对应于SEQ ID NO:1中氨基酸位置190的位置处的谷 氨酰胺(Q);

    cccc)在对应于SEQ ID NO:1中氨基酸位置191的位置处的亮 氨酸(L);

    dddd)在对应于SEQ ID NO:1中氨基酸位置192的位置处的氨 基酸缺失;

    eeee)在对应于SEQ ID NO:1中氨基酸位置194的位置处的脯 氨酸(P);

    ffff)在对应于SEQ ID NO:1中氨基酸位置195的位置处的赖 氨酸(K);

    gggg)在对应于SEQ ID NO:1中氨基酸位置196的位置处的丝 氨酸(S);

    hhhh)在对应于SEQ ID NO:1中氨基酸位置197的位置处的苯 丙氨酸(F);

    iiii)在对应于SEQ ID NO:1中氨基酸位置200的位置处的异 亮氨酸(I);

    jjjj)在对应于SEQ ID NO:1中氨基酸位置203的位置处的缬 氨酸(V);

    kkkk)在对应于SEQ ID NO:1中氨基酸位置204的位置处的亮 氨酸(L);

    llll)在对应于SEQ ID NO:1中氨基酸位置206的位置处的丙 氨酸(A)或丝氨酸(S);

    mmmm)在对应于SEQ ID NO:1中氨基酸位置209的位置处的半 胱氨酸(C);

    nnnn)在对应于SEQ ID NO:1中氨基酸位置222的位置处的亮 氨酸(L);

    oooo)在对应于SEQ ID NO:1中氨基酸位置211的位置处的甲 硫氨酸(M);

    pppp)在对应于SEQ ID NO:1中氨基酸位置232的位置处的异 亮氨酸(I);

    qqqq)在对应于SEQ ID NO:1中氨基酸位置236的位置处的丝 氨酸(S);

    rrrr)在对应于SEQ ID NO:1中氨基酸位置237的位置处的亮 氨酸(L)或精氨酸(R);

    ssss)在对应于SEQ ID NO:1中氨基酸位置241的位置处的异 亮氨酸(I)或亮氨酸(L);

    tttt)在对应于SEQ ID NO:1中氨基酸位置244的位置处的谷 氨酸(E);

    uuuu)在对应于SEQ ID NO:1中氨基酸位置246的位置处的组 氨酸(H);

    vvvv)在对应于SEQ ID NO:1中氨基酸位置253的位置处的天 冬氨酸(D)或组氨酸(H);

    wwww)在对应于SEQ ID NO:1中氨基酸位置254的位置处的异 亮氨酸(I);

    xxxx)在对应于SEQ ID NO:1中氨基酸位置258的位置处的丝 氨酸(S);

    yyyy)在对应于SEQ ID NO:1中氨基酸位置267的位置处的精 氨酸(R);

    zzzz)在对应于SEQ ID NO:1中氨基酸位置278的位置处的异 亮氨酸(I);

    aaaaa)在对应于SEQ ID NO:1中氨基酸位置281的位置处的酪 氨酸(Y);

    bbbbb)在对应于SEQ ID NO:1中氨基酸位置282的位置处的苯 丙氨酸(F);

    ccccc)在对应于SEQ ID NO:1中氨基酸位置289的位置处的苏 氨酸(T);

    ddddd)在对应于SEQ ID NO:1中氨基酸位置292的位置处的丙 氨酸(A);

    eeeee)在对应于SEQ ID NO:1中氨基酸位置308的位置处的甘 氨酸(G);

    fffff)在对应于SEQ ID NO:1中氨基酸位置311的位置处的精 氨酸(R);

    ggggg)在对应于SEQ ID NO:1中氨基酸位置312的位置处的丙 氨酸(A);

    hhhhh)在对应于SEQ ID NO:1中氨基酸位置316的位置处的丙 氨酸(A);

    iiiii)在对应于SEQ ID NO:1中氨基酸位置318的位置处的精 氨酸(R);

    jjjjj)在对应于SEQ ID NO:1中氨基酸位置319的位置处的缬 氨酸(V);

    kkkkk)在对应于SEQ ID NO:1中氨基酸位置334的位置处的丙 氨酸(A);

    lllll)在对应于SEQ ID NO:1中氨基酸位置339的位置处的苯 丙氨酸(F);

    mmmmm)在对应于SEQ ID NO:1中氨基酸位置340的位置处的甘 氨酸(G)或亮氨酸(L);

    nnnnn)在对应于SEQ ID NO:1中氨基酸位置342的位置处的丝 氨酸(S);

    ooooo)在对应于SEQ ID NO:1中氨基酸位置345的位置处的天 冬酰胺(N);

    ppppp)在对应于SEQ ID NO:1中氨基酸位置346的位置处的天 冬酰胺(N);或

    qqqqq)在对应于SEQ ID NO:1中氨基酸位置348的位置处的天 冬酰胺(N);或

    rrrrr)a)至qqqqq)的任何组合。

    33.根据实施例29所述的分离的多肽,其选自SEQ ID NO:14、15、 16、17、18、19、20、21、22、23、24、25、26、27、28、29、 30、31、32、33、34、35、36、37、38、87、88、89、90、91、 92、93、94、95、96、97、98、99、100、101、102、103、104、 105、106、107、108、109、110、111、112、113、114、115、 116、117、118、119、120、121、122、123、124、125、126、 127、128、129、130、131、132、133、134、135、136、137、 138、139、140、141、142、143、144、145、146、147、148、 149、150、151、152、153、154、155、156、157、158、159、 160、161、162、163、164、165、166、167、251、252、253、 272、273、274、275、272、273、274、275、284、285、286、 287、288、289、290、291、292、293、294、295、296、297、 298、330、331、332、333、334、335、336、337、338、339、 340、341、357、358、359、360、361、362、363、364、365、 366、367、368、369、370、371、390、391、392、393、394、 395、396、397、398、399、400、401、402、430、431、432和 433。

    34.根据实施例29所述的分离的多肽,其中所述多肽能够识别和裂解 大范围核酸酶识别位点,所述大范围核酸酶识别位点选自SEQ ID  NO:2(LIG3-4)、SEQ ID NO:85(MHP77)、SEQ ID NO:269 (MS26)、SEQ ID NO:281(MHP14)、SEQ ID NO:331 (MP107)、SEQ ID NO:358(ZM6.3)、SEQ ID NO:390 (ZM6.22v2)、SEQ ID NO:423或SEQ ID NO:424。

    35.根据实施例29所述的分离的多肽,其中所述多肽在与缺乏所述氨 基酸修饰的对照大范围核酸酶进行比较时具有提高的大范围核酸 酶活性。

    36.根据实施例29所述的分离的多肽,其中所述对照大范围核酸酶选 自SEQ ID NO:1(LIG3-4)、SEQ ID NO:86(MHP77)、SEQ ID  NO:250(MHP77.3)、SEQ ID NO:270(MS26+)、SEQ ID  NO:271、SEQ ID NO:282(MHP14)、SEQ ID NO:283 (MHP14+)、SEQ ID NO:329(MP107)、SEQ ID NO:356 (ZM6.3)、SEQ ID NO:389(ZM6.22v2)、SEQ ID NO:429或 SEQ ID NO:435。

    37.根据实施例29所述的分离的多肽,其中所述提高的大范围核酸酶 活性的证据是:

    a)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更 高的酵母测定得分;或

    b)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更 高的目标位点突变率;或

    c)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更 高的体外切割;或

    d)(a)、(b)和(c)的任何组合。

    38.一种组合物,其包含至少一种或多种实施例29所述的多肽。

    39.一个制备大范围核酸酶的方法,所述大范围核酸酶在一定温度范 围内具有提高的活性,所述方法包括:

    a)通过在对应于SEQ ID NO:1的位置的氨基酸位置处修饰至少 一个氨基酸来制备大范围核酸酶变体,所述SEQ ID NO:1的 位置选自位置2、12、16、22、23、31、36、43、50、56、 58、59、62、71、72、73、80、81、82、86、91、95、98、 103、113、114、116、117、118、121、124、128、129、 131、147、151、153、159、160、161、162、163、164、 165、166、167、168、169、170、171、172、173、174、 175、176、177、178、179、180、182、183、184、185、 186、187、188、189、190、191、192、194、195、196、 197、200、203、204、209、222、232、236、237、246、 254、258、267、278、281、282、289、308、311、312、 316、318、319、334、339、340、342、345、346348、以及 它们的组合;以及

    b)选择来自步骤a)的所述大范围核酸酶变体,并且筛选能够在 16℃至37℃之间并包括16℃和37℃的温度范围内裂解DNA 目标序列的所述大范围核酸酶变体。

    40.根据实施例39所述的方法,其中所述温度的范围包括:

    a)16℃;

    b)18℃;

    c)20℃;

    d)24℃;

    e)28℃;

    f)30℃;

    g)37℃;或

    h)a)、b)、c)、d)、e)、f)、h)、g)和g)的任何组 合。

    41.一种制备大范围核酸酶的方法,所述大范围核酸酶在与对照大范 围核酸酶进行比较时具有提高的大范围核酸酶活性,所述方法包 括:

    a)通过在对应于SEQ ID NO:1的位置的氨基酸位置处修饰至少 一个氨基酸来制备大范围核酸酶变体,所述SEQ ID NO:1的 位置选自位置2、12、16、22、23、31、36、43、50、56、 58、59、62、71、72、73、80、81、82、86、91、95、98、 103、113、114、116、117、118、121、124、128、129、 131、147、151、153、159、160、161、162、163、164、 165、166、167、168、169、170、171、172、173、174、 175、176、177、178、179、180、182、183、184、185、 186、187、188、189、190、191、192、194、195、196、 197、200、203、204、209、222、232、236、237、246、 254、258、267、278、281、282、289、308、311、312、 316、318、319、334、339、340、342、345、346、348、以 及它们的组合;以及

    b)选择来自步骤a)的所述大范围核酸酶变体,并且筛选在与对 照大范围核酸酶进行比较时具有提高的大范围核酸酶活性的 所述变体。

    42.根据实施例41所述的方法,其中所述提高的大范围核酸酶活性的 证据是:

    a)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更 高的酵母测定得分;或

    b)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更 高的目标位点突变率;或

    c)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更 高的体外切割;或

    d)(a)、(b)和(c)的任何组合。

    43.根据实施例所述的分离的或重组的多核苷酸1,其中所述大范围 核酸酶多肽包含接头多肽,其中所述接头多肽包括:

    a)SEQ ID NO:420;

    b)SEQ ID NO:421;

    c)SEQ ID NO:422;或

    d)由在对应于SEQ ID NO:1的位置156至193的位置处的任何 可能的氨基酸组成的氨基酸序列。

    44.一种组合物,其包含至少一种或多种实施例1所述的多核苷酸。

    45.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多 肽包含在对应于SEQ ID NO:1的位置的氨基酸位置处具有至少一 个氨基酸修饰的氨基酸序列,所述SEQ ID NO:1的位置选自位置 16、22、50、56、59、71、81、103、121、153、185、209、 222、246、258、281、308、316、345、346、以及它们的组合, 并且其中所述多肽能够识别和裂解包含SEQ ID NO:2的大范围核 酸酶目标位点。

    46.根据实施例45所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码与SEQ ID NO:1具有至少80%的序列同一性的大范围核 酸酶多肽。

    47.根据实施例45所述的分离的或重组的多核苷酸,其中所述至少一 个氨基酸修饰包括在图5A-5C中所示氨基酸修饰中的任何一个。

    48.根据实施例45所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID  NO:14、15、16、17、18、19、20、21、22、23、24、25、26、 27、28、29、30、31、32、33、34、35、36、37和38。

    49.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多 肽包含在对应于SEQ ID NO:86的位置的氨基酸位置处具有至少 一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:86的位置选自 位置2、12、16、22、23、36、43、50、56、58、59、72、73、 81、86、91、95、103、113、114、120、121、124、128、129、 131、151、153、200、204、209、232、236、237、246、254、 258、267、281、308、311、312、316、319、334、339、340、 342、以及它们的组合,并且其中所述多肽能够识别和裂解包含 SEQ ID NO:85的大范围核酸酶目标位点。

    50.根据实施例49所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码与SEQ ID NO:86具有至少80%的序列同一性的大范围 核酸酶多肽。

    51.根据实施例49所述的分离的或重组的多核苷酸,其中所述至少一 个氨基酸修饰包括在图9A-9D中所示氨基酸修饰中的任何一个。

    52.根据实施例49所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID  NO:87、88、89、90、91、92、93、94、95、96、97、98、99、 100、101、102、103、104、105、106、107、108、109、110、 111、112、113、114、115、116、117、118、119、120、121、 122、123、124、125、126、127、128、129、130、131、132、 133、134、135、136、137、138、139、140、141、142、143、 144、145、146、147、148、149、150、151、152、153、154、 155、156、157、158、159、160、161、162、163、164、165、 166、167、251、252和253。

    53.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多 肽包含在对应于SEQ ID NO:270的位置的氨基酸位置处具有至少 一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:270的位置选自 位置16、22、50、71、185、246、258、316、以及它们的组合, 并且其中所述多肽能够识别和裂解包含SEQ ID NO:269的大范围 核酸酶目标位点。

    54.根据实施例53所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID  NO:272、273、274和275。

    55.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多 肽包含在对应于SEQ ID NO:282的位置的氨基酸位置处具有至少 一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:282的位置选自 位置12、16、22、31、50、56、59、62、81、98、103、105、 116、118、121、153、159、160、161、162、163、164、165、 166、167、168、169、170、171、172、173、174、175、176、 177、178、179、180、182、183、184、185、186、187、188、 189、190、191、192、258、281、308、312、316、319、以及它 们的组合,并且其中所述多肽能够识别和裂解包含SEQ ID  NO:281的大范围核酸酶目标位点。

    56.根据实施例55所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码与SEQ ID NO:282具有至少80%的序列同一性的大范围 核酸酶多肽。

    57.根据实施例55所述的分离的或重组的多核苷酸,其中所述至少一 个氨基酸修饰包括在图10A-10C中所示氨基酸修饰中的任何一 个。

    58.根据实施例55所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID  NO:284、285、286、287、288、289、290、291、292、293、 294、295、296、297和298。

    59.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多 肽包含在对应于SEQ ID NO:329的位置的氨基酸位置处具有至少 一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:329的位置选自 位置12、32、50、56、80、105、124、129、131、153、185、 311、316、318、340、以及它们的组合,并且其中所述多肽能够 识别和裂解包含SEQ ID NO:328的大范围核酸酶目标位点。

    60.根据实施例59所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码与SEQ ID NO:329具有至少80%的序列同一性的大范围 核酸酶多肽。

    61.根据实施例59所述的分离的或重组的多核苷酸,其中所述至少一 个氨基酸修饰包括在图11中所示氨基酸修饰中的任何一个。

    62.根据实施例59所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID  NO:330、331、332、333、334、335、336、337、338、339、340 和341。

    63.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多 肽包含在对应于SEQ ID NO:356的位置的氨基酸位置处具有至少 一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:356的位置选自 位置12、24、36、50、56、62、73、80、124、129、147、182、 203、237、252、311、316、318、340、348、以及它们的组合, 并且其中所述多肽能够识别和裂解包含SEQ ID NO:355的大范围 核酸酶目标位点。

    64.根据实施例63所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码与SEQ ID NO:356具有至少80%的序列同一性的大范围 核酸酶多肽。

    65.根据实施例63所述的分离的或重组的多核苷酸,其中所述至少一 个氨基酸修饰包括在图12中所示氨基酸修饰中的任何一个。

    66.根据实施例63所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID  NO:357、358、359、360、361、362、363、364、365、366、 367、368、369、370、和371。

    67.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多 肽包含在对应于SEQ ID NO:389的位置的氨基酸位置处具有至少 一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:389的位置选自 位置12、50、56、124、129、131、153、211、237、311、316、 和位置318、以及它们的组合,并且其中所述多肽能够识别和裂 解包含SEQ ID NO:388的大范围核酸酶目标位点。

    68.根据实施例67所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码与SEQ ID NO:389具有至少80%的序列同一性的大范围 核酸酶多肽。

    69.根据实施例67所述的分离的或重组的多核苷酸,其中所述至少一 个氨基酸修饰包括在图13中所示氨基酸修饰中的任何一个。

    70.根据实施例67所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID  NO:390、391、392、393、394、395、396、397、398、399、 400、401、402和403。

    72.酵母、植物、植物细胞、外植体或种子,其包含由实施例36-42 所述的方法创建的大范围核酸酶。

    73.一种在酵母或植物细胞的基因组中导入双链断裂的方法,所述方 法包括:

    a)使至少一种在其基因组中包含大范围核酸酶识别位点的植物 或酵母细胞与大范围核酸酶多肽变体接触,所述大范围核酸 酶多肽选自SEQ ID NO:14、15、16、17、18、19、20、21、 22、23,24、25、26、27、28、29、30、31、32、33、34、 35、36、37、38、87、88、89、90、91、92、93、94、95、 96、97、98、99、100、101、102、103、104、105、106、 107、108、109、110、111、112、113、114、115、116、 117、118、119、120、121、122、123、124、125、126、 127、128、129、130、131、132、133、134、135、136、 137、138、139、140、141、142、143、144、145、146、 147、148、149、150、151、152、153、154、155、156、 157、158、159、160、161、162、163、164、165、166、 167、251、252、253、272、273、274、275、272、273、 274、275、284、285、286、287、288、289、290、291、 292、293、294、295、296、297、298、330、331、332、 333、334、335、336、337、338、339、340、341、357、 358、359、360、361、362、363、364、365、366、367、 368、369、370、371、390、391、392、393、394、395、 396、397、398、399、400、401、402和403,其中所述大范 围核酸酶变体能够在所述识别位点诱导双链断裂;以及

    b)选择来自a)的酵母或植物细胞,并且针对所述识别序列的任 何修饰筛选所述酵母或植物细胞。

    74.一种将目的多核苷酸整合至植物或酵母细胞的基因组中的识别位 点的方法,所述方法包括:

    a)使至少一种在其基因组中包含大范围核酸酶识别位点的植物 或酵母细胞与下列物质接触:

    (i)大范围核酸酶多肽变体,其选自SEQ ID NO:14、15、 16、17、18、19、20、21、22、23,24、25、26、27、 28、29、30、31、32、33、34、35、36、37、38、87、 88、89、90、91、92、93、94、95、96、97、98、99、 100、101、102、103、104、105、106、107、108、 109、110、111、112、113、114、115、116、117、 118、119、120、121、122、123、124、125、126、 127、128、129、130、131、132、133、134、135、 136、137、138、139、140、141、142、143、144、 145、146、147、148、149、150、151、152、153、 154、155、156、157、158、159、160、161、162、 163、164、165、166、167、251、252、253、272、 273、274、275、272、273、274、275、284、285、 286、287、288、289、290、291、292、293、294、 295、296、297、298、330、331、332、333、334、 335、336、337、338、339、340、341、357、358、 359、360、361、362、363、364、365、366、367、 368、369、370、371、390、391、392、393、394、 395、396、397、398、399、400、401、402和403, 其中所述大范围核酸酶变体能够在所述识别位点诱导双 链断裂;和

    (ii)包含目的多核苷酸的DNA片段;

    b)选择至少一种植物或酵母细胞,其包含在所述识别位点整合 的目的多核苷酸盒。

    75.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸,所述多 肽包含在对应于SEQ ID NO:429的位置的氨基酸位置处具有至少 一个氨基酸修饰的氨基酸序列,所述SEQ ID NO:429的位置选自 位置16、22、50、71、185、246、258、316、以及它们的组合, 并且其中所述多肽能够识别和裂解包含SEQ ID NO:423的大范围 核酸酶目标位点。

    76.根据实施例75所述的分离的或重组的多核苷酸,其中所述核苷酸 序列编码大范围核酸酶多肽,所述大范围核酸酶多肽选自SEQ ID  NO:430、431和432。

    77.一种分离的或重组的多核苷酸,其编码SEQ ID NO:436的大范围 核酸酶多肽,其中所述多肽能够识别和裂解包含SEQ ID NO:424 的大范围核酸酶目标位点。

    实验

    实例1

    玉米幼胚的转化

    可通过各种已知在植物中有效的方法完成转化,包括颗粒介导的递 送、农杆菌-介导的转化、PEG-介导的递送和电穿孔。

    a.颗粒介导的递送

    使用颗粒递送转化玉米幼胚如下进行。培养基配方沿循以下。

    给穗去皮,表面在30%Clorox漂白剂加0.5%Micro洗涤剂中消毒20 分钟,然后用无菌水漂洗两次。将幼胚分离并放置胚轴一侧向下(子叶盘 一侧向上),每板25个胚,在560Y培养基上培养4小时,然后对准2.5cm 的目标区域准备轰击。另选地,在如上所述轰击之前在26℃置于560Y上4 小时,在此之前在将分离的胚放置在560L(诱导培养基)上、在黑暗条件 下从26℃至37℃的温度范围内放置8至24小时。

    使用标准分子生物学技术构建包含双链断裂诱导剂和供体DNA的质 粒,与包含发育基因ODP2(AP2结构域转录因子ODP2(胚珠发育蛋白 2);US20090328252 A1)和Wushel(US2011/0167516)的质粒联合轰 击。

    如下述使用水溶性阳离子类脂TfxTM-50(Cat#E1811,Promega,Madison, WI,USA)将所述质粒和目的DNA沉淀至0.6μm(平均直径r)的金球剂 上。使用1g的质粒DNA和任选地用于联合轰击的其它构建体,诸如每种 50ng(0.51)的包含发育基因ODP2(AP2结构域转录因子ODP2(胚珠发 育蛋白2);US20090328252 A1)和Wushel的质粒,在冰上制备DNA溶 液。为了预混合DNA,将20μl制备的金颗粒(15mg/ml)和5LTfx-50加入 水中并小心混合。在微量离心机中以10,000rpm离心1分钟将金颗粒制成球 剂,去除上清液。用100ml的100%乙醇小心漂洗所得的球剂而不使球剂重 悬,然后小心去除乙醇漂洗液。加入1051的100%乙醇,通过短暂超声处 理使所述颗粒重悬。然后,将10μl点在每个大载体的中心,在轰击前使其 干燥约2分钟。

    另选地,使用氯化钙(CaCl2)沉淀方法,通过将100μl制备的钨球剂 溶液、在Tris EDTA缓冲液中的10μl(1μg)DNA(1μg总DNA)、100μl 2.5M CaCl2和10μl 0.1M亚精胺混合,将所述质粒和目的DNA沉淀在 1.1μm(平均直径)的钨球剂上。将每一试剂顺次加入钨粒悬浮液,并混 合。将最终的混合物短暂超声处理并且使其在持续涡旋下温育10分钟。在 沉淀期后,将所述管短暂离心,去除液体,然后将所述颗粒用500ml 100% 乙醇洗涤,之后是30秒离心。再一次,去除液体,然后将105μl 100%乙醇 加入最终的钨颗粒球剂。针对粒子枪轰击,将所述钨/DNA颗粒短暂超声处 理。将10μl的钨/DNA颗粒点在每个大载体的中央,然后在轰击前使点上 的颗粒干燥约2分钟。

    用Biorad氦气枪以#4水平轰击样品平板。所有的样品以450PSI接收 一枪,带有取自每管制备的颗粒/DNA的总共十等份试样。

    在轰击后,所述胚在560P(维持培养基)上、在26℃至37℃的温度 范围温育12至48小时,然后放置在26℃。在5至7天后,将所述胚转移 至包含3mg/升双丙氨磷的560R选择培养基,在26℃每2周继代培养一 次。在选择后约10周,将选择-抗性愈伤组织转移至288J培养基以引发植 物再生。在体细胞胚成熟(2-4周)后,将良好发育的体细胞胚转移至用于 发芽的培养基,转移至有光照的培养室。约7-10天后,将发育中的幼苗转 移至试管中不含激素的272V培养基培养7-10天直到幼苗良好建成。然后 将植物转移插入包含栽培土的单位空间(相当于2.5″罐),在生长室生长1 周,随后在温室生长额外1-2周,然后转移至Classic 600罐(1.6加仑)并 生长至成熟。监控植物并针对转化效率、和/或再生能力的修饰来打分。

    诱导培养基(560L)包含4.0g/l N6基础盐(SIGMA C-1416)、 1.0ml/l Eriksson’s维生素Mix(1000X SIGMA-1511)、0.5mg/l盐酸硫胺 素、20.0g/l蔗糖、1.0mg/l 2,4-D、和2.88g/l L-脯氨酸(在用KOH调节至 pH 5.8后用D-I H2O补齐体积);2.0g/l固化剂(在用D-I H2O补齐体积之 后添加);和8.5mg/l硝酸银(在培养基灭菌并冷却至室温后添加)。

    维持培养基(560P)包含4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/l  Eriksson’s维生素Mix(1000X SIGMA-1511)、0.5mg/l盐酸硫胺素、 30.0g/l蔗糖、2.0mg/l 2,4-D、和0.69g/l L-脯氨酸(在用KOH调节至pH 5.8 后用D-I H2O补齐体积);3.0g/l固化剂(在用D-I H2O补齐体积之后添 加);和0.85mg/l硝酸银(在培养基灭菌并冷却至室温后添加)。

    轰击培养基(560Y)包含4.0g/l N6基础盐(SIGMA C-1416)、 1.0ml/l Eriksson’s维生素Mix(1000X SIGMA-1511)、0.5mg/l盐酸硫胺 素、120.0g/l蔗糖、1.0mg/l 2,4-D、和2.88g/l L-脯氨酸(在用KOH调节至 pH 5.8后用D-I H2O补齐体积);2.0g/l固化剂(在用D-I H2O补齐体积之 后添加);和8.5mg/l硝酸银(在培养基灭菌并冷却至室温后添加)。

    Selection诱导培养基(560R)包含4.0g/l N6基础盐(SIGMA C- 1416)、1.0ml/l Eriksson’s维生素Mix(1000X SIGMA-1511)、0.5mg/l盐 酸硫胺素、30.0g/l蔗糖、和2.0mg/l 2,4-D(在用KOH调节至pH 5.8后用 D-I H2O补齐体积);3.0g/l固化剂(在用D-I H2O补齐体积之后添加); 和0.85mg/l硝酸银以及3.0mg/l双丙氨磷(在培养基灭菌并冷却至室温后添 加)。

    植物再生培养基(288J)包含4.3g/l MS盐(GIBCO 11117-074)、 5.0ml/l MS维生素原液(0.100g烟酸、0.02g/l盐酸硫胺素、0.10g/l盐酸吡哆 醇、和0.40g/l甘氨酸,用D-I H2O补齐体积)(Murashige和Skoog (1962)Physiol.Plant.15:473)、100mg/l肌醇、0.5mg/l玉米素、60g/l蔗 糖、和1.0ml/l的0.1mM脱落酸(在调节至pH 5.6后用D-I H2O补齐体 积);3.0g/l固化剂(在用D-I H2O补齐体积之后添加);和1.0mg/l吲哚 乙酸以及3.0mg/l双丙氨磷(在培养基灭菌并冷却至60℃后添加)。

    无激素培养基(272V包含4.3g/l MS盐(GIBCO 11117-074),5.0ml/l MS维生素原液(0.100g烟酸、0.02g/l盐酸硫胺素、0.10g/l盐酸吡哆醇、和 0.40g/l甘氨酸,用D-I H2O补齐体积)、0.1g/l肌醇和40.0g/l蔗糖(在调节 至pH 5.6后用D-I H2O补齐体积);和6g/l细菌培养用琼脂(用D-I H2O 补齐体积后添加)、灭菌并冷却至60℃。

    b.农杆菌介导的转化

    农杆菌介导的转化基本上如Djukanovic等人.(2006)Plant Biotech J 4:345-57所述进行。简而言之,从灭菌过的内核解剖出10-12天大的幼胚 (大小为0.8-2.5mm)并放置在液体培养基上(4.0g/L N6基础盐(Sigma  C-1416)、1.0ml/L Eriksson′s维生素Mix(Sigma E-1511)、1.0mg/L盐酸 硫胺素、1.5mg/L 2,4-D、0.690g/L L-脯氨酸、68.5g/L蔗糖、36.0g/L葡萄 糖、pH 5.2)。在胚芽搜集之后,用浓度为0.35-0.45OD550的1ml农杆菌 替换所述培养基。在室温将玉米胚芽与农杆菌温育5分钟,然后将所述混 合物倒入培养基平板,其包含4.0g/L N6基础盐(Sigma C-1416)、1.0ml/L  Eriksson′s维生素Mix(Sigma E-1511)、1.0mg/L盐酸硫胺素、1.5mg/L 2, 4-D、0.690g/L L-脯氨酸、30.0g/L蔗糖、0.85mg/L硝酸银、0.1nM乙酰丁 香酮、和3.0g/L固化剂,pH 5.8。将胚芽轴朝下在20℃、黑暗中温育3 天,然后在28℃、黑暗中温育4天,然后转移至新培养基平板,其包含 4.0g/L N6基础盐(Sigma C-1416)、1.0ml/L Eriksson′s维生素Mix(Sigma  E-1511)、1.0mg/L盐酸硫胺素、1.5mg/L 2,4-D、0.69g/L L-脯氨酸、 30.0g/L蔗糖、0.5g/L MES缓冲液、0.85mg/L硝酸银、3.0mg/L双丙氨磷、 100mg/L羧苄青霉素和6.0g/L琼脂,pH 5.8。每三周对培养继代培养直至鉴 定出转基因事件。通过将少量组织转移至再生培养基(4.3g/L MS盐 (Gibco 11117)、5.0ml/L MS维生素原液、100mg/L肌醇、0.1μM ABA、 1mg/L IAA、0.5mg/L玉米素、60.0g/L蔗糖、1.5mg/L双丙氨磷、100mg/L 羧苄青霉素、3.0g/L固化剂、pH 5.6),并且在28℃、黑暗中温育两周来 诱导体细胞胚胎形成。将带有可见芽和根的所有材料转移至培养基,其包 含4.3g/L MS盐(Gibco 11117)、5.0ml/L MS维生素原液、100mg/L肌 醇、40.0g/L蔗糖、1.5g/L固化剂、pH 5.6,并且在28℃、人工光照下温 育。一周后,将幼苗移入包含相同培养基的玻璃试管,生长直至它们被取 样和/或被移植到土壤中。

    实例2

    BBM增强转化的瞬时表达

    可修改转化规程的参数以确保BBM活性是瞬时的。一个此类方法涉 及以允许转录和表达的方式来沉淀包含BBM的质粒,但排除了后续的 DNA释放,例如通过化学PEI。

    在一个实例中,将所述BBM质粒沉淀在带有PEI的金颗粒上,而使用 标准氯化钙方法将要整合的转基因表达盒(UBI::moPAT~GFPm::PinII; moPAT是玉米最优化的PAT基因)沉淀在金颗粒上。

    简而言之,用PEI涂覆金颗粒如下。首先,清洗所述金颗粒。在微量 离心管中称量35mg金颗粒,平均直径(A.S.I.#162-0010)1.0,加入1.2ml 无水乙醇并涡旋1分钟。将离心管在室温温育15分钟,然后使用微型离心 机在4℃、高速离心15分钟。弃去上清液,加入新鲜的1.2ml等份试样的 乙醇(EtOH),涡旋一分钟,离心一分钟,再次弃去上清液(这个操作重 复两次)。加入新鲜的1.2ml等份试样的乙醇,将这个悬浮液(乙醇中的金 颗粒)在-20℃保存数周。为了用聚乙烯亚胺(PEI;Sigma#P3143)涂覆 颗粒,将250μl洗过的金颗粒/乙醇混合物离心并弃去乙醇。将所述颗粒在 100μl ddH2O中洗涤一次以去除残余的乙醇,加入250μl的0.25mM PEI, 之后是脉冲超声处理所述颗粒,然后将所述离心管放入干冰/乙醇浴中以瞬 间冻结所述悬浮液,然后将冻结的悬浮液冻干过夜。在此刻,可将干燥、 包被的颗粒在-80℃保存至少3周。在使用之前,用250μl等分式样的 2.5mM HEPES缓冲液、pH 7.1,以1x脉冲超声处理将所述颗粒漂洗3次, 然后在每次离心前快速涡旋。然后将所述颗粒悬浮于终体积250μl的 HEPES缓冲液。在附接DNA之前,将25μl等分式样的颗粒加入新管。为 了附接未涂覆的DNA,用脉冲超声处理所述颗粒,然后加入1μg的DNA (在5μl水中),之后是用Pipetteman通过上下吸移几次来混合并且温育 10分钟。短暂旋转所述颗粒(即10秒),去除所述上清液,加入60μl乙 醇。将带有PEI沉淀的DNA-1的颗粒在60μl的乙醇中清洗两次。将所述颗 粒离心,弃去上清液,将所述颗粒重悬浮在45μl水中。为了附接第二种 DNA(DNA-2),沉淀采用了TFX-50。将45μl的颗粒/DNA-1悬浮液短暂 超声处理,然后加入5μl的100ng/μl的DNA-2和2.5μl的TFX-50。将所述 溶液置于旋转摇动器10分钟,以10,000g离心1分钟。去除上清液,将所 述颗粒重悬于60μl的乙醇。将所述溶液点在大载体上,然后使用PDS-1000 的标准规程,将已经依次附接了DNA-1和DNA-2的金颗粒递送到10DAP  Hi-II幼胚的盾片细胞。针对这个实验,所述DNA-1质粒包含 UBI::RFP::pinII表达盒,DNA-2包含UBI::CFP::pinII表达盒。轰击两天 后,当许多红蓝细胞出现在幼胚表面时就观察到了CFP和RFP荧光标记的 瞬时表达。然后将所述培养置于非选择培养基上,使其在对稳定集落评分 之前生长3周。在这个3周期后,观察到10个多细胞的、稳定表达的蓝色 集落,相比之下只有一个红色集落。这表明可使用PEI沉淀以有效导入 DNA用于瞬时表达,同时大大降低PEI导入的DNA的整合并且因此降低 RFP表达转基因事件的恢复。这样,可使用PEI沉淀以递送BBM和/或 WUS2的瞬时表达。

    例如,使用PEI将所述颗粒首先涂覆上UBI::BBM::pinII,然后使用 TFX-50涂覆上UBI::moPAT~YFP,然后轰击计入幼胚表面的盾片细胞。 PEI介导的沉淀在幼胚的表面产生高频的瞬时表达的细胞和极低频率的稳定 转化子的恢复(相对于TFX-50方法)。因此,期望PEI沉淀的BBM盒瞬 时表达并且刺激在所述组织的被轰击表面(即盾片细胞表面)胚胎生成的 爆发生长,但这个质粒不会整合。期望从Ca++/金颗粒释放的PAT~GFP质 粒整合并且表达选择性标记,其频率导致基本上改善了转基因事件的恢 复。作为对照处理,将包含UBI::GUS::pinII(而不是BBM)的PEI沉淀颗 粒与PAT~GFP/Ca++颗粒混合。来自两种处理的幼胚被移入包含3mg/l双 丙氨磷的培养基。6-8周后,期望相对于对照处理(PEI/GUS),在 PEI/BBM处理中会观察到高得多频率的GFP+、双丙氨磷抗性的愈伤组 织。

    作为一种替代方法,将BBM质粒沉淀在带有PEI的金颗粒上,然后导 入幼胚表面的盾片细胞中,随后BBM基因的瞬时表达引发了胚胎发生生长 的快速增殖。在这个诱导生长期间,采用针对玉米的标准方法用农杆菌处 理所述外植体(参见实例1),T-DNA递送至细胞中导入转基因表达盒诸 如UBI::moPAT~GFPm::pinII。在共培养后,允许在普通培养基上回收外植 体,然后移到包含3mg/l双丙氨磷的培养基上。6-8周后,期望相对于对照 处理(PEI/GUS),在PEI/BBM处理中会观察到高得多频率的GFP+、双 丙氨磷抗性的愈伤组织。

    可以期望通过瞬时表达BBM和/或WUS2多核苷酸产物以“快速启 动”愈伤组织生长。这可通过递送BBM和WUS25′-加帽的多腺苷化的 RNA、包含BBM和WUS2DNA的表达盒、或BBM和/或WUS2蛋白来实 现。所有这些分子可利用基因枪进行输送。例如使用Ambion’s mMessage  mMachine试剂盒可以很容易制备5′-加帽的多腺苷化的BBM和/或WUS2 RNA。RNA与DNA共递送,所述DNA包含目的多核苷酸和用于选择/筛 选的标记,诸如Ubi::moPAT~GFPm::PinII。期望接收了所述RNA的细胞会 立即开始更快地分裂并且这些细胞的大部分将整合所述农艺基因。这些事 件可以进一步被验证作为是转基因的克隆集落,因为它们还会表达 PAT~GFP融合蛋白(并且因此会在适当的光照下显示绿色荧光)。然后从 这些胚芽再生的植物可针对所述目的多核苷酸的存在进行筛选。

    实例3

    DNA改组以创建LIG3-4大范围核酸酶的变体

    A.LIG3-4大范围核酸酶和LIG3-4识别序列

    选择包含LIG3-4识别序列的内源性玉米基因组目标位点(SEQ ID  NO:2)用于设计定制的双链断裂诱导剂。所述LIG3-4识别序列是22bp的 多核苷酸,其具有下述序列:ATATACCTCACACGTACGCGTA(SEQ ID  NO:2)。

    如美国专利公开2009-0133152A1中所述,修饰野生型I-CreI大范围核 酸酶(SEQ ID NO:3)以制备设计来识别LIG3-4识别序列的LIG3-4大范围 核酸酶。野生型I-CreI大范围核酸酶是同型二聚体。为了识别LIG3-4识别 序列,对每个单体制备了不同的替换并且针对每个单体,编码序列连接了 接头序列以制备单链融合多肽(LIG3-4,SEQ ID NO:1)。

    B.创建LIG3-4大范围核酸酶变体

    通过基因改组方法创建LIG3-4大范围核酸酶变体。基因改组是一种迭 代过程,其由名为“轮次”的离散循环组成。每个轮次是亲本选择、文库 构建、基因评估和命中选择的循环。来自一个轮次的最佳命中称为下一轮 次的亲本基因。

    LIG3-4大范围核酸酶优化的第一相是设计来导入存在于天然存在的大 范围核酸酶蛋白的氨基酸替换。基于LIG3-4蛋白模板(SEQ ID NO:1)制 备改组的基因变体文库,所用技术包括家族改组、单基因改组、回交、半 合成和合成改组(Zhang J-H等人(1997)Proc Natl Acad Sci 94,4504- 4509;Crameri等人(1998)Nature 391:288-291;Ness等人(2002)Nat  Biotech 20:1251-1255)。文库是基于系统发育的序列多样性、随机诱变, 结构特征部基于蛋白数据银行中的I-CreI晶体结构(PDB; www.pdb.org/pdb/home/home.do)。图1中显示了若干大范围核酸酶蛋白 (SEQ ID NO:4-13),包括I-CreI(SEQ ID NO:3)的系统发育多样性。多 样性被定义为存在于蛋白组内的、在所有蛋白不包含相同氨基酸的任何位 置处的氨基酸。

    所述改组方法导致生成带有氨基酸修饰重组的LIG3-4变体,非预期的 氨基酸修饰是由于诱变聚合酶链反应(PCR)、缺失和插入(SEQ ID  NO:14-38)。SEQ ID NO:40-65)中显示了用于在酵母中表达这些大范围核 酸酶的对应的DNA序列。

    实例4

    用于鉴定具有提高的活性的大范围核酸酶变体的酵母筛选系统。

    生成酵母筛选菌株作为用于鉴定大范围核酸酶变体的宿主。将酵母 Ade2基因(Genetika 1987Jul-23(7):1141-8)(SEQ ID NO:82)用作可见 标记以及图2中描绘的方案中的选择。对应于Ade2编码序列的最前1000 个核苷酸(SEQ ID NO:83)(Ade25’片段)和Ade2编码序列的最后1011 个核苷酸(Ade23’片段)的基因片段被包括酵母ura3基因和大范围核酸酶 识别位点的片段断开。使用了在图2中描绘的构建体的三种型式。质粒 pHD1327(SEQ ID NO:84)包括ZM6.3、ZM6.22、MHP42、MHP107和 LIG3-4识别位点。pVER8145包括LIG3-4识别位点,而pVER8189包括 MHP14、MHP77和LIG3-4识别位点。在Ade25’片段和Ade23’片段之间 有305个核苷酸的序列重复。用所得的构建体替换酵母菌株BY4247的 Ade2基因(15号染色体核苷酸位置566193-564480)。所得的酵母筛选菌 株VER8145、VER8189和HD1327可表征为BY4742MATa his3deltal  leu2delta0 lys2delta0 ura3delta0Gal2+)。如果大范围核酸酶切割发生在重复 序列之间,可发生同源重组,产生官能的Ade2基因。

    官能的Ade2基因的生成可被用作选择:在酵母细胞在不含腺嘌呤的培 养基上生长时,只有具有官能的Ade2基因的那些能够生长。

    官能的Ade2基因的生成也可被用于筛选。带有功能性Ade2基因的酵 母细胞是白色的,而缺乏Ade2功能的那些由于在腺嘌呤生物合成途径早期 积累代谢物表现出红色的色素沉着,导致如图2和3中显示的带有白色分 段的红色菌落。白色分段的程度,有时延伸至整个菌落,表明了大范围核 酸酶切割活性的量。由于分段表型是大范围核酸酶活性的定性测量,采用 了0-4的数字打分系统。如图3所示,0分表明没有观察到白色分段(没有 大范围核酸酶切割);4分表明完全白色菌落(识别位点的完全切割);1- 3分表明中间白色分段表型(和中间程度的识别位点切割)。

    实例5

    大范围核酸酶表达质粒

    使用质粒p415GAL1(ATCC;Nucleic Acids Res.1994Dec 25;22 (25):5767-8)构建大范围核酸酶表达质粒。使用引物MN031(SEQ ID  NO:66)和MN022(SEQ ID NO:67)PCR扩增LIG3-4编码序列并作为 XbaI-XhoI限制片段插入p415GAL1。所得构建体(pVER8134;SEQ ID  NO:68)显示于图4。所述大范围核酸酶表达质粒包含着丝粒复制起点和用 于在酵母中生长的leu2营养标记,以及F1复制起点和用于在大肠杆菌(E. coli)中生长的氨苄青霉素抗生素抗性基因。所述大范围核酸酶表达盒由半 乳糖诱导的GAL1启动子和CYC1终止子组成。所述大范围核酸酶编码序 列之前是核定位信号(SEQ ID NO:69),其编码9个氨基酸的氨基末端 (MAPKKKRKV,SEQ ID NO:70)和羧基末端6X组氨酸标签(SEQ ID  NO:71)以助于蛋白纯化。

    通过将LIG3-4大范围核酸酶(pVER8134的核苷酸位置500-1549, SEQ ID NO:68)与大范围核酸酶变体交换来构建类似的大范围核酸酶表达 质粒。

    实例6

    转化酵母筛选菌株(YSS)并对酵母中大范围核酸酶活性进行筛选

    如实例5中所述,将改组的大范围核酸酶文库(其包含大范围核酸酶 变体)插入表达载体pVER8134,并通过下列步骤转化进包含对应的大范围 核酸酶识别位点(实例3)的酵母筛选菌株。

    用所述酵母筛选菌株的单菌落接种3mL选择培养基的培养物,在30℃ 生长过夜。在第二天,用2ml的过夜培养物启动50ml YPD培养物(MP  Biomedical),在30℃生长过夜。在第二天,通过4000rpm离心收集细 胞。将所述细胞重悬于100ml冰水并再次离心。然后在1.2M山梨醇中清洗 所述细胞,之后在30℃用2ml的10mM Tris pH 8.0、1mM EDTA、100mM 乙酸锂、10mM DTT、0.6M山梨醇摇动处理30分钟。通过离心回收所述细 胞,在40ml 1.2M山梨醇中清洗并最终重悬于250微升1.2M山梨醇。在冰 上将50微升等分式样转移至试管。加入最多至5微升的DNA(100-500纳 克)。在冰上将所述悬浮液转移至0.2cm电穿孔比色杯。以1.5kV、 200ohms、25microF(脉冲时间5毫秒)的脉冲充电进行电穿孔。加入 1mL YPD培养基(MP Biomedical),在30℃使细胞复苏1-2小时。将细胞 离心,重悬于100uL 1M山梨醇并接种至不含亮氨酸并且包含2%半乳糖的 选择培养基上。将所得的酵母菌落在各种温度(范围从22至37℃)温育7- 10天。来源于它的I-CreI和大范围核酸酶在或高于37℃具有最大活性。在 从22至37℃的温度范围进行筛选,以便观察在较低温度下活性的提高,这 与某些生物系统有关(例如植物细胞、植物细胞培养物等)。在出现红/白 分段表型时,观察到了大范围核酸酶活性的指示。将具有超过亲本大范围 核酸酶的增大的白色分段(表明菌落表达的大范围核酸酶具有提高的大范 围核酸酶活性)、也被称作“命中”和有时全白的菌落分离用于进一步分 析。

    将这些潜在的“命中”生长在液体培养基中以提高细胞密度。提取 DNA并用于转化大肠杆菌(E.coli)。从大肠杆菌(E.coli)培养物提取质 粒DNA。如上所述,将对应与所述潜在的“命中”的质粒DNA再次转化 酵母筛选菌株。

    如果在包含所述大范围核酸酶变体的酵母细胞中白色分段表型提高 (在与包含所述亲本大范围核酸酶的酵母进行比较时)得到重复,所述变 体被宣布为“确认命中”。测定大范围核酸酶编码序列用于确认命中。每 个确认命中代表一种大范围核酸酶变体,并且在各种温度下基于实例4中 所述0-4级分到一个大范围核酸酶活性得分。

    表2显示了在22℃和30℃、带有2%半乳糖测定的酵母筛选菌株 VER8145中LIG3-4和LIG3-4大范围核酸酶变体的活性。得分为0表明没 有观察到白色分段(没有切割表明没有大范围核酸酶活性);得分为4表 明完全白色菌落(识别位点的完全切割表明很高的大范围核酸酶活性); 得分为1-3表明中间白色分段表型(和中间程度的识别位点切割),是表示 中间大范围核酸酶活性。

    表2.在22℃和30℃测定的酵母筛选菌株中LIG3-4和LIG3-4大范围核酸酶变体的活性。

    在图5A-5C中显示了所述LIG3-4变体相对于所述LIG3-4亲本(LIG3- 4.pro)的比对。

    各种测定条件指示了大范围核酸酶活性,允许通过活性对所述改组变 体进行精确排名。观察到了大范围核酸酶活性的大的提高(高分)。一些 变体甚至在22℃的低温观察到所述识别位点的完全切割。这非常显著,因 为对于I-Cre型大范围核酸酶最佳温度是37℃,而对于某些生物系统(例如 植物细胞培养物)是在22-25℃的范围内。因此,在与亲本I-Cre型大范围 核酸酶进行比较时,这些能够在低温切割的大范围核酸酶变体更适合于在 植物系统中良好运作。

    表3A和3B表示LIG3-4变体相对于LIG3-4亲本大范围核酸酶的氨基 酸修饰。

    表3A:LIG3-4变体相对于LIG3-4的氨基酸修饰。

    表3B(上接表3A):

    实例7

    大肠杆菌(E.coli)中制备大范围核酸酶蛋白

    为了进一步确认和定量大范围核酸酶变体的活性,在大肠杆菌(E. coli)中制备大范围核酸酶蛋白并在包含所述大范围核酸酶识别位点的质粒 或玉米基因组DNA上经受体外切割测定。从锚定了所述大范围核酸酶变体 的酵母菌株提取总DNA。PCR扩增所述大范围核酸酶编码序列并将其插入 表达载体pQE80(QIAgen)。将所得的质粒转化进大肠杆菌(E.coli)菌 株BL21(Stratagene),生长在包含100ppm羧苄青霉素的LB培养基上。 从固体培养基制备细胞悬浮液并用于接种50ml 2xYT培养基的培养物(其 包含100ppm羧苄青霉素),光密度值0.2。所述培养物生长在37℃。当光 密度到达0.8,通过添加IPTG诱导蛋白表达。间温度调节至20℃,将所述 培养物另外培养2小时。通过离心收集大肠杆菌(E.coli)细胞,重悬于缓 冲液1(50mM Tris pH8、500mM NaCl、10mM imidizole),并且通过超声 处理裂解。细胞碎片通过离心去除。将上清液转移至加载有0.5ml Nickel- NTA Superflow树脂(QIAgen)的一次性柱上。用4ml缓冲液2(50mM  Tris pH8、500mM NaCl、60mM imidizole)洗柱。用0.6ml缓冲液4 (50mM Tris pH8、500mM NaCl、400mM imidizole)将纯化的大范围核酸 酶洗脱。将大范围核酸酶蛋白转移至Vivaspin500超滤离心管。用包含50% 甘油、0.5mM二硫苏糖醇的SAB缓冲液(25mM Tris pH8、100mM NaCl、 10mM MgCl2、5mM EDTA)进行缓冲液交换和浓缩。回收终体积约0.1ml 的纯化的大范围核酸酶蛋白溶液。加入牛血清白蛋白至100微克/毫升的终 浓度。

    实例8

    大范围核酸酶活性的体外测定

    如实例7所述分离大范围核酸酶蛋白。通过计算然后与已知浓度的系 列稀释样品的条带强度进行比较,在Nu-PAGE(聚丙烯凝胶电泳)凝胶 (Life Technologies)上可视地测定蛋白浓度。使用Hoechst染料荧光计测 定法测定DNA浓度。在37℃、28℃、和23℃,用25nM的纯化的大范围 核酸酶蛋白、和终体积为80ul的消化缓冲液(100mM Tris-HCl(pH 7.9) /100mM NaCl/10mM MgCl2/1mM DTT/5mM EDTA)中的0.25nM的线状质 粒底物,在包含所述大范围核酸酶识别位点的质粒DNA上进行时程消化。 在0、25、50、75分钟取20μl的时间点,用等体积的终止缓冲液(100mM  Tris-HCl、pH 8.0/600mM NaCl/2%SDS/100mM EDTA/1mg蛋白酶K/ml) 在50℃温育30-45分钟来终止,使用Qiagen PCR纯化柱按照制造商的说明 进行纯化。为了对每个样品消化或大范围核酸酶识别位点损耗的%进行定 量,采用跨大范围核酸酶识别位点的TaqMan测定、在1μl经纯化的质粒 DNA(在水中稀释50倍)上进行实时PCR。相对于内部对照TaqMan测 定,通过ΔΔCt方法计算大范围核酸酶识别位点的损耗。将0分钟时间点或 空白对照用作校准物。在37℃、28℃和23℃、采用6.07ug的玉米基因组 DNA和终体积为80ul的16nM经纯化的大范围核酸酶蛋白,进行基因组 DNA的定时消化。50分钟后,如上所述停止消化反应,通过苯酚/氯仿提 取进行纯化,在0.2M NaCl的存在下用乙醇沉淀。将沉淀的基因组DNA用 70%乙醇洗两次,干燥,重悬于34μl的水中。对于质粒底物,通过如上所 述的实时PCR对每个样品的消化百分比进行定量,不同的是通过实时PCR 对1μl未稀释的基因组DNA进行测定。由于已经阐明I-CreI内切核酸酶对 低于37℃的温度敏感(Wang,J.,Kim,H.,Yuan,X.和Herrin,D.(1997) Nucleic Acids Res.25,3767-3776.),在37℃、28℃和23℃进行体外测定以 估计I-CreI来源的亲本大范围核酸酶和其变体的裂解活性。

    LIG3-4和LIG3-4变体的体外大范围核酸酶活性

    在包含LIG3-4识别位点的质粒DNA上,LIG3-4(B65)是最具活性 的变体,其在23℃保持裂解活性,而对于LIG3-4如果有的话很少,对于 LIG3-4(7)和LIG3-4(15)仅检测到有轻微裂解(图6A)。在28℃, hit15和hit 7分别获得66%和50%的裂解,在75分钟后对于LIG3-4仅检测 到轻微的裂解(图6B)。在37℃,hit7显示出与LIG3-4类似的裂解活 性,而hit15和B65裂解质粒底物更快速并且到达更大的程度(图6C)。 基于质粒DNA裂解,所有的改组变体比带有B65的LIG3-4活性更高,之 后在活性方法是hit15,然后是hit7。这些数据紧密地模拟了在酵母测定中 的观察。

    当监控基因组DNA裂解时,在质粒DNA上建立的活性排名是保守 的。在23℃,B65保持了显著的活性,裂解了其基因组底物的69%(图 7A)。在28℃,对于LIG3-4没有检测到裂解活性,而B65、hit15和hit7 分别获得94%、33%和24%的裂解(图7B)。在37℃,LIG3-4在LIG3-4 基因组识别位点处表现出47%的裂解,而B65、hit15和hit7分别获得 99%、92%和76%的裂解(图7C)。同样,来自玉米基因组DNA的体外切 割的数据与酵母测定中的观察相符。

    实例9

    分析玉米中LIG3-4变体的大范围核酸酶活性

    如实例3中所述创建LIG3-4变体,并且通过粒子枪转化和农杆菌介导 的转化导入玉米。

    三个LIG3-4变体:LIG3-4(B65)(SEQ ID NO:27)、LIG3-4(15) (SEQ ID NO:15)和LIG3-4(7)(SEQ ID NO:14)在酵母中显示出提高 的大范围核酸酶活性(实例3)并且在体外测定中显示出提高的活性(实例 8,图6-7),并针对其在玉米中的活性进行进一步的体内测试。

    A.用于通过同源重组进行转基因整合的大范围核酸酶基因和修复(供 体)DNA的植物表达载体的载体构建

    编码所述大范围核酸酶的基因经过密码子最优化用于在玉米中使用标 准分子生物学技术表达。所得的植物最优化的核苷酸序列还补充了编码 SV40核定位信号的DNA序列(SEQ ID NO:72),并且进一步修饰:通过 将马铃薯ST-LS1内含子添加至第一单体的编码序列以消除其在大肠杆菌 (E.coli)和农杆菌中的表达。进一步测试所得的LIG3-4变体,LIG3-4 (7)(SEQ ID NO:73)、LIG3-4(15)(SEQ ID NO:74)和LIG3-4 (B65)(SEQ ID NO:75)在玉米中的活性(体内)。

    使用标准分子生物学技术构建载体,其包含用于合适的大范围核酸酶 的表达盒。对于每一个大范围核酸酶,将植物表达载体(其包含编码所述 大范围核酸酶基因之一的多核苷酸)可操作地连接至玉米组成型启动子。

    为了实现位点特异性DNA插入,除了所述识别位点和所述大范围核酸 酶,在细胞中还必须同时存在包含目的基因的修复DNA(供体DNA)。 使用标准分子生物学技术构建载体PHP46961(SEQ ID NO:76)(其包含编 码工程化的大范围核酸酶变体LIG3-4(15)的多核苷酸)和供体DNA。构 建类似的载体PHP46949或PHP47257,其分别包含LIG3-4B(65)或 LIG3-4(17)大范围核酸酶。所述供体DNA包含抗除草剂性基因 (MoPAT,其编码草胺膦乙酰转移酶),被用作转化的选择标记,并且两 翼为两个同源重组片段LIG3-4HR1(SEQ ID NO:77)和LIG3-4HR2(SEQ  ID NO:78),其为所述大范围核酸酶识别位点两翼的约1kb长的基因组 DNA序列。也包括包含LIG3-4的载体(PHP43914,如针对PHP46961所 述进行制备)作为对照。

    另外将所述LIG3-4变体’表达盒共整合至LBA4404用于农杆菌递送。 对于LIG3-4(B65)、LIG3-4(15)和LIG3-4(7)载体名分别为 PHP47331、PHP47332和PHP47517。

    来自玉米可转化品系的玉米幼胚9-12DAP(授粉后天数,大小约1.5- 2.0mm)被用于通过轰击的基因转化(实例1和实例2)。在26℃下,将所 述幼胚置于560Y培养基上4小时,或者,在轰击之前将幼胚置于560Y 上,在此之前将幼胚在26℃至37℃的温度范围温育8至24小时。通过联 合轰击将发育基因ODP2(AP2结构域转录因子ODP2(胚珠发育蛋白 2);US20090328252A1)和Wushel包括在实验中(实例2)。用载体 PHP43914、PHP46949、PHP46961和PHP47257转化玉米幼胚。

    来自玉米可转化品系的玉米幼胚9-12DAP(授粉后天数,大小约1.5- 2.0mm)被用于通过农杆菌的基因转化。在此次感染中不包括发育基因 ODP2或Wushel。用载体PHP47731、PHP47732和PHP47517转化玉米幼 胚。

    B.玉米中LIG3-4变体的大范围核酸酶活性

    为了检查在与LIG3-4进行比较时玉米中所述LIG3-4变体是否显示出 提高的大范围核酸酶活性,用质粒DNA(包含每种变体或对照)轰击约 2000个玉米幼胚。在轰击后,将胚在28℃、560P(维持培养基)上温育, 然后用双丙氨膦除草剂进行选择。LIG3-4和LIG3-4变体供体载体 (PHP43914、PHP46949、PHP46961和PHP47257)的成功递送赋予了双丙 氨磷抗除草剂性,被用于通过在包含除草剂的培养基上选择愈伤组织来鉴 定推定的事件。针对内源性LIG3-4识别位点的修饰,对再生自稳定转化子 的愈伤组织和/或植物进行筛选。

    采用实时PCR(qPCR),通过测量目标位点的拷贝数,针对在大范围 核酸酶目标位点(其包含所述识别位点)处的修饰对除草剂抗性事件进行 筛选。所述目标位点的两个拷贝表明两个等位基因都是野生型并且在所述 识别位点没有发生修饰。如果通过qPCR仅检测到所述目标位点的一个拷 贝,这意味着在由LIG3-4或其改组变体生成的双链断裂的修复过程中,所 述目标位点的一个等位基因发生变化,而所述目标位点的缺失(空或0)是 两个等位基因都被修饰的结果。由于愈伤组织样品的嵌合实质,所述拷贝 数也可在1和2之间。用于LIG3-4目标位点的qPCR的探针序列是 ATACCTCACACGTACGCG(SEQ ID NO:79),所述LIG3-4_正向引物是 GATTTACGCACCTGCTGGGA(SEQ ID NO:80),LIG3-4_反向引物是 CTGAGCTGTATTCCCGCGCA(SEQ ID NO:81)。所述扩增子大约为 100bp。

    针对提高的大范围核酸酶活性,对带有目标位点拷贝数0、1或在1和 2之间的转基因事件进一步分析。通过测量所述目标位点(TS)突变率来 测定所述大范围核酸酶活性。目标位点突变率被定义为:(带有目标位点 修饰的事件数量/事件总数)*100%。对于LIG3-4大范围核酸酶,TS突变 率为6%(表4)。使用恢复的事件数除以被轰击胚的总数来计算事件恢复 率(表4),可表明大范围核酸酶是否具有某些毒性效应。表4显示了在轰 击和6-8周的抗生素选择后,不同LIG3-4变体的效应。在与亲本LIG3-4大 范围核酸酶进行比较时,大范围核酸酶变体LIG3-4(7)和LIG3-4(15) 都产生了显著更高的突变频率,这与在酵母测定和体外DNA切割测定中的 观察相符。LIG3-4(B65)也产生比亲本LIG3-4更高的突变频率,但没有 其他LIG3-4变体高。LIG3-4(65)的事件恢复速率表明,这可能是由于毒 性与非常活性的大范围核酸酶相关联。

    表4:

    通过在植物组织中、源自基因轰击转化的目标位点突变率(TS突变 率),测定LIG3-4和LIG3-4大范围核酸酶变体的活性。

    大范围核酸酶 事件恢复率 TS突变率 插入 LIG3-4 17% 6% 是 LIG3-4(7) 13% 29% 是 LIG3-4(15) 15% 54% 是 LIG3-4(B65) 3% 21% 是

    表5:

    通过在植物组织中、源自农杆菌转化的目标位点突变率(TS突变 率),测定LIG3-4和LIG3-4大范围核酸酶变体的活性。

    大范围核酸酶 事件恢复率 突变率 插入 LIG3-4 ~20% 1-3% 无 LIG3-4(7) 19% 15% 是 LIG3-4(15) 11% 34% 是 LIG3-4(B65) 9% 74% 是

    表5表明在与对照非变体LIG3-4(TS突变率1至3%)进行比较时, 所有三种大范围核酸酶变体(LIG3-4(7)、LIG3-4(15)和LIG3-4 (B65)显示出提高的大范围核酸酶活性(TS突变率分别为15%、34%和 74%)。当通过农杆菌转化生成植物组织时,观察到大范围核酸酶活性的 最高提高(表5)。这些数据与使用这些变体在酵母和体外切割测定中获得 的数据非常相符。

    当经由农杆菌介导的转化将所述大范围核酸酶和基因递送构建体导入 时,转基因事件的恢复有非常小的减少(在与表4进行比较时在表5中更 高的事件恢复率)。这可能是由于这样的事实,即通过该方法被递送至植 物细胞核的DNA更少。

    针对来自供体DNA(PHP43914,PHP46949,PHP46961, PHP47257;PHP47331,PHP47332,和PHP47517的agro)在LIG3-4识别 位点整合的转基因盒,也通过连接PCR来筛选玉米愈伤组织,所选择的愈 伤组织事件再生为T0植物(图8)。当整合发生时,例如所述通体序列被 整合在识别位点处,When integration occurred,例如the donor sequence was  integrated at the识别位点,插入被标明为“Yes”。当没有整合发生时,插入 被标明为“no”(表4和5)。通过例子轰击递送每个LIG3-4变体就观察 到转基因靶向至LIG3-4基因座(表4:当通过农杆菌介导的转化导入时, 每个LIG34变体能转基因整合在目标位点,而亲本LIG34不能(对于变体 插入为YES,对于LIG3-4为NO;表5)。

    实例10

    创建MHP77和MHP77.3大范围核酸酶变体

    A.MHP77 & MHP77.3大范围核酸酶和MHP 77识别位点

    选择包含MHP77识别位点(SEQ ID NO:85)内源性玉米基因组目标 位点用于设计定制的双链断裂诱导剂。所述MHP77识别位点是在1号染色 体上的22bp的多核苷酸,具有以下序列:

    (SEQ ID NO:85)GGGCGGTATGTATGTCATACTA

    修饰野生型I-CreI大范围核酸酶(SEQ ID NO:3)以制备两种工程化的 大范围核酸酶:MHP77(SEQ ID NO:86)和MHP77.3(SEQ ID  NO:250),其设计来识别所述MHP77识别序列。在美国专利申请公开US 2007/0117128A1中已经描述了定制大范围核酸酶的设计。

    B.MHP77和MHP77.3大范围核酸酶变体

    通过基因改组方法,以类似如何创建LIG3-4变体以及在实例3中所述 的方式创建MHP77大范围核酸酶的变体。这涉及导入存在于天然存在的大 范围核酸酶蛋白的和先前在LIG3-4变体中鉴定的以及随机突变的氨基酸修 饰。所述改组方法使得生成带有氨基酸修饰的重组的MHP77变体,非预期 的氨基酸修饰是由于诱变PCR、缺失和插入(SEQ ID NO:86-167)。

    通过将相同的氨基酸修饰(突变)引入MHP77(L9-02)、MHP77 (L9-11)、或MHP77(L9-12),创建了MHP77.3大范围核酸酶的三个变 体,因此创建了MHP77.3(L9-02)(SEQ ID NO:251)、MHP77.3(L9- 11)(SEQ ID NO:252)和MHP77.3(L9-12)(SEQ ID NO:253)。 MHP77.3(15)(SEQ ID NO:262)包含针对LIG3-4(15)所述的完全相 同的核苷酸/氨基酸修饰。通过标准分子生物学技术将所述氨基酸修饰导入 MHP773。

    C.酵母中的MHP77大范围核酸酶变体活性

    在酵母系统中确认了总共79个MHP77变体具有提高的活性(如实例 6中所述)。跨温度范围观察到了提高的活性:24℃、28℃、30℃和3737 ℃,如表6中所述。得分为0表明没有观察到白色分段(没有切割表明没 有大范围核酸酶活性);得分为4表明完全白色菌落(识别位点的完全切 割表明很高的大范围核酸酶活性);得分为1-3表明中间白色分段表型(和 中间程度的识别位点切割),是表示中间大范围核酸酶活性。

    表6:在不同温度下测定的酵母筛选菌株中的MHP77大范围核酸酶变 体的活性。

    #变体 24℃ 28℃ 30℃ 37℃ MHP77 0 0 0 0 MHP77(L15-31) X 4 4 4 MHP77(L16-11) 4 4 4 4 MHP77(L16-09) 2.5 4 4 4 MHP77(L16-04) 2 4 4 4 MHP77(L16-19) 2 4 4 4

    MHP77(L16-17) 3 3.5 4 4 MHP77(L16-23) 1 3.5 4 4 MHP77(L15-34) 1 3.5 4 4 MHP77(L15-40) 0.5 3.5 4 4 MHP77(L15-39) 0.5 3.5 4 4 MHP77(L15-45) 0.5 3 4 4 MHP77(L15-29) 0.5 2.5 4 4 MHP77(L15-06) 0 2 4 4 MHP77(L16-08) 1 3 3.5 4 MHP77(L16-05) 1 3 3.5 4 MHP77(L16-02) 0.5 2.5 3.5 4 MHP77(L16-24) 0 2.5 3.5 4 MHP77(L16-21) 0 2.5 3.5 4 MHP77(L16-14) 0 2.5 3.5 4 MHP77(L16-18) 0.5 2 3.5 4 MHP77(L15-27) 0 2 3.5 4 MHP77(L9-02) 0 2 3 4 MHP77(L16-12) 0 2 3 4 MHP77(L16-01) 0 2 3 4 MHP77(L15-05) 0 2 3 4 MHP77(L15-24) 0 2 3 4 MHP77(L16-06) 0 1 3 4 MHP77(L16-15) 0 1 3 4 MHP77(L15-33) 0 1 3 4 MHP77(L16-03) 0 2 2.5 4 MHP77(L15-47) 0 0 2.5 4 MHP77(L15-46) 0 0 2.5 4 MHP77(L9-12) 0 1 2 4 MHP77(L16-16) 0 1 2 4 MHP77(L15-10) 0 1 2 4 MHP77(L9-03) 0 0.5 2 4 MHP77(L15-20) 0 0.5 2 4 MHP77(L15-28) 0 0 2 4 MHP77(L15-21) 0 0 2 4 MHP77(L15-13) 0 0 2 4 MHP77(L9-04) 0 0 1 4 MHP77(L15-18) 0 0 1 4 MHP77(L18-01) X 0 0 4 MHP77(L17-12) X 0 0 4 MHP77(L17-01) X 0 0 4 MHP77(L15-03) 0 0.5 2 3.5 MHP77(L15-11) 0 0.5 1 3.5 MHP77(L18-12) X 0 1 3.5 MHP77(L15-15) 0 0 1 3.5

    MHP77(L15-12) 0 0 1 3.5 MHP77(L9-1)* 0 1 2 3 MHP77(L9-9) 0 0 1 3 MHP77(L9-11) 0 0 1 3 MHP77(L9-10) 0 0 1 3 MHP77(L15-02) 0 0 1 3 MHP77(L15-08) 0 0 0.5 3 MHP77(L16-07) 0 0 0 3 MHP77(L15-35) 0 0 0 2.5 MHP77(L13-12) 0 0 0 2.5 MHP77(L113-01) 0 0 0 2.5 MHP77(L9-06) 0 0.5 0.5 2 MHP77(L15-42) 0 0 0 2 MHP77(L15-41) 0 0 0 2 MHP77(L15-36) 0 0 0 2 MHP77(L15-30) 0 0 0 2 MHP77(L112-03a) 0 0 0 2 MHP77(L73-02a) 0 0 0 1.5 MHP77(L13-10B1) 0 0 0 1.5 MHP77(L72-08a) X 0 0 1 MHP77(L72-09a) 0 0 0 1 MHP77(L72-01a) 0 0 0 1 MHP77(L13-08a) 0 0 0 1 MHP77(L13-06) 0 0 0 1 MHP77(L13-02) 0 0 0 1 MHP77(L13-01a) 0 0 0 1 MHP77(L73-05a) 0 0 0 0.5 MHP77(L15-43) 0 0 0 0.5 MHP77(L13-04) 0 0 0 0.5 MHP77(L13-11) 0 0 0 0.5 MHP77(L15-23) 0 0 0 0 MHP77(L15-16) 0 0 0 0                    

    观察到了大范围核酸酶活性的大的提高(高分)。观察到了一些变体 对识别位点的完全切割,甚至在22℃的低温下(参见MHP77(L16-11)表 6)。

    图9A-9D显示了MHP77变体相对于MHP77亲本大范围核酸酶的氨 基酸修饰。A(-)表明所述氨基酸与MHP77参考序列相同。

    实例11

    玉米中MHP77和MHP77.3大范围核酸酶变体的分析

    将编码MHP77和MHP77.3工程化的大范围核酸酶(实例10)的基因 优化用于在植物中表达。为了在玉米细胞中有更好的性能,所述工程化的 大范围核酸酶表达盒包含玉米密码子优化的核苷酸序列。所述大范围核酸 酶基因序列还补充了编码SV40核定位信号的DNA序列,产生植物最优化 的序列:SEQ ID NO:254(针对MHP77)和SEQ ID NO:255(针对 MHP77.3)。玉米泛素启动子和马铃薯蛋白酶抑制剂II基因终止子序列完 成了内切酶基因的设计。

    对于MHP77和MHP77.3变体的植物最优化的核苷酸序列是MHP77 (L9-02)(SEQ ID NO:256)、MHP77(L9-11)(SEQ ID NO:257)、 MHP77(L9-12)(SEQ ID NO:258)、MHP77.3(L9-02)(SEQ ID  NO:259)、MHP77.3(L9-11)(SEQ ID NO:260)以及MHP77.3(L9- 12)(SEQ ID NO 261)和MHP77(15)(SEQ ID NO:263)。

    A.用于通过同源重组进行转基因整合的大范围核酸酶基因和修复(供 体)DNA的植物表达载体的载体构建

    使用标准分子生物学技术构建载体,其包含用于合适的大范围核酸酶 的表达盒。对于每一个大范围核酸酶,将植物表达载体(其包含编码所述 大范围核酸酶基因之一的多核苷酸)可操作地连接至玉米组成型启动子。

    为了实现位点特异性DNA插入,除了所述识别位点和所述大范围核酸 酶,在细胞中还必须同时存在包含目的基因的修复DNA(供体DNA)。 载体类似于实例9中所述的PHP46961(SEQ ID NO:76),但包含多核苷 酸,其编码大范围核酸酶变体MHP77(L9-11)、MHP77(L9-12)、 MHP77(L9-02)、MHP77.3(L9-11)、MHP77.3(L9-12)、MHP77.3 (L9-02)、或MHP77.3(15);使用标准分子生物学技术构建供体 DNA。这些载体被称为PHP53132、PHP53134、PHP53136、PHP53133、 PHP53135、PHP53137和PHP50239。所述供体DNA包含抗除草剂性基因 用作转化的选择标记。抗除草剂性基因MoPAT编码草胺膦乙酰转移酶,两 翼为两个同源重组片段:MHP77HR1(SEQ ID NO:264)和MHP77HR2 (SEQ ID NO:265),其为所述大范围核酸酶识别位点两翼的约1kb长的基 因组DNA序列。

    来自玉米可转化品系的玉米幼胚9-12DAP(授粉后天数,大小约1.5- 2.0mm)被用于通过轰击的基因转化(实例1和实例2)。在26℃下,将所 述幼胚置于560Y培养基上4小时,或者,在轰击之前将幼胚置于560Y 上,在此之前将幼胚在26℃至37℃的温度范围温育8至24小时。通过联 合轰击将发育基因ODP2(AP2结构域转录因子ODP2(胚珠发育蛋白 2);US20090328252A1)和Wushel包括在实验中(实例2)。用载体 PHP53132、PHP53134、PHP53136、PHP53133、PHP53135、PHP53137, 和PHP50239转化玉米幼胚。

    B.玉米中MHP77和MHP77.3变体的大范围核酸酶活性

    为了检查在与MHP77和MHP77.3进行比较时所述MHP77和 MHP77.3大范围核酸酶变体是否提高了大范围核酸酶活性,用每种变体或 对照质粒DNA轰击约2000个玉米幼胚。在轰击后,将胚在28℃、560P (维持培养基)上温育,然后用除草剂(双丙氨膦)进行选择。MHP77、 MHP77.3变体供体载体(PHP45970、PHP50238、PHP53132、PHP53134、 PHP53136、PHP53133、PHP53135、PHP53137,或PHP50239)的成功递送 赋予了双丙氨磷抗除草剂性,被用于通过在包含除草剂的培养基上选择愈 伤组织来鉴定推定的事件。使用标准培养物从稳定转化子再生愈伤组织和/ 或植物,并且针对内源性MHP77识别位点的修饰来筛选再生条件。

    如实例9中所述,针对目标位点(包含MHP77识别位点)处的修饰, 通过使用qPCR测量目标位点拷贝数来筛选除草剂抗性事件。用于MHP77 目标位点的qPCR的探针序列是ACTAATTCAAGTGATGGACAAA(SEQ  ID NO:266),所述MHP77_正向引物是 TCCTTAGGGCGGTATGTATGTCA(SEQ ID NO:267),MHP77_反向引 物是CATCGGTCAAAAAACACATAAACTTT(SEQ ID NO:268)。所述扩 增子约为100bp。

    目标位点突变率(TS突变率,表7)间接测量了所述大范围核酸酶活 性。表7显示了在轰击和6-8周抗生素选择后,不同的MHP77的改组变体 和改组大范围核酸酶的效应。表7表明在与MHP77大范围核酸酶进行比较 时,MHP77大范围核酸酶的所有三种改组变体更有活性。在与MHP77(对 照)进行比较时,改组的MHP77大范围核酸酶提高的活性还导致恢复事件 的减少。

    表7:

    通过在植物组织中、源自基因轰击转化的目标位点突变率(TS突变 率),测定MHP77和MHP77大范围核酸酶变体的活性。

    大范围核酸酶 事件恢复率 TS突变率 插入 MHP77(对照) 21% 1% 无 MHP77L9-11 11% 4% 无 MHP77L9-12 9% 17% 是 MHP77L9-02 3% 6% 无

    表8:

    通过在植物组织中、源自农杆菌转化的目标位点突变率(TS突变 率),测定MHP77.3和MHP77.3大范围核酸酶变体的活性。

    大范围核酸酶 转化率 突变率 插入 MHP77.3 14% 11% 无 MHP77.3(15) 13% 22% 是 MHP77.3L9-11 9% 35% 是 MHP77.3L9-12 3% 19% 是 MHP77.3L9-02 2% 5% 无

    表8表明在与非变体MHP77.3大范围核酸酶进行比较时,MHP77.3大 范围核酸酶的所有四种改组变体更具活性。在与MHP77进行比较时,一些 但并非全部改组的MHP77大范围核酸酶活性提高导致恢复事件的减少。

    针对来自供体DNA(PHP45970、PHP50238、PHP53132、 PHP53134、PHP53136、PHP53133、PHP53135、PHP53137,和 PHP50239)在MHP77识别位点整合的转基因盒,也通过连接PCR来筛选 玉米愈伤组织,所选择的愈伤组织事件再生为T0植物。当整合发生时,例 如所述供体序列被整合至所述识别位点,插入(表7和8)被标明为 “Yes”。当整合没有发生时,插入被标明为“no”。

    实例12

    MS26大范围核酸酶变体的创制

    A.MS26+& MS26++大范围核酸酶和MS26识别位点

    选择包含MS26识别位点(SEQ ID NO:269)的内源性玉米基因组目标 位点用于定制的双链断裂诱导剂的设计。所述MHP26识别位点是22bp的 多核苷酸,具有以下序列:

    (SEQ ID NO:269)gatggtgacgtacgtgccctac

    对野生型I-CreI大范围核酸酶(SEQ ID NO:3)进行修饰以制备两种工 程化的大范围核酸酶,MHP26+(SEQ ID NO:270)和MHP26++(SEQ ID  NO:271),其设计来识别所述MHP26识别序列。在美国专利申请公开US  2007/0117128 A1中已经描述了定制大范围核酸酶的设计。

    B.MS26大范围核酸酶变体

    如实例6和9中所述,将LIG3-4变体导入酵母和玉米,在与非变体 LIG3-4大范围核酸酶进行比较时,显示出显著更高的大范围核酸酶活性。 在与所述亲本LIG3-4(表2和图5)进行比较时,这些LIG3-4变体表征为 特定的氨基酸修饰。为了测试这些氨基酸修饰(和对应的核苷酸修饰)是 否也能提高MS26+大范围核酸酶的活性,将LIG3-4(7)、LIG3-4(15) 和Lig3-4(B65)所述的完全相同的核苷酸/氨基酸修饰通过标准分子生物 学技术导入MS26+,得到下列三种MS26+变体:MS26+(7)(SEQ ID  NO:272)、MS26+(15)(SEQ ID NO:273)和MS26(B65)(SEQ ID  NO:274)变体。

    相似地,对所述MS26++核苷酸/氨基酸序列进行优化以包括LIG3-4 (15)的核苷酸/氨基酸修饰,得到MS26++(15)大范围核酸酶变体 (SEQ ID NO:275)。

    实例13

    玉米中MS26+和MS26++变体的大范围核酸酶活性分析

    将编码MHP26+和MHP26++工程化的大范围核酸酶的基因优化用于在 植物中表达。为了在玉米细胞中有更好的性能,所述工程化的大范围核酸 酶表达盒包含玉米密码子优化的核苷酸序列。所述大范围核酸酶序列还补 充了编码SV40核定位信号的DNA序列(SEQ ID NO:34),得到植物最优 化的序列:SEQ ID NO:276(针对MHP26+)和SEQ ID NO:279(针对 MS26++)。玉米泛素启动子和马铃薯蛋白酶抑制剂II基因终止子序列完成 了内切酶基因的设计。针对MS26+和MS26++大范围核酸酶变体的植物最 优化的序列分别是SEQ ID NO:419、277-279和SEQ ID NO:280。

    A.用于通过同源重组进行转基因整合的大范围核酸酶基因和修复(供 体)DNA的植物表达载体的载体构建

    将MS26+变体的编码部分导入测试载体PHP51583,其包含一个狭槽 用于通过泛素启动子驱动大范围核酸酶、两个标记基因(MoPAT和 DsRed,也在泛素启动子的控制下)的融合、和卡那霉素抗性基因。

    如实例1中所述,通过基因枪轰击将所得的构建体递送至玉米幼胚的 盾片细胞。通过联合轰击也递送了发育基因(BBM和WUS)(实例1和 2)。

    B.玉米中MS26+变体的大范围核酸酶活性

    收集转基因事件的愈伤组织,提取总基因组DNA用作模板以扩增约1 kb的DNA片段,其包含所述Ms26识别位点。通过用BsiWI限制核酸酶消 化所述片段(其切割预期的Ms26识别位点)来估计MS26识别位点(目标 位点突变率)的突变频率。基于剩余的(未切割的)片段的百分比(其表 明在所述目标位点处的突变)计算突变的频率。带有至少50%的未消化片 段的事件指示在发育的第一阶段至少有一个等位基因被切割,并且因此指 示了突变。与LIG3-4(实例9)的情况不同,在与亲本MS26+进行比较 时,没有观察到MS26+变体的恢复事件频率的降低。与Ms26+大范围核酸 酶相比,所有三种MS26+变体产生更高的突变频率(表9)。在Ms26+ (B65)和Ms26+(7)显示出大范围核酸酶活性适度提高(分别为3倍和 4倍提高)时,Ms26+(15)显示出活性约10倍提高(表9)。

    表9:

    通过在植物组织中的目标位点突变率(TS突变率),测定MS26+和 MS26+大范围核酸酶变体的活性。

    大范围核酸酶 分析的事件数量 TS突变率 MS26+ 282 2% MS26+(7) 191 9% MS26+(15) 227 25% MS26+(B65) 176 7%

    在与MS26(7%)进行比较时,将与LIG3-4(15)相同的氨基酸修饰 (突变)导入MS26++(15)导致大范围核酸酶活性的急剧提高,测量的 MS26++的%突变率为44%(表10)。这个数据指出所有分析的事件的几乎 半数在所述Ms26识别位点带有突变。

    表10:

    通过在植物组织中的目标位点突变率(TS突变率),测定MS26+和 MS26+大范围核酸酶变体的活性。

    实例14

    创建MHP和MHP14+大范围核酸酶变体

    A.MHP14 & MHP14+大范围核酸酶和MHP14识别位点

    选择包含MHP14识别位点(SEQ ID NO:281)的内源性玉米基因组目 标位点用于设计定制的双链断裂诱导剂。所述MHP14识别位点是定位的 22bp多核苷酸,具有以下序列:

    (SEQ ID NO:281)caaacagattcacgtcagattt

    修饰野生型型I-CreI大范围核酸酶以制备工程化的大范围核酸酶 MHP14(SEQ ID NO:282)和MHP14+(SEQ ID NO:283),其设计来识别 所述MHP14识别序列。在美国专利申请公开US 2007/0117128 A1中已经 描述了定制大范围核酸酶的设计。

    B.MHP14和MHP14+大范围核酸酶变体

    通过基因改组方法,以类似如何创建LIG3-4变体以及在实例3中所述 的方式创建MHP14大范围核酸酶的变体。这涉及导入存在于天然存在的大 范围核酸酶蛋白的和先前在LIG3-4变体中鉴定的以及随机突变的氨基酸修 饰。所述改组方法使得生成带有氨基酸修饰的重组的MHP14变体,非预期 的氨基酸修饰是由于诱变PCR、缺失和插入(SEQ ID NO:284-298)。

    对应的DNA序列是SEQ ID NO:300-314。

    将来自五个MHP14变体,MHP14(04)、MHP14(06)、MHP14 (08)、MHP14(12)和MHP14(14)的突变导入MHP14+,得到 MHP14+(04)(SEQ ID NO:315)、MHP14+(06)(SEQ ID NO:316)、 MHP14+(08)(SEQ ID NO:317)、MHP14+(12)(SEQ ID NO:318)、 MHP14+(14)(SEQ ID NO:319)。通过将来自LIG3-4(15)的G19S突 变导入MHP14+生成一个另外的变体,得到MHP14+(15)(SEQ ID  NO:320)。通过标准分子生物学技术将这些突变导入MHP14+。

    实例15

    分析酵母和玉米中MHP14和MHP14+变体的大范围核酸酶活性

    在酵母系统中确认了总共15个MHP14变体具有提高的活性(如实例 6中所述)。跨温度范围观察到了提高的活性:28℃、34℃、和37℃、如 表11中所示。

    表11:在不同温度下测定的酵母筛选菌株中的MHP14大范围核酸酶 变体的活性。

    大范围核酸酶 28℃ 34℃ 37℃ MHP14 0 2 2 MHP14(L14-07) 0.5   4 MHP14(01) 0 3 3 MHP14(06) 0 3.5 3.5 MHP14(L14-04) 0   3 MHP14(08) 1 4 4 MHP14(07) 0.5 2.5 2.5 MHP14(03) 0.5 3 3

    MHP14(04) 2 x x MHP14(02) 2 4 4 MHP14(13) 1 4 3.5 MHP14(L14-03) 0   3 MHP14(14) 1 4 4 MHP14(09) 2 4 4 MHP14(12) 1.5 4 4 MHP14(10) 1 4 4

    观察到大范围核酸酶活性的大幅提高(高分)。

    图10A-10C显示了MHP14变体大范围核酸酶相对于MHP14亲本大 范围核酸酶的氨基酸修饰。A(-)表明所述氨基酸与MHP14相同。

    表12显示了来自五个MHP14+变体的活性筛选的结果。

    表12:在不同温度下测定的酵母筛选菌株中的MHP14+大范围核酸酶 变体的活性。

    大范围核酸酶 28℃ 37℃ MHP14 0 2 MHP14+(04) 2 X MHP14+(06) 0 4 MHP14+(08) 1 4 MHP14+(12) 2 4 MHP14+(14) 1 4 MHP14+(15) - -

    在与MHP14大范围核酸酶进行比较时,所有MHP14+变体在37℃筛 选的酵母测定中显示出更高活性(表12)。甚至在28℃的更低温度进行测 定时,变体MHP14+(04)、MHP14+(08)、MHP14+(12)和MHP14+ (14)显示出提高的活性(表12.)

    将编码MHP14和MHP14+大范围核酸酶变体的基因优化用于在植物中 表达。为了在玉米细胞中有更好的性能,所述工程化的大范围核酸酶表达 盒包含玉米密码子优化的核苷酸序列。所述大范围核酸酶基因序列还补充 了编码SV40核定位信号的DNA序列,产生植物最优化的序列:SEQ ID  NO:321-327。玉米泛素启动子和马铃薯蛋白酶抑制剂II基因终止子序列完 成了内切酶基因的设计。

    如针对Ms26+和Ms26++变体(Example 12)所述进行植物中MHP14+ 变体的大范围核酸酶活性的测试和分析,结果显示于表13。

    表13:

    通过在植物组织中的目标位点突变率(TS突变率),测定玉米中 MHP14和MHP14+大范围核酸酶变体的活性。

    大范围核酸酶 分析的事件数量 TS突变率 MHP14 192 13% MHP14+(04) 192 38% MHP14+(06) 192 7% MHP14+(08) 192 25% MHP14+(12) 192 47% MHP14+(14) 192 39% MHP14+(15) 192 20%

    两个变体MHP14+(04)和MHP14+(08),虽然表现更高的活性, 但也显示出相当高水平的毒性。在与MHP14进行比较时,MHP14+06在毒 性和活性上均未显示差异。两个变体MHP14+(12)和MHP14+(14), 表现很高水平的活性而未提高毒性。MHP14+(15)变体显示出活性的温和 提高,毒性没有提高(表13)。

    实例16

    DNA改组以创建MP107大范围核酸酶的变体

    选择包含MP107识别序列(SEQ ID NO:328)的内源性玉米基因组目 标位点用于设计定制的双链断裂诱导剂。所述MP107识别位点是22bp的 多核苷酸,具有下述序列:

    ctagtatacgtgagagaccttg(SEQ ID NO:328)。

    如实例3所述制备工程化的MP107大范围核酸酶(SEQ ID  NO:329)。

    如实例3所述,MP107大范围核酸酶优化的第一相是设计来将氨基酸 修饰导入所述MP107大范围核酸酶。文库是基于先前在LIG3-4、MHP14 和MHP77变体中鉴定的具有提高活性的突变的导入(而创建的)。

    所述改组方法导致生成带有氨基酸修饰重组的变体,非预期的氨基酸 突变是由于诱变PCR、缺失和插入(SEQ ID NO:330-341)。对应的核苷酸 序列显示于SEQ ID NO:343-354。

    在酵母系统中确认了总共6个MHP107变体具有提高的活性(如实例 6中所述)。跨温度范围观察到了提高的活性:28℃、30℃、和37℃、如 表14中所示。

    表14:在不同温度下测定的酵母筛选菌株中的MP107大范围核酸酶变 体的活性。

    大范围核酸酶 28℃ 30℃ 37℃ MHP107 0 0 0 MHP107(D1) 0 0 0 MHP107(D5)   0.5 1.5 MHP107(D3)   0.5 2 MHP107(D2)   0 0 MHP107(C6) 0.5 1 3 MHP107(C4)   0 0 MHP107(D4)   0 2 MHP107(C5)   0 1 MHP107(C1) 2 3 4 MHP107(C2)   0 0 MHP107(D6) 0 0 0 MHP107(C3)   0 0

    图11显示了MP107变体相对于亲本MP107大范围核酸酶的氨基酸修 饰。A(-)表明所述氨基酸与MP107相同。

    实例17

    DNA改组以创建Zm6.3大范围核酸酶的变体

    选择包含Zm6.3识别序列(SEQ ID NO:355)的内源性玉米基因组目 标位点用于设计定制的双链断裂诱导剂。所述Zm6.3识别位点是22bp的多 核苷酸,具有下述序列:caggctctcgtaaatgcgcctg(SEQ ID NO:355)。

    如实例3所述制备工程化的Zm6.3大范围核酸酶(SEQ ID  NO:356)。

    如实例3所述,Zm6.3大范围核酸酶优化的第一相是设计来将氨基酸 修饰导入所述Zm6.3大范围核酸酶。文库是基于先前在LIG3-4、MHP14和 MHP77变体中鉴定的具有提高活性的突变的导入(而创建的)。

    所述改组方法导致生成带有氨基酸修饰重组的变体,非预期的氨基酸 突变是由于诱变PCR、缺失和插入(SEQ ID NO:357-371)。对应的核苷酸 序列显示于SEQ ID NO:373-387。

    在酵母系统中确认了总共15个Zm6.3变体具有提高的活性(如实例6 中所述)。跨温度范围观察到了提高的活性:28℃、30℃、和37℃,如表 15中所示。

    表15:在不同温度下测定的酵母筛选菌株中的Zm6.3大范围核酸酶变 体的活性。

    大范围核酸酶 28℃ 30℃ 37℃ ZM6.3 0 0.5 2 ZM6.3(4) 1 2 4 ZM6.3(3) 0 0 2 ZM6.3(5) 0.5 1 4 ZM6.3(H2) 2 2 4 ZM6.3(H3) 2 2 4 ZM6.3(1) 1 1.5 4 ZM6.3(G4) 2 2.5 4 ZM6.3(G1) 4 4 4 ZM6.3(G5) 0 0 2 ZM6.3(G2) 2.5 4 4 ZM6.3(H1) 4 4 4 ZM6.3(G6) 4 4 4 ZM6.3(G3) 2 2.5 4 ZM6.3(H6) 4 4 4 ZM6.3(H5) 4 4 4

    图12显示了Zm6.3变体相对于Zm6.3亲本大范围核酸酶的氨基酸修 饰。A(-)表明所述氨基酸与Zm6.3相同。

    实例18

    DNA改组以创建Zm6.22v2大范围核酸酶的变体

    选择包含Zm6.22v2识别序列(SEQ ID NO:388)的内源性玉米基因组 目标位点用于设计定制的双链断裂诱导剂。所述Zm6.22v2识别位点是 22bp的多核苷酸,具有下述序列:attgctctctcacatactttta(SEQ ID  NO:388)。

    如实例3所述,制备工程化的Zm6.22v2大范围核酸酶(SEQ ID  NO:389)。

    如实例3所述,Zm6.22v2大范围核酸酶优化的第一相是设计来将氨基 酸修饰导入所述Zm6.22v2大范围核酸酶。文库是基于先前在LIG3-4、 MHP14和MHP77变体中鉴定的具有提高活性的突变的导入(而创建 的)。

    所述改组方法导致生成带有氨基酸修饰重组的变体,非预期的氨基酸 突变是由于诱变PCR、缺失和插入(SEQ ID NO:390-403)。对应的核苷酸 序列显示于SEQ ID NO:405-418。

    在酵母系统中确认了总共13个ZM6.22v2变体具有提高的活性(如实 例6中所述)。跨温度范围观察到了提高的活性:28℃、30℃、和37℃, 如表16中所示。

    表16:在不同温度下测定的酵母筛选菌株中的ZM6.22v2大范围核酸 酶变体的活性。

    大范围核酸酶 28℃ 30℃ 37℃ ZM6.22v2 0 0 1 ZM6.22v2(I2) 1 2 x ZM6.22v2(J5)   0.5 4 ZM6.22v2(J8)   1 3 ZM6.22v2(J3)   0.5 3 ZM6.22v2(J4)   0.5 3.5 ZM6.22v2(J7)   0.5 3 ZM6.22v2(I6) 0.5 1 2 ZM6.22v2(I4) 0 0 3 ZM6.22v2(I3) 0 0 2 ZM6.22v2(I5) 0 0 0 ZM6.22v2(J2)   0 2 ZM6.22v2(I9)   0 2 ZM6.22v2(I7)   0 2

    ZM6.22v2(I8)   0.5 2.5 ZM6.22v2 0 0 1 ZM6.22v2(I2) 1 2 x ZM6.22v2(J5)   0.5 4 ZM6.22v2(J8)   1 3

    图13显示了Zm6.22v2变体相对于Zm6.22v2亲本大范围核酸酶的氨基 酸修饰。A(-)表明所述氨基酸与Zm6.22v2相同。

    实例19

    使用不同的氨基酸接头序列以创建具有提高活性的大范围核酸酶。

    如在实例3中所讨论的,所有大范围核酸酶变体包含接头多肽,其将 两个再工程化的I-CreI单体连接成氨基酸单链。

    如实例中所述创建大范围核酸酶变体MHP14(10)(SEQ ID  NO:292)和MHP77(L9-01)(SEQ ID NO:92)。与这些大范围核酸酶变 体对应的亲本大范围核酸酶中的接头序列进行比较时,其特征在于具有不 同的接头序列(图15A)。在MHP14(10)中,在接头E160的第二个密 码子处发生移框,所述阅读框在S193(所述接头的最后一个残基)处恢 复。在MHP77(01L9-)中,在接头W159的第一个密码子处发生移框,所 述阅读框在L198处恢复。因此所述连接的二聚体的第二单元的最前4个氨 基酸被改变了。这些数据表明可构建具有各种不同接头序列、同时仍获得 提高的大范围核酸酶活性的大范围核酸酶变体。

    LIG3-4(SEQ ID NO:1)\MHP14(SEQ ID NO:282)、MHP14(10) (SEQ ID NO:292)、MHP77(SEQ ID NO:86)和MHP77(L9-01)(SEQ  ID NO:92)的整个氨基酸序列的比对(图15B)揭示了低至80.8%的百分比 同一性。从而,创建的大范围核酸酶变体具有提高的大范围核酸酶活性, 同时与亲本大范围核酸酶仅有80%的相似性。

    实例20

    鉴定大范围核酸酶的结构基序中的氨基酸修饰。

    使用I-CreI大范围核酸酶二聚体的三维结构模型(Chevalier BS, Monnat Jr RJ,Stoddard BL Nat.Struct.Biol.(2001)8p.312)对负责提高大 范围核酸酶活性的氨基酸修饰的物理位置进行分析。如图16中所示,对若 干大范围核酸酶变体的观察发现在α螺旋-1位置12、16和19中的氨基酸 修饰与提高的活性相关联。α螺旋-1涵盖了SEQ ID NO:1中亚单位数1上 氨基酸8至19和亚单位数2上氨基酸195至206。另外,如图16中所示, 对若干大范围核酸酶变体的观察发现在α螺旋-5位置121、124、129、131 和132中的氨基酸修饰与提高的活性相关联。α螺旋-5涵盖了SEQ ID NO:1 中亚单位数1上氨基酸120-135和亚单位数2上氨基酸307至322。我们预 测在α螺旋-1和α螺旋-5中另外的氨基酸修饰具有导致活性提高超过对应 的参考大范围核酸酶的潜力。

    实例21

    将至少一个氨基酸修饰转移至其它的大范围核酸酶以创建具有提高活 性的大范围核酸酶变体。

    如实例3-19中所述,可将实例3-19中鉴定的氨基酸修饰的任何一个转 移至亲本大范围核酸酶以创建具有提高活性的大范围核酸酶变体。图14列 出了具有提高活性的I-CreI型大范围核酸酶变体的子集。可将这些氨基酸 修饰的任何一个组合以创建具有提高活性的新变体。

    本发明的一个实施例是将至少一个氨基酸修饰转移至亲本大范围核酸 酶从而提高所述亲本大范围核酸酶的活性,所述氨基酸修饰选自Y12至 H、G19至S或A、Q50至K或R、F54至I、D56至L、V105至A、E124 至R、V129至A、I132至V或T、D153至M或L、V316至A或I319至 V。

    实例22

    饱和诱变以创建具有提高活性的大范围核酸酶变体。

    可在实例3-21中所示的任一处氨基酸修饰位置进行饱和诱变。饱和诱 变会导致生成一组大范围核酸酶,其中一个氨基酸位置被所有可能的氨基 酸之一所替换。然后如上所述针对提高的活性对该大范围核酸酶组进行分 析,结果鉴定出针对一个氨基酸位置的会导致提高所述亲本大范围核酸酶 活性提高的多种可能的修饰。

    实例23

    创建和分析大豆中的TS21和TS14大范围核酸酶变体

    A.TS21和TS14识别位点和大范围核酸酶

    选择包含TS21识别序列(SEQ ID NO:423)或TS14识别序列(SEQ  ID NO:424)的内源性大豆基因组目标位点用于设计定制的双链断裂诱导 剂。提交于2012年3月22日的美国专利申请13/427138中已经描述了所述 大豆基因组目标位点和定制的TS21和TS14大范围核酸酶的设计,该文件 全文以引用方式并入。

    B.TS21和TS14大范围核酸酶变体

    为了测试LIG3-4氨基酸修饰(和对应的核苷酸修饰)是否也能提高大 豆TS21大范围核酸酶和TS14大范围核酸酶的活性,将LIG3-4(7)、 LIG3-4(15)和Lig3-4(B65)(表1A)所述的完全相同的核苷酸/氨基酸 修饰通过标准分子生物学技术导入TS21大范围核酸酶(SEQ ID NO:425和 429)和TS14大范围核酸酶(SEQ ID NO:433和435),得到下列三种 TS21大范围核酸酶变体和一种TS14大范围核酸酶变体:TS21(7)(SEQ  ID NO:426和430)、TS21(15)(SEQ ID NO:427和431)、TS21 (B65)(SEQ ID NO:428和432)和TS14(15)(SEQ ID NO:434和 436)变体。

    C.分析大豆中TS21和TS14变体的大范围核酸酶活性

    优化编码TS21和TS14大范围核酸酶变体的基因用于在植物中表达。 为了在大豆中有更好的性能,所述工程化的大范围核酸酶表达盒包含植物 密码子优化的核苷酸序列。通过如美国专利申请13/427138中所述的相同方 法制备针对这些大豆变体的植物表达载体。使用大豆泛素启动子和马铃薯 蛋白酶抑制剂II基因终止子序列来控制大范围核酸酶在大豆中的表达。美 国专利申请13/427138中描述了用于大豆转化、qPCR和针对TS21和TS14 目标位点的基因组PCR测定的方法。使用TS21和TS14识别序列特异性的 qPCR测定来鉴定序列变化。通过qPCR测定分析所有的抗潮霉素的大豆转 基因事件。由DNA裂解和修复形成的大范围核酸酶目标序列的改变,导致 所述大范围核酸酶目标位点的拷贝数从野生型大豆基因组的两个拷贝减少 到转基因事件中的一个或0个拷贝。从TS21和TS14目标位点的qPCR分 析,表明在大多数阳性转基因事件中所述目标位点的拷贝数减半,显示在 大豆基因组中所述识别位点的一个等位基因被大范围核酸酶切割/DNA修复 机制所破坏。如表17中所示,在与亲本TS21大范围核酸酶(8.7%)进行 比较时,将与LIG3-4变体相同的氨基酸修饰(突变)导入TS21大范围核 酸酶导致TS21目标位点突变率的大幅提高:TS21(7)大范围核酸酶变体 (32.1%)和对于TS21(15)大范围核酸酶变体(17.2%),对于TS21 (B65)大范围核酸酶变体为温和提高。如表18中所示,将LIG3-4(15) 突变导入TS14大范围核酸酶导致TS14目标位点突变率从对于亲本TS14 大范围核酸酶的16%下降至对于TS14(15)大范围核酸酶变体的4%突变 率。

    表17:

    在大豆中通过目标位点qPCR命中率(TS突变率)测定的TS21大范 围核酸酶变体的活性

    大范围核酸酶 分析的事件数量 TS突变率 TS21 184 8.7% TS21(7) 187 32.1% TS21(15) 192 17.2% TS21(B65) 134 12.7%

    表18:

    在大豆中通过目标位点qPCR命中率(TS突变率)测定的TS14大范 围核酸酶变体的活性

    大范围核酸酶 分析的事件数量 TS突变率 TS14 183 16% TS14(15) 192 4%

    关 键  词:
    包含 具有 范围 核酸酶 活性 序列 组合 方法
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:包含具有大范围核酸酶活性的序列的组合物和方法.pdf
    链接地址:https://www.zhuanlichaxun.net/p-8882814.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1