CN1636050A - 核心糖基化hcv包膜蛋白 - Google Patents

核心糖基化hcv包膜蛋白 Download PDF

Info

Publication number
CN1636050A
CN1636050A CNA028126076A CN02812607A CN1636050A CN 1636050 A CN1636050 A CN 1636050A CN A028126076 A CNA028126076 A CN A028126076A CN 02812607 A CN02812607 A CN 02812607A CN 1636050 A CN1636050 A CN 1636050A
Authority
CN
China
Prior art keywords
hcv
protein
envelope protein
hcv envelope
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA028126076A
Other languages
English (en)
Inventor
E·德普拉
A·博斯曼
G·德沙姆普斯
E·萨布伦
M·苏科夫
I·萨姆森
G·弗海登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujirebio Europe NV SA
Original Assignee
Innogenetics NV SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Innogenetics NV SA filed Critical Innogenetics NV SA
Publication of CN1636050A publication Critical patent/CN1636050A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/08RNA viruses
    • C07K14/18Togaviridae; Flaviviridae
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5258Virus-like particles
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24211Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
    • C12N2770/24222New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24211Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
    • C12N2770/24223Virus like particles [VLP]

Abstract

本发明涉及作为真核细胞表达产物的HCV包膜蛋白或其部分。更具体地说,所述HCV包膜蛋白特征在于它们平均高达80%的N-糖基化位点受到核心糖基化。在这些N-糖基化位点中,超过70%受到包含8到10个甘露糖的寡甘露糖的糖基化。此外,结构为Man(7)-GlcNAc(2)的寡甘露糖与结构为Man(8)-GlcNAc(2)的寡甘露糖的比例少于或等于0.45。少于10%的所述寡甘露糖以α1,3连接甘露糖终结。本发明的HCV包膜蛋白尤其适于诊断、预防和治疗目的。适于生产本发明所述HCV包膜蛋白的真核细胞是汉逊酵母属(Hansenula)细胞。

Description

核心糖基化HCV包膜蛋白
发明领域
本发明涉及重组蛋白表达的一般领域、诊断HCV感染、治疗或预防HCV感染以及预测/监测治疗慢性肝炎患者个体的临床功效或预测/监测所述天然疾病。
更具体地说,本发明涉及在酵母中表达丙型肝炎病毒包膜蛋白、用于表达核心糖基化病毒包膜蛋白的酵母菌株以及依照本发明的HCV包膜蛋白在诊断、预防或治疗中的应用。
发明背景
丙型肝炎病毒(HCV)感染是发达国家和发展中国家的一个主要健康问题。预计世界人口约1到5%受到该病毒感染。HCV感染看来是输血相关肝炎最重要的病因,并且常常发展成为慢性肝损害。此外,有证据显示HCV涉及诱导肝细胞癌。因此,对可靠诊断方法和有效治疗剂的需求非常大。另外还需要对受到HCV污染的血液制品的灵敏特异性筛选方法以及培养HCV的改良方法。
HCV是一种正链RNA病毒,约9,600个碱基,编码一种约3000个氨基酸的多蛋白前体。已经显示:偶联共翻译修饰和翻译后修饰的对所述前体的蛋白水解切割产生至少三种结构蛋白和六种非结构蛋白。根据序列同一性,已经将所述结构蛋白在功能上分为一个单一的核心蛋白和两个包膜糖蛋白E1和E2。所述E1蛋白由192个氨基酸组成,根据HCV基因型包含4到5个N-糖基化位点。所述E2蛋白由363到370个氨基酸组成,根据HCV基因型包含9到11个N-糖基化位点(综述见:Major和Feinstone,1997;Maertens和Stuyver,1997)。所述E1蛋白包含各种可变结构域(Maertens和Stuyver,1997)。所述E2蛋白包含三个高度可变结构域,其中主要的结构域位于蛋白N-末端(Maertens和Stuyver,1997)。所述HCV糖蛋白主要定位于ER中,它们在ER中受到修饰并装配成寡聚体复合物。
在真核细胞中,糖残基通常连接四种不同的氨基酸残基。这些氨基酸残基分类为O-联残基(丝氨酸、苏氨酸和羟赖氨酸)和N-联残基(天冬酰胺)。所述O-联糖在高尔基体或粗面内质网(ER)中从核苷酸糖合成。所述N-联糖从通用前体合成,随后受到加工。据信HCV包膜蛋白是N-糖基化的。本领域内已知添加N-联糖链对于稳定折叠中间体并因此有效折叠、预防在内质网中错折叠和降解、糖蛋白的寡聚化、生物活性和转运是重要的(见Rose等人,1988的综述;Doms等,1993;Helenius,1994)。多肽上的三肽序列Asn-X-Ser和Asn-X-Thr(其中X可以是任何氨基酸)是用于结合N-联寡糖的共有序列位点。在所述多肽上添加N-联寡糖后,所述寡糖进一步接受加工成为复合物类型(包含N-乙酰葡萄糖胺、甘露糖、果糖、半乳糖和唾液酸)或甘露糖丰富类型(包含N-乙酰葡萄糖胺和甘露糖)。据信HCV包膜蛋白属于甘露糖丰富类型。酵母中的N-联寡糖加工与哺乳动物高尔基体加工非常不同。在酵母中,所述寡糖链在高尔基体中通过逐步添加甘露糖而延长,产生精细的甘露糖丰富结构,这称为高度糖基化。与此不同,在原核细胞中表达的蛋白从不受到糖基化。
已经测定多种真核细胞内蛋白或肽的甘露糖丰富型糖基化的模式。在哺乳动物细胞中,平均5到9个甘露糖蛋白连接到核心糖基化类型寡糖的两个N-乙酰葡萄糖胺部分(该结构缩写为Man(5-9)GlcNAc(2))。核心糖基化指与Herscovics和Orleans(1993)的图3中方框内结构类似的结构。
据报道,甲基营养酵母巴斯德毕赤酵母(Pichia pastoris)连接平均8到14个甘露糖单位,即每个糖基化位点Man(8-14)GlcNAc(2)(Tschopp,EP0256421),并且约85%的N-联寡糖是在大小范围Man(8-14)GlcNAc(2)(Grinna和Tschopp 1989)。其他研究者已经公开连接在巴斯德毕赤酵母中表达的异源蛋白的有轻微不同的寡糖结构:Man(8-9)GlcNAc(2)(Montesino等1998),、Man(9-14)GlcNAc(2)或  Man(9-15)GlcNAc(2)(Kalidas等2001),以及Man(8-18)GlcNAc(2),其中大部分是Man(9-12)GlcNAc(2),主要的一般性寡糖是Man(10)GlcNAc(2)(Miele等1998)。Trimble等(1991)报道,在约75%的N-联寡糖中Man(8)GlcNAc(2)和Man(9)GlcNAc(2)相等分布,另外17%的N-糖基化位点被Man(10)GlcNAc(2)占据,剩余8%位点被Man(11)GlcNAc(2)占据。偶尔报道巴斯德毕赤酵母表达蛋白的高度糖基化(Scorer等1993)。
黑曲霉(Aspergillus niger)在N-糖基化位点上添加Man(5-10)GlcNAc(2)(Panchal和Wodzinski 1998)。
酿酒酵母(Saccharomyces cerevisiae)糖基化缺陷型突变异体mnn9与野生型酿酒酵母不同,mnn9细胞产生携带由Man(9-13)GlcNAc(2)组成的修饰寡糖的糖基化蛋白,而不是高度糖基化的蛋白(Mackay等,US5,135,854和Kniskern等,WO94/01132)。另一种酿酒酵母突变异体ochlmnn9据报道在蛋白的N-糖基化位点添加Man(8)GlcNAc(2)(Yoshifumi等JP06277086)。
酿酒酵母(野生型和mnn9突变异体)核心寡糖的特征是存在末端α1,3-连接甘露糖残基(Montesino等1998)。在巴斯德毕赤酵母或酿酒酵母och1mnn1内表达的蛋白的N-糖基化位点上连接的寡糖缺乏所述末端α1,3-连接甘露糖(Gellissen等2000)。末端α1,3-连接甘露糖据认为有变应原性(Jenkins等1996)。因此,在它们的寡糖上携带末端α1,3-连接甘露糖残基的蛋白不适用于诊断或治疗目的。
目前没有详细研究在甲基营养酵母多形汉逊酵母(Hansenulapolymorpha)中表达的蛋白上的糖基化模式,尽管人们应用该酵母生产很多种异源蛋白(见Gellissen等2000中的表3)。根据Janowicz等(1991)和Diminsky等(1997)的实验,似乎多形汉逊酵母不糖基化或仅仅很有限地糖基化所述大或小乙型肝炎病毒表面抗原(HBsAg)。很有可能这是由于HBsAg不带信号肽表达,因此防止产出的HBsAg进入内质网(ER)腔并受到糖基化。已经报道在多形汉逊酵母内产生的G-CSF(粒细胞集落刺激因子)上有限添加单己糖或双己糖(Fischer等在WO00/40727)。另一方面,观察到在多形汉逊酵母细胞内表达的异源α-半乳糖苷酶的高度糖基化(Fellinger等1991)。
目前,已经证明接种疫苗对抗疾病是控制疾病最节省成本和最有效的方法。然而,尽管结果很有希望,但发展有效HCV疫苗的努力受到许多困难的阻碍。疫苗的一个必要条件是在患者体内诱导免疫反应。因此,应当鉴定HCV抗原决定簇,并给予处于适当设置中的患者。抗原决定簇可以分为至少两种形式,即线性表位和构象表位。构象表位源于分子在三维空间的折叠,包括共翻译修饰和翻译后修饰,例如糖基化。一般地说,据信构象表位将实现最有效的疫苗,因为它们代表与天然样HCV表位类似的表位,并且可以比实际的线性氨基酸序列更好保存。因此,HCV包膜蛋白的最终糖基化程度对于产生天然样HCV抗原决定簇是最重要的。然而,看起来培养HCV有不能克服的困难,因为培养HCV仅产生微量病毒粒。此外,表达和纯化重组蛋白有很大困难,其中不是导致非常少量的蛋白、高度糖基化的蛋白,就是导致没有受到糖基化的蛋白。
已经通过重组技术在大肠杆菌(Escherichia coli)、昆虫细胞、酵母细胞和哺乳动物细胞中产生HCV包膜蛋白。然而,在高等真核细胞中表达的特点是难以获得大量用于最终疫苗生产的抗原。在原核生物例如大肠杆菌中的表达导致没有受到糖基化的HCV包膜蛋白。HCV包膜蛋白在酵母中的表达导致高度糖基化。如Maertens等已经在WO 96/04385中证明的,HCV包膜蛋白E2在酿酒酵母中的表达导致受到严重糖基化的蛋白。这种糖基化导致屏蔽蛋白表位。虽然Mustilli等(1999)声称HCV E2在酿酒酵母中的表达导致核心糖基化,但所述细胞内表达物质的结果证明部分所述物质至少受到高度糖基化,而没有显示所述物质剩余部分的正确加工。此外,Mustilli等(1999)观察到的高度糖基化只能在糖基化抑制剂衣霉素的存在下预防,而这并不反映正常天然生长条件下出现的糖基化。目前广泛认为有对细胞内来源的HCV包膜蛋白的需求(Maertens等,WO 96/04385,Heile等,2000)。该需求在Mustilli等(1999)的图5中得到进一步的举例说明,其中来自酵母的分泌型E2蛋白与用得自哺乳动物细胞培养物的E2蛋白免疫的黑猩猩的血清反应性差。这一点进一步得到Rosa等(1996)的证明,Rosa等显示用来自酵母的HCV包膜蛋白免疫不能保护免受攻击。
因此,需要有效的表达系统,所述表达系统产生有成本效率的大量蛋白,同时所述蛋白有不含末端α1,3-连接甘露糖的天然样糖基化模式。具体地说,需要所述系统以生产HCV包膜蛋白。
发明简述
本发明的第一方面涉及包含至少一个N-糖基化位点的分离的HCV包膜蛋白或其片段,所述蛋白或其片段的特征在于它是在真核细胞中表达的产物,并且平均高达80%的N-糖基化位点受到核心糖基化。具体地说,超过70%的所述核心糖基化位点受到Man(8-10)-GlcNAc(2)结构寡甘露糖的糖基化。此外,Man(7)-GlcNAc(2)结构寡甘露糖与Man(8)-GlcNAc(2)结构寡甘露糖的比例少于或等于0.45。更具体地说,所述寡甘露糖含少于10%的末端α1,3甘露糖。表达所述分离的HCV包膜蛋白或其部分的真核细胞可以是酵母细胞例如汉逊酵母属(Hansenula)细胞。
本发明的又一方面涉及依照本发明的分离的HCV包膜蛋白或其部分,所述分离的HCV包膜蛋白或其部分得自这样的蛋白:所述蛋白包含与所述HCV包膜蛋白或其片段连接的鸟溶菌酶前导肽或其功能变异体。更具体地说,所述分离的HCV包膜蛋白或其部分得自特征在于以下结构的蛋白
CL-[(A1)a-(PS1)b-(A2)c]-HCVENV-[(A3)d-(PS2)e-(A4)f]
其中:
CL是一种鸟溶菌酶前导肽或其功能等价物,
A1、A2、A3和A4是可以不同或相同的接头肽,
PS1和PS2是可以不同或相同的加工位点,
HCVENV是HCV包膜蛋白或其部分,
a、b、c、d、e和f是0或1,而且
其中,可选地A1和/或A2是部分PS1和/或其中A3和/或A4是部分PS2。
本发明的再一方面包括依照本发明的分离的HCV包膜蛋白或其片段,所述分离的HCV包膜蛋白或其片段包含在选自以下的结构中:单体、同二聚体、异二聚体、同寡聚体和异寡聚体。或者,依照本发明的所述分离的HCV包膜蛋白或其部分包含在病毒样颗粒中。更具体地说,依照本发明的任何所述分离的HCV包膜蛋白或其部分可以包含其中半胱氨酸硫醇基受到化学修饰的半胱氨酸。
本发明的特定方面涉及依照本发明的分离的HCV包膜蛋白或其片段,所述分离的HCV包膜蛋白或其片段有抗原性或免疫原性和/或包含刺激T细胞的表位。
本发明的另一方面涉及包含依照本发明的分离的HCV包膜蛋白或其片段的组合物。所述组合物还可以包含药学上可接受的载体,并且可以是药物或疫苗。
本发明还涉及生产依照本发明的分离的HCV包膜蛋白或其片段的方法。
本发明的另一方法是检测怀疑包含抗HCV抗体的样品中抗HCV抗体存在的方法,所述方法包括:
(i)使依照权利要求1到15中任一项的HCV包膜蛋白或其部分与所述样品在允许所述HCV包膜蛋白或其部分与所述抗HCV抗体复合的条件下接触,
(ii)检测(i)中形成的复合物,然后
(iii)从(ii)推导所述样品中所述抗HCV抗体的存在情况。
更具体地说,所述方法可以包括其中所述接触在竞争性条件下发生的步骤(i)。具体地说,所述方法可以利用附着有所述HCV包膜蛋白或其部分的固体支持物。
本发明还涉及用于检测抗HCV抗体在怀疑含有抗HCV抗体的样品中存在的诊断试剂盒,所述试剂盒包含依照本发明的HCV包膜蛋白或其部分。更具体地说,所述试剂盒可以包含附着在固体支持物上的所述HCV包膜蛋白或其部分。
本发明还涉及包含依照本发明的HCV包膜蛋白或其部分的药物或疫苗。
本发明还包括用于在哺乳动物体内诱导HCV特异性免疫反应的药用组合物,所述组合物包含有效量依照本发明的HCV包膜蛋白或其部分,并可选地包含药学上可接受的佐剂。或者所述药用组合物能够在哺乳动物体内诱导HCV特异性抗体或能够在哺乳动物体内诱导T细胞功能。此外,所述药用组合物可以是预防组合物或治疗组合物。具体地说,所述哺乳动物是人。
附图简述
图1是载体pGEMT-E1sH6RB的略图,所述载体具有SEQ IDNO:6定义的序列。
图2是载体pCHH-Hir的略图,所述载体具有SEQ ID NO:9定义的序列。
图3是载体pFPMT121的略图,所述载体具有SEQ ID NO:12定义的序列。
图4是载体pFPMT-CHH-E1-H6的略图,所述载体具有SEQ IDNO:13定义的序列。
图5是载体pFPMT-MFa-E1-H6的略图,所述载体具有SEQ IDNO:16定义的序列。
图6是载体pUC18-FMD-Mfa-E1-H6的略图,所述载体具有SEQID NO:17定义的序列。
图7是载体pUC18-FMD-CL-E1-H6的略图,所述载体具有SEQ IDNO:20定义的序列。
图8是载体pFPMT-CL-E1-H6的略图,所述载体具有SEQ IDNO:21定义的序列。
图9是载体pSP72E2H6的略图,所述载体具有SEQ ID NO:22定义的序列。
图10是载体pMPT121的略图,所述载体具有SEQ ID NO:23定义的序列。
图11是载体pFPMT-MFa-E2-H6的略图,所述载体具有SEQ IDNO:24定义的序列。
图12是载体pMPT-MFa-E2-H6的略图,所述载体具有SEQ IDNO:25定义的序列。
图13是载体pMF30的略图,所述载体具有SEQ ID NO:28定义的序列。
图14是载体pFPMT-CL-E2-H6的略图,所述载体具有SEQ IDNO:32定义的序列。
图15是载体pUC18-FMD-CL-E1的略图,所述载体具有SEQ IDNO:35定义的序列。
图16是载体pFPMT-CL-E1的略图,所述载体具有SEQ ID NO:36定义的序列。
图17是载体pUC18-FMD-CL-H6-E1-K-H6的略图,所述载体具有SEQ ID NO:39定义的序列。
图18是载体pFPMT-CL-H6-K-E1的略图,所述载体具有SEQ IDNO:40定义的序列。
图19是载体pYIG5的略图,所述载体具有SEQ ID NO:41定义的序列。
图20是载体pYIG5E1H6的略图,所述载体具有SEQ ID NO:42定义的序列。
图21是载体pSY1的略图,所述载体具有SEQ ID NO:43定义的序列。
图22是载体pSY1aMFE1sH6a的略图,所述载体具有SEQ IDNO:44定义的序列。
图23是载体pBSK-E2sH6的略图,所述载体具有SEQ ID NO:45定义的序列。
图24是载体pYIG5HCCL-22aH6的略图,所述载体具有SEQ IDNO:46定义的序列。
图25是载体pYYIGSE2H6的略图,所述载体具有SEQ ID NO:47定义的序列。
图26是载体pYIG7的略图,所述载体具有SEQ ID NO:48定义的序列。
图27是载体pYIG7E1的略图,所述载体具有SEQ ID NO:49定义的序列。
图28是载体pSY1YIG7E1s的略图,所述载体具有SEQ ID NO:50定义的序列。
图29是载体pPICZalphaA的略图,所述载体具有SEQ ID NO:51定义的序列。
图30是载体pPICZalphaD’的略图,所述载体具有SEQ ID NO:52定义的序列。
图31是载体pPICZalphaE’的略图,所述载体具有SEQ ID NO:53定义的序列。
图32是载体pPICZalphaD’E1sH6的略图,所述载体具有SEQ IDNO:58定义的序列。
图33是载体pPICZalphaE’E1sH6的略图,所述载体具有SEQ IDNO:59定义的序列。
图34是载体pPICZalphaD’E2sH6的略图,所述载体具有SEQ IDNO:60定义的序列。
图35是载体pPICZalphaE’E2sH6的略图,所述载体具有SEQ IDNO:61定义的序列。
图36是载体pUC18MFa的略图,所述载体具有SEQ ID NO:62定义的序列。
图37。IMAC纯化的E2-H6蛋白的大小排阻层析的洗脱分布,所述E2-H6蛋白从表达MFα-E2-H6的多形汉逊酵母表达(见实施例15)。X轴指示洗脱体积(mL)。通过洗脱分布的垂直线指示所收集的流分。“P1”=汇集的流分4-9,“P2”=汇集的流分30-35,“P3”=汇集的流分37-44。Y轴指示以mAU(毫吸光度单位)表示的吸光度。X轴指示以mL表示的洗脱体积。
图38。通过非还原性SDS-PAGE,然后对聚丙烯酰胺凝胶进行银染,分析大小排阻层析后收集的不同汇集物和流分。在银染凝胶图的顶部指示分析的汇集物(“P1”、“P2”和“P3”)和流分(16-26)。左边(道“M”)指示分子量标记的大小。
图39。汇集并烷基化如图37中所示大小层析步骤的流分17-23。此后,对蛋白物质进行Endo H处理以去糖基化。未处理的物质和经过Endo H处理的物质在SDS-PAGE凝胶上分离并印迹转移到PVDF膜上。用酰胺黑染色所述印迹。
道1:Endo H处理前的烷基化E2-H6
道2:Endo H处理后的烷基化E2-H6。
图40。蛋白质印迹分析细胞裂解物中在酿酒酵母中表达的E1。使用E1特异性单克隆抗体IGH 201显影所述蛋白质印迹。
道1-4:用pSY1YIG7E1s(SEQ ID NO:50,图28)转化的酵母克隆中分别表达2、3、5或7天后的表达产物,所述pSY1YIG7E1s包含编码连接E1-H6的鸡溶菌酶前导序列的核苷酸序列。
道5-7:用pSY1aMFE1sH6aYIG1(SEQ ID NO:44,图22)转化的酵母集落中分别表达2、3或5天后的表达产物,所述pSY1aMFE1sH6aYIG1包含编码连接E1-H6的α交配因子前导序列的核苷酸序列。
道8:分子量标记,大小如图指示。
道9:纯化的由HCV重组痘苗病毒感染的哺乳动物细胞产生的E1s。
图41。固定化金属离子亲和层析(IMAC)纯化的E2-H6蛋白的分析,所述E2-H6蛋白由多形汉逊酵母表达并从CL-E2-H6加工到E2-H6(见实施例17)。通过还原性SDS-PAGE和随后对凝胶的银染(A,顶图),或者通过使用针对E2的特异性单克隆抗体的蛋白质印迹分析(B,底图),分析不同洗涤流分(道2-4)和洗脱流分(道5-7)中的蛋白。分子量标记的大小示于左边。
图42。Ni-IDA柱(加载Ni2+的络合Sepharose FF,Pharmacia)上第一个IMAC层析步骤的洗脱分布,所述Ni-IDA柱用于纯化由多形汉逊酵母产生的磺化H6-K-E1蛋白(见实施例18)。用补充20mM咪唑的缓冲液A(50mM磷酸,6M GuHCl,1% Empigen BB(体积比),pH7.2)平衡该柱。上样后,顺序用分别含20mM和50mM咪唑的缓冲液A洗柱(如图谱指示)。顺序应用分别补充50mM咪唑和200mM咪唑的缓冲液B(PBS,1% empigen BB,pH 7.2),进一步洗柱并洗脱所述His标记的产物(如图谱指示)。汇集下面流分:洗柱汇集物1(流分8-11,用50mM咪唑洗柱)。收集独立流分63-72作为洗脱下来的物质,或者汇集洗脱物(流分63-69)。Y轴指示以mAU(毫吸光度单位)表示的吸光度。X轴指示以mL表示的洗脱体积。
图43。IMAC纯化的H6-K-E1蛋白(见图42)的分析,所述H6-K-E1蛋白由多形汉逊酵母表达并从CL-H6-K-E1加工到H6-K-E1。通过还原性SDS-PAGE并随后对所述凝胶进行银染(A,顶图),分析洗柱汇集物1(道12)和洗脱流分63-72(道2-11)中的蛋白。使用针对E1的特异性单克隆抗体,通过蛋白质印迹分析IMAC前(道2)、流出汇集物(道4)、洗柱汇集物(道5)和洗脱汇集物(道6)中存在的蛋白(B,底图;道3中没有加载样品)。左边指示分子量标记(道M)的大小。
图44。Ni-IDA柱(加载Ni2+的络合Sepharose FF,Pharmacia)上第二个IMAC层析步骤的洗脱分布,所述Ni-IDA柱用于纯化用EndoLys-C体外加工H6-K-E1得到的E1(纯化:见图42)。流出物收集在不同流分(1-40)中,筛选所述流分中E1s产物的存在。汇集包含从H6-K-E1加工得到的完整E1的流分(7-28)。Y轴指示以mAU(毫吸光度单位)表示的吸光度。X轴指示以mL表示的洗脱体积。
图45。指示与生物素化肝素反应的特异性E1s蛋白带的蛋白质印迹分析(另见实施例19)。分析从HCV重组痘苗病毒感染的哺乳动物细胞培养物纯化或由多形汉逊酵母表达的E1s制备物。垂直线的右图显示用生物素化E1特异性单克隆IGH 200显影的蛋白质印迹分析。垂直线的左图显示用生物素化肝素显影的蛋白质印迹分析。从这些结果可以得出结论:主要是低级糖基化的E1s对肝素有高亲和性。
道M:分子量标记(分子量指示于左边)。
道1:得自哺乳动物细胞并在分离中烷基化的E1s。
道2:由多形汉逊酵母表达并在分离中磺化的E1s-H6。
道3:由多形汉逊酵母表达并在分离中烷基化的E1s-H6。
道4:加载物质与道2相同,但用二硫苏糖醇处理将磺化Cys-硫醇基团转化为Cys-硫醇。
图46。纯化的多形汉逊酵母表达的E2-H6的大小排阻层析(SEC)分布,所述E2-H6处于磺化形式,在PBS,3%甜菜碱中处理,通过用甜菜碱交换Empigen BB强迫病毒样颗粒形成。用“_”指示用于进一步研究的包含所述VLP的汇集流分。Y轴指示以mAU(毫吸光度单位)表示的吸光度。X轴指示以mL表示的洗脱体积。另见实施例20。
图47。纯化的多形汉逊酵母表达的E2-H6的大小排阻层析(SEC)分布,所述E2-H6处于烷基化形式,在PBS,3%甜菜碱中处理,通过用甜菜碱交换Empigen BB强迫病毒样颗粒形成。用“_”指示包含所述VLP的汇集流分。Y轴指示以mAU(毫吸光度单位)表示的吸光度。X轴指示以mL表示的洗脱体积。另见实施例20。
图48。纯化的多形汉逊酵母表达的E1的大小排阻层析(SEC)分布,所述E1处于磺化形式,在PBS,3%甜菜碱中处理,通过用甜菜碱交换Empigen BB强迫病毒样颗粒形成。用“_”指示包含所述VLP的汇集流分。Y轴指示以mAU(毫吸光度单位)表示的吸光度。X轴指示以mL表示的洗脱体积。另见实施例20。
图49。纯化的多形汉逊酵母表达的E1的大小排阻层析(SEC)分布,所述E1处于烷基化形式,在PBS,3%甜菜碱中处理,通过用甜菜碱交换Empigen BB强迫病毒样颗粒形成。用“_”指示包含所述VLP的汇集流分。Y轴指示以mAU(毫吸光度单位)表示的吸光度。X轴指示以mL表示的洗脱体积。另见实施例20。
图50。如图48和49所述通过大小排阻层析(SEC)分离的VLP的SDS-PAGE(还原条件)和蛋白质印迹分析。左图:银染的SDS-PAGE凝胶。右图:使用针对E1的特异性单克隆抗体(IGH201)的蛋白质印迹。道1:分子量标记(分子量指示于左边);道2:包含磺化E1的VLP汇集物(cfr.图48);道3:包含烷基化E1的VLP汇集物(cfr.图48)。另见实施例20。
图51。将哺乳动物细胞产生的E1(“M”)或汉逊酵母属产生的E1(“H”)包被在ELISA固体支持物上,测定用哺乳动物细胞产生的E1免疫小鼠后(顶图)或用汉逊酵母属产生的E1免疫小鼠后(底图)血清中存在的抗体终点滴度。水平条代表平均抗体滴度。终点滴度指示于Y轴。另见实施例22。
图52。将烷基化汉逊酵母属产生的E1(“A”)或磺基化汉逊酵母属产生的E1(“S”)包被在ELISA固体支持物上,测定用烷基化汉逊酵母属产生的E1免疫小鼠后(顶图)或用磺基化汉逊酵母属产生的E1免疫小鼠后(底图)血清中存在的抗体终点滴度。水平条代表平均抗体滴度。终点滴度(稀释倍数)指示于Y轴。另见实施例23。
图53。将由HCV重组痘苗病毒感染的哺乳动物细胞产生的HCVE1和由多形汉逊酵母产生的HCV E1直接包被到ELISA板上。测定用哺乳动物细胞产生的E1接种的黑猩猩血清中抗体的终点滴度(顶图)和针对哺乳动物产生的E1而生成的鼠单克隆抗体的终点滴度(底图)。预防接种黑猩猩Yoran和Marti。治疗接种黑猩猩Ton、Phil、Marcel、Peggy和Femma。黑色条:用哺乳动物细胞产生的E1包被的ELISA板。空白条:用汉逊酵母属产生的E1包被的ELISA板。终点滴度(稀释倍数)指示于Y轴。另见实施例24。
图54。从由重组痘苗病毒感染的哺乳动物细胞产生的E1以及从由汉逊酵母属产生的E1-H6蛋白释放的寡糖的荧光团辅助糖电泳。
道1:葡萄糖梯度标准,左边指示单糖数目(3-10,用G3到G10指示)。
道2:从由哺乳动物细胞产生的(烷基化)E1释放的25μg N-联寡糖。
道3:从由汉逊酵母属产生的(烷基化)E1-H6释放的25μg N-联寡糖。
道4:100皮摩尔麦芽四糖。
另见实施例25。
图55。该图显示参比寡甘露糖Man-9(图55.A)、Man-8(图55.B)、Man-7(图55.C)、Man-6(图55.D)和Man-5(图55.E)的简化结构。“Man”=甘露糖;“GlcNAc”=N-乙酰葡萄糖胺;“α”=2个甘露糖之间的α键;“β”=2个甘露糖之间的β键;“(1-3)”、“(1-4)”和“(1-6)”=分别是2个甘露糖之间的(1-3)、(1-4)和(1-6)键。图55.B和图55.C中的括弧指示括弧左边的2和1甘露糖残基分别以α(1-2)键偶联括弧右边3个甘露糖残基中的2和1甘露糖残基。另见实施例26。
图56。该图显示由偶联几丁二糖的10个甘露糖部分组成的高级寡甘露糖。每个末端甘露糖残基通过α1-3键连接到一个非末端甘露糖残基。细的向上箭头指示易于受到α1-2甘露糖苷酶切割的寡糖键(这个寡甘露糖没有),粗的向上或向左箭头指示在移除所述α1-2连接的甘露糖后易于受到α甘露糖苷酶切割的寡糖键(不指这个寡甘露糖),空的向下箭头指示在移除所述α1-2连接的甘露糖后易于受到β甘露糖苷酶切割的寡糖键。另见实施例26。
图57。该图显示由偶联几丁二糖的9个甘露糖部分组成的高级寡甘露糖。在该寡甘露糖中,一个末端甘露糖残基通过α1-2键连接到所述非末端甘露糖残基。细的向上箭头指示易于受到α1-2甘露糖苷酶切割的寡糖键,粗的向上或向左箭头指示在移除所述α1-2连接的甘露糖后易于受到α甘露糖苷酶切割的寡糖键,空的向下箭头指示在移除所述α连接的甘露糖后易于受到β甘露糖苷酶切割的寡糖键。另见实施例26。
图58。该图显示由偶联几丁二糖的9个甘露糖部分组成的参比高级寡甘露糖Man-9。在该寡甘露糖中,所有末端甘露糖残基通过α1-2键连接一个非末端甘露糖残基。细的向上箭头指示易于受到α1-2甘露糖苷酶切割的寡糖键,粗的向上箭头指示在移除所述α1-2连接的甘露糖后易于受到α甘露糖苷酶切割的寡糖键,空的向下箭头指示在移除所述α连接的甘露糖后易于受到β甘露糖苷酶切割的寡糖键。另见实施例26。
图59。该图显示由偶联几丁二糖的8个甘露糖部分组成的高级寡甘露糖Man-8。在该寡甘露糖中,所有末端甘露糖残基通过α1-3或α1-6键连接一个非末端甘露糖残基,这使得该结构完全抗拒α1-2甘露糖苷酶的切割。粗的向上箭头指示易于受到α甘露糖苷酶切割的寡糖键,空的向下箭头指示在移除所述α连接的甘露糖后易于受到β甘露糖苷酶切割的寡糖键。另见实施例26。
图60。该图显示由偶联几丁二糖的7个甘露糖部分组成的高级寡甘露糖Man-7。在该寡甘露糖中,所有末端甘露糖残基通过α1-3键连接一个非末端甘露糖残基,这使得该结构完全抗拒α1-2甘露糖苷酶的切割。粗的向上箭头指示易于受到α甘露糖苷酶切割的寡糖键,空的向下箭头指示在移除所述α连接的甘露糖后易于受到β甘露糖苷酶切割的寡糖键。另见实施例26。
图61。该图显示由偶联几丁二糖的9个甘露糖部分组成的高级寡甘露糖。在该寡甘露糖中,一个末端甘露糖残基通过α1-2键连接到所述非末端甘露糖残基。细的向上箭头指示易于受到α1-2甘露糖苷酶切割的寡糖键,粗的向上或向左箭头指示在移除所述α1-2连接的甘露糖后易于受到α甘露糖苷酶切割的寡糖键,空的向下箭头指示在移除所述α连接的甘露糖后易于受到β甘露糖苷酶切割的寡糖键。另见实施例26。
图62。该图显示推定的包含葡萄糖的寡糖,所述寡糖由偶联几丁二糖的1或2个葡萄糖部分以及8个甘露糖部分组成。在该寡糖中A-或B-分支(图中的“A→”和“B→”)末端α1-2连接甘露糖残基中的任一个携带一个或两个葡萄糖残基,如括弧左边的(Glc)Glc所指示。细的向上箭头指示易于受到α1-2甘露糖苷酶切割的寡糖键,只要所述末端甘露糖残基没有连接葡萄糖。粗的向上或向左箭头指示在移除所述α1-2连接的甘露糖后易于受到α甘露糖苷酶切割的寡糖键,空的向下箭头指示在移除所述α连接的甘露糖后易于受到β甘露糖苷酶切割的寡糖键。实施例26的表10给出可能反应产物的综述。
图63。在偶联Waters Alliance HPLC工作站的TSK凝胶-酰胺-80(0.46×25cm,Tosoh Biosep)柱上分离的在有或没有外切糖苷酶存在下温育过夜的Man-9的反应产物。在室温1.0mL/min下进行寡糖分离。溶剂A是含0.1%乙酸的乙腈,溶剂B是含0.2%乙酸-0.2%三乙胺的水。使用28% B等度洗脱5个柱体积,然后在十五个柱体积内线性增加到45% B,分离2-AB标记的寡糖。洗脱溶剂的组成在右边Y轴表示为溶剂A中的%溶剂B(体积比)。洗脱时间在X轴上以分钟表示。左边的Y轴指示洗脱的2-氨基苯甲酰胺(2-AB)标记的寡糖的荧光。2-AB的激发波长是330nm,发射波长是420nm。
图谱的轨迹1(“1”)显示在没有外切糖苷酶存在下温育过夜的Man-9的洗脱。轨迹2(“2”)显示Man-9与α1-2甘露糖苷酶温育过夜后Man-5和Man-6混合物的洗脱。轨迹3和4(“3”和“4”)分别显示Man-9与α-甘露糖苷酶温育1h和温育过夜后4’-β-甘露糖基几丁二糖的洗脱。轨迹5(“5”)显示Man-9与α-和β-甘露糖苷酶温育过夜后几丁二糖的洗脱。轨迹1-5重叠显示,因此它们各自的基线并不都在零水平上。轨迹6(“6”)指示应用的溶剂梯度。
图顶部字母A到K指示的峰(如果存在)表示:A,几丁二糖;B,4’-β-甘露糖基-几丁二糖;C,Man-2;D,Man-3;E,Man-4;F,Man-5;G,Man-6;H,Man-7;I,Man-7;J,Man-8;和K,Man-10。另见实施例26。
图64。在偶联Waters Alliance HPLC工作站的TSK凝胶-酰胺-80(0.46×25cm,Tosoh Biosep)柱上分离的在有或没有外切糖苷酶存在下温育过夜的得自酵母产生的E1s的寡糖的反应产物。在室温1.0mL/min下进行寡糖分离。溶剂A是含0.1%乙酸的乙腈,溶剂B是含0.2%乙酸-0.2%三乙胺的水。使用28% B等度洗脱5个柱体积,然后在十五个柱体积内线性增加到45% B,分离2-AB标记的寡糖。洗脱溶剂的组成在右边Y轴表示为溶剂A中的%溶剂B(体积比)。洗脱时间在X轴上以分钟表示。左边Y轴指示洗脱的2-氨基苯甲酰胺(2-AB)标记的寡糖的荧光。2-AB的激发波长是330nm,发射波长是420nm。
图谱的轨迹1(“1”)显示在没有外切糖苷酶存在下温育过夜的得自酵母产生的E1s的寡糖的洗脱。轨迹2(“2”)显示Man-9与α1-2甘露糖苷酶温育过夜后得自酵母产生的E1s的寡糖的洗脱。轨迹3和4(“3”和“4”)分别显示得自酵母产生的E1s的寡糖与α-甘露糖苷酶温育1h和温育过夜后的洗脱。轨迹5(“5”)显示得自酵母产生的E1s的寡糖与α-和β-甘露糖苷酶温育过夜后的洗脱。轨迹1-5重叠显示,因此它们各自的基线并不都在零水平上。轨迹6(“6”)指示应用的溶剂梯度。
图顶部字母A到K指示的峰(如果存在)表示:A,几丁二糖;B,4’-β-甘露糖基-几丁二糖;C,Man-2;D,Man-3;E,Man-4;F,Man-5;G,Man-6;H,Man-7;I,Man-7;J,Man-8;和K,Man-10。另见实施例26。
图65。在偶联Waters Alliance HPLC工作站的TSK凝胶-酰胺-80(0.46×25cm,Tosoh Biosep)柱上分离的在有或没有外切糖苷酶存在下温育过夜的得自痘苗病毒转染哺乳动物细胞产生的E1s的寡糖的反应产物。在室温1.0mL/min下进行寡糖分离。溶剂A是含0.1%乙酸的乙腈,溶剂B是含0.2%乙酸-0.2%三乙胺的水。使用28% B等度洗脱5个柱体积,然后在十五个柱体积内线性增加到45% B,分离2-AB标记的寡糖。洗脱溶剂的组成在右边Y轴表示为溶剂A中的%溶剂B(体积比)。洗脱时间在X轴上以分钟表示。左边Y轴指示洗脱的2-氨基苯甲酰胺(2-AB)标记的寡糖的荧光。2-AB的激发波长是330nm,发射波长是420nm。
图谱的轨迹1(“1”)显示在没有外切糖苷酶存在下温育过夜的得自痘苗病毒转染哺乳动物细胞产生的E1s的寡糖的洗脱。轨迹2(“2”)显示Man-9与α1-2甘露糖苷酶温育过夜后得自痘苗病毒转染哺乳动物细胞产生的E1s的寡糖的洗脱。轨迹3和4(“3”和“4”)分别显示得自痘苗病毒转染哺乳动物细胞产生的E1s的寡糖与α-甘露糖苷酶温育1h和温育过夜后的洗脱。轨迹5(“5”)显示得自痘苗病毒转染哺乳动物细胞产生的E1s的寡糖与α-和β-甘露糖苷酶温育过夜后的洗脱。轨迹1-5重叠显示,因此它们各自的基线并不都在零水平上。轨迹6(“6”)指示应用的溶剂梯度。
图顶部字母A到K指示的峰(如果存在)表示:A,几丁二糖;B,4’-β-甘露糖基-几丁二糖;C,Man-2;D,Man-3;E,Man-4;F,Man-5;G,Man-6;H,Man-7;I,Man-7;J,Man-8;和K,Man-10。另见实施例26。
图66。在偶联Waters Alliance HPLC工作站的TSK凝胶-酰胺-80(0.46×25cm,Tosoh Biosep)柱上分离的在有或没有外切糖苷酶存在下温育过夜的得自汉逊酵母属产生的E1s的寡糖的反应产物。在室温1.0mL/min下进行寡糖分离。溶剂A是含0.1%乙酸的乙腈,溶剂B是含0.2%乙酸-0.2%三乙胺的水。使用28% B等度洗脱5个柱体积,然后在十五个柱体积内线性增加到45% B,分离2-AB标记的寡糖。洗脱溶剂的组成在右边Y轴表示为溶剂A中的%溶剂B(体积比)。洗脱时间在X轴上以分钟表示。左边Y轴指示洗脱的2-氨基苯甲酰胺(2-AB)标记的寡糖的荧光。2-AB的激发波长是330nm,发射波长是420nm。
图谱的轨迹1(“1”)显示在没有外切糖苷酶存在下温育过夜的得自汉逊酵母属产生的E1s的寡糖的洗脱。轨迹2(“2”)显示Man-9与α1-2甘露糖苷酶温育过夜后得自汉逊酵母属产生的E1s的寡糖的洗脱。轨迹3和4(“3”和“4”)显示得自汉逊酵母属产生的E1s的寡糖与α-甘露糖苷酶温育过夜后的洗脱。轨迹5(“5”)显示得自汉逊酵母属产生的E1s的寡糖与α-和β-甘露糖苷酶温育过夜后的洗脱。轨迹1-5重叠显示,因此它们各自的基线并不都在零水平上。轨迹6(“6”)指示应用的溶剂梯度。
图顶部字母A到K指示的峰(如果存在)表示:A,几丁二糖;B,4’-β-甘露糖基-几丁二糖;C,Man-2;D,Man-3;E,Man-4;F,Man-5;G,Man-6;H,Man-7;I,Man-7;J,Man-8;和K,Man-10。另见实施例26。
图67。对由汉逊酵母属产生的E1蛋白和由HCV重组痘苗病毒感染的哺乳动物细胞产生的E1蛋白的SDS-PAGE分析和考马斯亮蓝染色。道1:分子量标记,分子量指示于左边;道2:烷基化的由多形汉逊酵母产生的E1s(10μg);道3:烷基化的由多形汉逊酵母产生的E1s(5μg);道4:烷基化的由多形汉逊酵母产生的E1s(2.5μg);道5:烷基化的由HCV重组痘苗病毒感染的vero细胞产生的E1s(10μg);道6:烷基化的由HCV重组痘苗病毒感染的vero细胞产生的E1s(5μg);道7:烷基化的由HCV重组痘苗病毒感染的vero细胞产生的E1s(2.5μg)。另见实施例27。
图68。HCV E2-H6蛋白的序列(SEQ ID NO:5),其中指出去糖基化蛋白的胰蛋白酶片段(方框内的序列)。糖基化的Asn残基被PNGase F酶转化为Asp残基,在序列下用“*”指出。Asn残基易于受到Asp-N内切蛋白酶的蛋白水解切割。根据HCV多蛋白中的编号,E2-H6(SEQ ID NO:5)中可能的N-糖基化位点是N417、N423、N430、N448、N478、N532、N540、N556、N576、N623和N645;本图中这些位点编号为N34、N40、N47、N65、N95、N149、N157、N173、N193、N240和N262。另见实施例28。
发明详述
在获得本发明的工作中,观察到通过将糖基化HCV包膜蛋白作为包含与所述HCV包膜蛋白连接的信号肽序列的蛋白表达,在酿酒酵母、巴斯德毕赤酵母和多形汉逊酵母中表达所述HCV包膜蛋白是可能的。然而,这三种酵母物种中表达的所述HCV包膜蛋白的糖基化模式非常不同(见实施例6、10、13和25)。更具体地说,酿酒酵母(糖基化缺陷型突变异体)和多形汉逊酵母表达的HCV包膜蛋白以类似于核心糖基化的方式被糖基化。在巴斯德毕赤酵母中表达的HCV包膜蛋白受到高度糖基化,尽管先前报道在该酵母中表达的蛋白一般不受到高度糖基化(Gellissen等2000,Sugrue等1997)。
当进一步分析在酿酒酵母(糖基化缺陷型株)、多形汉逊酵母和HCV重组痘苗病毒感染的哺乳动物细胞中产生的HCV蛋白的糖基化模式时,惊人地发现汉逊酵母属产生的HCV包膜蛋白表现非常有利于这些HCV包膜蛋白的诊断、预防和治疗应用的糖基化模式(见实施例21-24和26-29)。这个意外的发现反映在下文展现的本发明的不同方面和实施方案中。
本发明的第一方面涉及包含至少一个N-糖基化位点的分离的HCV包膜蛋白或其片段,所述蛋白或其片段特征在于它是在真核细胞中表达的产物,并且特征在于平均高达50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%或80%的N-糖基化位点受到核心糖基化。更具体地说其中超过60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%或95%的所述N-糖基化位点受到结构为Man(8-10)-GlcNAc(2)的寡甘露糖的糖基化。更具体地定义上面任一N-糖基化特征,受到结构为Man(7)-GlcNAc(2)的寡甘露糖核心糖基化的位点与受到结构为Man(8)-GlcNAc(2)的寡甘露糖核心糖基化的位点的比例小于或等于0.15、0.2、0.25、0.30、0.35、0.40、0.44、0.45或0.50。另外更具体地定义上面任一N-糖基化特征,所述寡甘露糖含少于20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%或5%的末端α1,3甘露糖。
“受到结构为Man(8-10)-GlcNAc(2)的寡甘露糖的糖基化的N-糖基化位点”是指所述N-糖基化位点受到Man(8)-GlcNAc(2)、Man(9)-GlcNAc(2)或Man(10)-GlcNAc(2)中任一个的糖基化。
清楚的是两种蛋白中的相同N-糖基化位点可以被不同寡甘露糖占据。
术语“蛋白”指氨基酸的聚合物,而不指特定长度的产物;因此,在所述蛋白的定义中包括肽、寡肽或多肽。该术语还不指或排除蛋白的表达后修饰,例如糖基化、乙酰化、磷酸化等等。所述定义中包括,例如,包含一个或多个氨基酸类似物(包括,例如,非天然氨基酸,PNA等)的多肽、有取代键的多肽以及本领域内已知的天然出现或非天然出现的其它修饰的多肽。
“前原蛋白”或“前蛋白”在本文中分别指包含连接前原序列的目标蛋白的蛋白或者包含连接原序列的目标蛋白的蛋白。作为“前序列”的替代用词,使用“信号序列”、“信号肽”、“前导肽”或“前导序列”;它们都指将前蛋白靶向粗面内质网(ER)的氨基酸序列,而将前蛋白靶向粗面内质网(ER)是(N-)糖基化的前提条件。在所述ER的腔侧,由称为信号肽酶的宿主特异性蛋白酶清除所述“信号序列”、“信号肽”、“前导肽”或“前导序列”,即从包含连接所述信号序列的目标蛋白的蛋白中“除去”。同样,前原蛋白在转运到ER的腔时转化为原蛋白。根据所述“原”氨基酸序列的性质,可以由表达所述前原蛋白的宿主细胞去除或不去除。一个众所周知的前原氨基酸序列是酿酒酵母α交配因子的α交配因子前原序列。
“HCV包膜蛋白”指HCV E1或HCV E2包膜蛋白或其部分,由此所述蛋白可以得自任何基因型的HCV株。更具体地说,HCVENV选自以下氨基酸序列:SEQ ID NO:85-98、与SEQ ID NO:85-98至少90%相同的氨基酸序列以及上述任何一种的片段。如上所述,“相同的”氨基酸被认为是保守氨基酸的组,即包括Met、Ile、Leu和Val的组;包括Arg、Lys和His的组;包括Phe、Trp和Tyr的组;包括Asp和Glu的组;包括Asn和Gln的组;包括Cys、Ser和Thr的组;以及包括Ala和Gly的组。
更具体地说,术语“HCV包膜蛋白”涉及包含这样的氨基酸序列(和/或氨基酸类似物)的多肽或其类似物(如mimotope):所述氨基酸序列除糖基化位点外,还定义从E1区或E2区选出的至少一个HCV表位。这些包膜蛋白可以是重组表达的包膜蛋白的单体形式、异寡聚体形式或同寡聚体形式。一般定义所述表位的序列对应于HCV E1区或E2区的氨基酸序列(或者相同,或者通过不破坏所述表位的天然氨基酸残基的类似物进行取代)。
可以理解所述HCV表位可以与所述糖基化位点共同定位。
一般地说,所述定义表位的序列长度为3个或4个氨基酸,更一般地是长度为5个、6个或7个氨基酸,更一般地是长度为8个或9个氨基酸,甚至更一般地是长度为10个或更多氨基酸。至于构象表位,定义表位的序列长度可以有很大变化,因为据信这些表位通过所述抗原的三维形状形成(如折叠)。因此,定义所述表位的氨基酸可以在数量上相当少,但沿着通过折叠形成正确表位构象的分子的整个长度上广泛分布。在所述定义表位的残基之间的抗原部分对于所述表位的构象结构可以不是关键的。例如,这些间插序列的缺失或取代可以不影响所述构象表位,只要保持对于表位构象关键的序列(如涉及二硫键形成的半胱氨酸、糖基化位点等)。构象表位也可以通过同寡聚体或异寡聚体的亚单位的2个或更多个必需区形成。
在本文中,指定多肽的表位指具有与所述指定多肽的表位相同氨基酸序列的表位,和其免疫学等价物。所述等价物也可以包括株、亚型(=基因型)或型(组)特异性变异体,如目前已知的属于以下基因型的序列或菌株:1a、1b、1c、1d、1e、1f、2a、2b、2c、2d、2e、2f、2g、2h、2i、3a、3b、3c、3d、3e、3f、3g、4a、4b、4c、4d、4e、4f、4g、4h、4i、4j、4k、4l、5a、5b、6a、6b、6c、7a、7b、7c、8a、8b、9a、9b、10a、11(和其亚型)、12(和其亚型)或13(和其亚型)或任何其它新定义的HCV(亚)型。可以理解组成所述表位的氨基酸不一定是线性序列的部分,但可以在其中散布许多氨基酸,因此形成构象表位。
本发明的HCV抗原包括来自HCV E1和/或E2(包膜)结构域的构象表位。所述E1结构域据信对应于病毒包膜蛋白,目前估计跨越HCV多蛋白的氨基酸192-383(Hijikata等,1991)。在哺乳动物系统中表达时(受到糖基化),根据SDS-PAGE,据信它有35kDa的近似分子量。所述E2蛋白以前称为NS1,据信跨越所述HCV多蛋白的氨基酸384-809或384-746(Grakoui等,1993),并且也是包膜蛋白。在痘苗系统中表达时(受到糖基化),据信它有约72kDa的表观凝胶分子量。可以理解这些蛋白端点近似(如E2的羧基末端可能在730-820氨基酸区的某处,例如终止于氨基酸730、735、740、742、744、745,优选终止于746、747、748、750、760、770、780、790、800、809、810、820)。所述E2蛋白也可以与下面部分一起表达:E1、和/或核心蛋白(氨基酸1-191)、和/或P7(氨基酸747-809)、和/或NS2(氨基酸810-1026)、和/或NS3(氨基酸1027-1657)、和/或NS4A(氨基酸1658-1711)和/或NS4B(氨基酸1712-1972)和/或NS5A(氨基酸1973-2420)、和/或NS5B(氨基酸2421-3011)、和/或这些HCV蛋白任何一种中不同于E2的任何部分。同样,所述E1蛋白也可以与下面部分一起表达:E2、和/或核心蛋白(氨基酸1-191)、和/或P7(氨基酸747-809)、和/或NS2(氨基酸810-1026)、和/或NS3(氨基酸1027-1657)、和/或NS4A(氨基酸1658-1711)和/或NS4B(氨基酸1712-1972)和/或NS5A(氨基酸1973-2420)、和/或NS5B(氨基酸2421-3011)、和/或这些HCV蛋白任何一种中不同于E1的任何部分。与这些其它HCV蛋白一起表达可能对于获得正确的蛋白折叠是重要的。
本文所用术语“E1”也包括与天然E1在免疫学上有交叉反应性的类似物和截短形式,并且包括基因型1、2、3、4、5、6、7、8、9、10、11、12或13或任何其它新鉴定出的HCV型或亚型的E1蛋白。本文所用术语“E2”也包括与天然E2在免疫学上有交叉反应性的类似物和截短形式,并且包括基因型1、2、3、4、5、6、7、8、9、10、11、12或13或任何其它新鉴定出的HCV型或亚型的E2蛋白。例如,Kato等(1992)已经报道在密码子383和384之间多个密码子的插入,以及缺失氨基酸384-387。因此,还可以理解在本发明实施例部分中使用的分离物不意味着限制本发明的范围,并且来自1、2、3、4、5、6、7、8、9、10、11、12或13型或任何其它HCV新基因型的HCV分离物是用于实践本发明的E1和/或E2序列的合适来源。相似地,如上文所述,与本发明的HCV包膜蛋白共表达的HCV蛋白可以来自任何HCV型,因此也可以与本发明的HCV包膜蛋白来自同一型。
本文所用“E1/E2”指包含至少一个E1成分和至少一个E2成分的包膜蛋白寡聚体形式。
术语“特异性寡聚”E1和/或E2和/或E1/E2包膜蛋白指不是聚集物的重组表达E1和/或E2包膜蛋白的所有可能寡聚体形式。E1和/或E2特异性寡聚包膜蛋白也可以指同寡聚E1或E2包膜蛋白(见下文)。术语“单一或特异性寡聚”E1和/或E2和/或E1/E2包膜蛋白指单一的单体E1或E2蛋白(在严格词意上是单一的)以及特异性寡聚E1和/或E2和/或E1/E2重组表达蛋白。这些依照本发明的单一的或特异性寡聚包膜蛋白可以进一步用下式(E1)x(E2)y定义,其中x可以是0到100之间的数,y可以是0到100之间的数,只要x和y不同时是0。当x=1和y=0时所述包膜蛋白包括单体E1。
本文所用术语“同寡聚物”指包含一个以上E1或E2单体的E1或E2的复合物,例如E1/E1二聚体、E1/E1/E1三聚体或E1/E1/E1/E1四聚体和E2/E2二聚体、E2/E2/E2三聚体或E2/E2/E2/E2四聚体、E1五聚体和六聚体、E2五聚体和六聚体或者E1或E2任何更高级的同寡聚物都是本定义范围内的“同寡聚物”。所述寡聚物可以包含从丙型肝炎病毒不同型和亚型获得的E1或E2的一种、两种或几种不同单体,例如Maertens等在都是归于本申请人的WO94/25601和WO96/13590中所述的那些单体。所述混合的寡聚物仍然是本发明范围内的同寡聚物,并且可以允许更通用的HCV诊断、预防或治疗。
本发明使用的E1和E2抗原可以是全长病毒蛋白、其基本全长的形式或其功能片段(如包含至少一个表位和/或糖基化位点的片段)。此外,本发明的HCV抗原也可以包括不阻断或防止目的构象表位形成的其它序列。通过用抗体(针对所述构象表位的多克隆血清或单克隆血清)筛选所述目的抗原,然后比较它的反应性以及仅保留线性表位(如果有的话)的抗原失活形式的反应性,可以容易地确定构象表位的存在或不存在。在使用多克隆抗体的所述筛选中,比较有利的做法是首先用失活抗原吸附所述多克隆血清,观察它是否保留抗目的抗原的抗体。
本发明的HCV蛋白可以受到糖基化。糖基化蛋白指包含一个或多个糖类基团、尤其是糖基团的蛋白。一般地说,所有真核细胞都能够糖基化蛋白。在对各种HCV基因型的不同包膜蛋白序列进行排列对比后,可以推断,并非HCV E1蛋白上的所有6个糖基化位点都是正确折叠和反应性所需的。进一步可以知道,在位置325的糖基化位点没有受到N-糖基化修饰(Fournillier-Jacob等1996,Meunier等1999)。此外,HCV亚型1b E1蛋白包含6个糖基化位点,但其中一些糖基化位点在某些其它(亚)型中不存在。在1b、6a、7、8和9型中存在的第四个糖类基序(在Asn250上)在目前已知的所有其它型上不存在。可以突变该糖添加基序,产生反应性改善的1b型E1蛋白。同样,2b型序列显示在V5区上的所有额外糖基化位点(在Asn299上)。属于基因型2c的分离物S83甚至缺少在V1区上的第一个糖类基序(在Asn上),而该基序存在于所有其它分离物上(Stuyver等,1994)。然而,甚至在完全保守的糖添加基序中,糖类的存在可能不是折叠所需的,但可能在逃避免疫监督中起作用。因此,通过诱变所述糖基化基序,可以进一步测试糖基化作用。可以如下诱变糖基化基序(NXS或NXT序列):使编码N、S或T的密码子突变,以便这些密码子编码不同于N(在N的情况下)的氨基酸和/或不同于S或T(在S和在T的情况下)的氨基酸。或者,可以将所述X位置突变成为P,因为已知NPS或NPT不经常受到糖类的修饰。在确定那些糖类添加基序是折叠和/或反应性所需、哪些不是所需之后,可以组合所述突变。所述实验已经由Maertens等在WO96/04385的实施例8中广泛描述,所述参考资料特此通过引用结合到本文中。
本发明所用术语糖基化在没有特别说明的情况下,指N-糖基化。
具体地说,本发明涉及核心糖基化HCV包膜蛋白或其部分。在这方面,术语“核心糖基化”指与Herscovics和Orlean(1993)在图3的方框结构中描述的结构类似的结构。因此,所述糖类结构指含10到11个单糖。特别地,所通过引用将所述公开物结合到本文中。术语“类似于”指在所述结构中添加不超过4个另外添加的单糖,或者从所述结构中除去不多于约3个单糖。因此,在本发明中所指的所述核心糖基化糖类结构包括最少7个、最多15个单糖,并且可以包括8、9、10、11、12、13或14个单糖。所指的单糖最好是葡萄糖、甘露糖或N-乙酰葡萄糖胺。
本发明一个可替代的方面涉及包含至少一个N-糖基化位点的分离的HCV包膜蛋白或其片段,所述蛋白或其片段的特征在于它是真核细胞中表达的产生,其它特征在于超过60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%或95%的所述N-糖基化位点受到结构为Man(8-10)-GlcNAc(2)的寡甘露糖的糖基化。更具体地定义上面的N-糖基化特征,受到结构为Man(7)-GlcNAc(2)的寡甘露糖核心糖基化的位点与受到结构为Man(8)-GlcNAc(2)的寡甘露糖核心糖基化的位点的比例小于或等于0.15、0.2、0.25、0.30、0.35、0.40、0.44、0.45或0.50。另外更具体地定义上面任一N-糖基化特征,所述寡甘露糖含少于20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%或5%的末端α1,3甘露糖。
本发明另一可替代的方面涉及包含至少一个N-糖基化位点的分离的HCV包膜蛋白或其片段,所述蛋白或其片段的特征在于它是真核细胞中表达的产生,其它特征在于N-糖基化位点受到寡甘露糖的糖基化,其中结构为Man(7)-GlcNAc(2)的寡甘露糖与结构为Man(8)-GlcNAc(2)的寡甘露糖的比例小于或等于0.15、0.2、0.25、0.30、0.35、0.40、0.44、0.45或0.50。另外更具体地定义上面任一N-糖基化特征,所述寡甘露糖含少于20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%或5%的末端α1,3甘露糖。
在本发明的又一可替代方面,包含至少一个N-糖基化位点的分离的HCV包膜蛋白或其片段,所述蛋白或其片段的特征在于它是在非哺乳动物真核细胞中表达的产物,其它特征在于N-糖基化位点的数目比从痘苗病毒在易于受到所述痘苗病毒感染的真核细胞中表达出的同样蛋白或其片段中的N-糖基化位点少至少5%、6%、7%、8%、9%、10%、11%、12%、13%、14%或15%。更具体地补充上面的N-糖基化特征,高达50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%或80%的所述N-糖基化位点受到核心糖基化。更具体地说其中超过60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%或95%的所述N-糖基化位点受到结构为Man(8-10)-GlcNAc(2)的寡甘露糖的糖基化。更具体地定义上面任一N-糖基化特征,受到结构为Man(7)-GlcNAc(2)的寡甘露糖核心糖基化的位点与受到结构为Man(8)-GlcNAc(2)的寡甘露糖核心糖基化的位点的比例小于或等于0.15、0.2、0.25、0.30、0.35、0.40、0.45或0.50。另外更具体地定义上面任一N-糖基化特征,所述寡甘露糖含少于20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%或5%的末端α1,3甘露糖。
在本发明另一方面,依照本发明的分离的HCV包膜蛋白或其部分是在酵母细胞中表达的产物。更具体地说,依照本发明的所述分离的HCV包膜蛋白或其部分是在下面酵母株的细胞中表达的产物:酵母属,例如酿酒酵母、克雷弗酵母(Saccharomyces kluyveri)、或葡萄汁酵母(Saccharomyces uvarum),裂殖酵母属(Schizosaccharomyces),例如粟酒裂殖酵母(Schizosaccharomycespombe),克鲁维酵母属(Kluyveromyces),例如乳酸克鲁维酵母(Kluyveromyces lactis),Yarrowia,例如Yarrowia lipolytica,汉逊酵母属,例如多形汉逊酵母,毕赤酵母属(Pichia),例如巴斯德毕赤酵母,曲霉属(Aspergillus species),脉孢菌属(Neurospora),例如粗糙脉孢菌(Neurospora crassa),或许旺酵母属(Schwanniomyces),例如许旺酵母(Schwanniomyces occidentalis),或者来自上面任何一种的突变细胞。更具体地说,依照本发明的所述分离的HCV包膜蛋白或其部分是在汉逊酵母属细胞中表达的产物。甚至更具体地说,依照本发明的所述分离的HCV包膜蛋白或其部分是在缺乏糖基化抑制剂如衣霉素的存在下在酵母如汉逊酵母属细胞中表达的产物。
在本发明的再一方面,依照本发明的所述分离的HCV包膜蛋白或其部分来自于包含与所述HCV包膜蛋白或其片段连接的鸟溶菌酶前导肽或其功能变异体的蛋白。更具体地说,依照本发明的所述分离的HCV包膜蛋白或其部分来自于特征在于下面结构的蛋白
CL-[(A1)a-(PS1)b-(A2)c]-HCVENV-[(A3)d-(PS2)e-(A4)f]
其中:
CL是一种鸟溶菌酶前导肽或其功能等价物,
A1、A2、A3和A4是可以不同或相同的接头肽,
PS1和PS2是可以不同或相同的加工位点,
HCVENV是HCV包膜蛋白或其部分,
a、b、c、d、e和f是0或1,而且
其中,可选地A1和/或A2是部分PS1和/或其中A3和/或A4是部分PS2。
“连接HCV包膜蛋白或其部分的鸟前导肽或其功能等价物”指所述前导肽的C末端氨基酸通过肽键共价连接所述HCV包膜蛋白或其部分的N末端氨基酸。或者,所述前导肽的C末端氨基酸与所述HCV包膜蛋白或其部分的N末端氨基酸之间由肽或蛋白分隔开。所述肽或蛋白可能有如上文所定义的结构-[(A1)a-(PS1)b-(A2)c]。
从包含连接HCV包膜蛋白或其部分的鸟溶菌酶前导肽或其功能等价物的蛋白获得目的HCV包膜蛋白,或者从特征在于结构CL-[(A1)a(PS1)b-(A2)c]-HCVENV-[(A3)d-(PS2)e-(A4)f]的蛋白衍生,可以由表达所述前蛋白的细胞的蛋白水解机制在体内进行。更具体地说,去除所述鸟前导肽的步骤最好由表达所述前蛋白的细胞的蛋白水解机制在体内进行。然而,也可以单独在体外在从表达所述前蛋白的细胞和/或从表达所述前蛋白的细胞所生长的培养液中分离和/或纯化所述前蛋白和/或蛋白之后或期间进行衍生。或者,所述体内衍生与所述体外衍生组合进行。从重组表达的前蛋白衍生所述目的HCV蛋白可以进一步包括在精制步骤中应用蛋白水解酶,在所述精制步骤中所有或大多数与目的蛋白共存的污染蛋白被降解,并且其中目的蛋白抗所述精制蛋白水解酶。衍生和精制并不是相互排斥的工艺,可以使用同一种蛋白水解酶进行。本文给出一个例子是缺乏Lys残基的HCV基因型1b的HCV E1s蛋白(SEQ ID NO:2)。通过用内切蛋白酶Lys-C(endo-lys C)消化包含所述HCV E1蛋白的蛋白提取物,所述E1蛋白不被降解,而包含一个或多个Lys残基的污染蛋白被降解。所述过程可以显著简化或增强所述HCV E1蛋白的分离和/或纯化。此外,通过在前蛋白中添加额外的Lys残基,如添加在前导肽和HCV E1蛋白之间,有可能在体外将所述HCV E1前蛋白与所述前导肽正确地分离开。其它HCV E1蛋白可以在位置4、40、42、44、61、65或179中的一个或多个包含Lys残基(其中位置1是所述E1蛋白的第一个N末端天然氨基酸,即在HCV多蛋白中的位置192)。为使得能够如上文所述应用endo-lys C,可以将所述Lys残基突变成为另一种氨基酸残基,最好是突变成为Arg残基。
“正确地去除”前导肽是指高效并且高保真性地从包含连接目的蛋白的信号序列的蛋白中去除所述前导肽,高效即大量前(原)蛋白转化成(原)蛋白,高保真性即仅去除所述前氨基酸序列,而不去除连接所述前氨基酸序列的所述目的蛋白的任何氨基酸。“高效去除前导肽”指至少约40%,但更优选约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或甚至99%的所述前蛋白转化为去除所述前序列的蛋白。或者,如果所述表达的前蛋白的大部分没有转化为去除所述前序列的蛋白,这些前蛋白仍然可以纯化或者在纯化过程中去除。
“鸟溶菌酶(CL)前导肽的功能等价物”指其中一个或多个氨基酸已经被另一种氨基酸取代的CL前导肽,其中所述取代是保守氨基酸取代。“保守氨基酸取代”指用属于保守氨基酸组的一种氨基酸取代属于同一保守氨基酸组的另一氨基酸。被认为是保守氨基酸组的有:Met、Ile、Leu和Val组成的组;Arg、Lys和His组成的组;Phe、Trp和Tyr组成的组;Asp和Glu组成的组;Asn和Gln组成的组;Cys、Ser和Thr组成的组;Ala和Gly组成的组。所述CL前导肽中保守氨基酸取代的一个例子是在位置6的天然变异,在该位置的氨基酸是Val或Ile;另一个变异发生在位置17,在该位置的氨基酸是Leu或Pro(见SEQ ID NO:1)。因此,认为所得的CL前导肽是功能等价物。所述CL前导肽的其它功能等价物包括那些重复如本发明中全文所述的CL前导肽的同样技术方面的前导肽,包括缺失变异体和插入变异体。
“A”或“接头肽”指作为如前导肽和加工位点(PS)之间、前导肽和目的蛋白之间、PS和目的蛋白之间和/或目的蛋白和PS之间的连接物的肽(如1-30个氨基酸)或蛋白;和/或作为例如前导肽、PS或目的蛋白的连接物N末端或C末端的肽(如1-30个氨基酸)或蛋白。接头肽“A”可以具有某种三维结构,如α-螺旋结构或β-折叠结构或它们的组合。或者所述A的三维结构不是充分确定的,例如卷曲螺旋结构。所述接头A可以是例如前序列、原序列、目的蛋白序列或加工位点的一部分。所述接头A可以作为标记,增强或使得能够检测和/或纯化和/或加工其中A是一部分的蛋白。A肽的一个例子是his标记肽(HHHHHH;SEQ ID NO:63)Hn,其中n通常是六,但可以是7、8、9、10、11或12。A肽的其它例子包括肽EEGEPK(Kjeldsen等在WO98/28429中;SEQ ID NO:64)或EEAEPK(Kjeldsen等在WO97/22706中;SEQ ID NO:65),据报道当所述肽存在于目的蛋白的N末端时,增加发酵产量但同时保护目的蛋白的N末端不受到二肽基氨肽酶的加工,因此产生所述多肽的同源N末端。同时,通过使用在所述肽中切割Lys残基的C末端的endo-lys C,可以完成目的蛋白的体外成熟,即从目的蛋白除去所述肽EEGEPK(SEQ ID NO:64)和EEAEPK(SEQ ID NO:65)。因此,所述肽起接头肽(A)以及加工位点(PS)的功能(见下文)。在SEQ ID NO:63-65、70-72和74-82中给出接头肽。接头肽的另一个例子是G4S免疫沉默连接物。接头肽或接头蛋白的其它例子列于Stevens的表2(Stevens等2000)。
“PS”或“加工位点”指特异性蛋白加工或可加工位点。所述加工可以通过酶促或通过化学方法发生。易于受到特异性酶促加工的加工位点的例子包括IEGR↓X(SEQ ID NO:66)、IDGR↓X(SEQ IDNO:67)、AEGR↓X(SEQ ID NO:68),所有这些加工位点都在如“↓”所示的Arg和Xaa(任何氨基酸)残基之间被牛Xa因子蛋白酶识别和切割(Nagai,K.和Thogersen,H.C.1984)。PS位点的另一个例子是二碱性位点,如Arg-Arg、Lys-Lys、Arg-Lys或Lys-Arg,它们可以被酵母Kex2蛋白酶切割(Julius,D.等1984)。所述PS位点也可以是单碱性Lys位点。在A肽的C末端也可以包括所述单碱性Lys-PS位点。SEQ ID NO:64-65和74-76给出包含C末端单碱性Lys-PS位点的A接头肽的例子。单独使用二肽基氨肽酶I(DAPase)或者与谷氨酰胺环化转移酶(Qcyclase)和焦谷氨酸氨肽酶(pGAPase)组合使用,有可能外切蛋白水解去除His标记(HHHHHH;SEQ ID NO:63)(Pedersen,J.等1999)。包含重组His标记的所述外切肽酶(允许通过固定化金属亲和层析IMAC从反应混合物中去除所述肽酶)可以购买到,例如UnizymeLaboratories的TAGZyme(Horsholm,DK)。因此,“加工”一般指由此蛋白在至少一个加工位点(当所述蛋白中存在所述加工位点时)被特异性切割或可以被特异性切割的方法或程序。PS可以易于受到内切蛋白水解切割或易于受到外切蛋白水解切割,在任何情况下所述切割都是特异性的,即不扩大到受所述加工蛋白水解酶识别位点以外的位点。在SEQ ID NO:66-68和83-84中给出一些PS位点。
如上文略述的所述[(A1/3)a/d-(PS1/2)b/e-(A2/4)c/f]结构的多功能通过一些例子加以说明。在第一个例子中,所述结构存在于包含在前蛋白中的目的蛋白的C末端,其中A3是与Xa因子“IEGRX”PS位点(SEQ ID NO:66)重叠的“VIEGR”肽(SEQ ID NO:69),其中X=A4是组氨酸标记(SEQ ID NO:63)(因此在这种情况下,d、e和f都是1)。可以(可选地)通过IMAC纯化目的HCV蛋白。在用因子Xa加工后,所述(可选纯化)目的HCV蛋白可以在其C末端携带“IEGR”(SEQ IDNO:70)加工PS位点。Xa因子加工位点的变异体可能是IDGR(SEQ IDNO:71)或AEGR(SEQ ID NO:72)。在另一个例子中,所述[(A1/3)a/d-(PS1/2)b/e-(A2/4)c/f]结构存在于目的HCV蛋白的N末端。此外,A1是组氨酸标记(SEQ ID NO:63),PS是Xa因子识别位点(SEQ IDNO:66-68中的任一个),其中X是目的蛋白,其中a=b=1以及c=0。当例如由宿主细胞正确去除前导肽后,可以通过IMAC(可选)纯化得到的目的HCV蛋白。当用Xa因子加工过后,所述目的蛋白可以缺乏所述[(A1)a-(PS1)b-(A2)c]结构。
另外清楚的是,当A1、A2、A3、A4、PS1和PS2中任一种存在的时候,可以以重复结构存在。所述重复结构当存在时,在本文中仍然计数为1,即尽管例如A1以如2个重复(A1-A1)出现,a、b、c、d、e或f仍然是1。
本发明的另一方面涉及依照本发明的分离的HCV包膜蛋白或其片段中的任一种,在所述分离的HCV包膜蛋白或其片段中半胱氨酸的硫醇基团受到化学修饰。
本发明的再一方面具有抗原性的依照本发明的分离的HCV包膜蛋白或其片段中的任一种。
本发明的又一方面涉及具有免疫原性的依照本发明的分离的HCV包膜蛋白或其片段中的任一种。
本发明的另一方面涉及包含刺激T细胞的表位的依照本发明的分离的HCV包膜蛋白或其片段中的任一种。
本发明的再一方面涉及本发明的分离的HCV包膜蛋白或其片段中的任一种,所述分离的HCV包膜蛋白或其片段包含在从单体、同二聚体、异二聚体、同寡聚体和异寡聚体选出的结构中。
本发明的又一方面涉及包含在病毒样颗粒中的依照本发明的分离的HCV包膜蛋白或其片段中的任一种。
在如本文所述包含至少一个半胱氨酸残基、但优选2个或更多半胱氨酸残基的HCV包膜蛋白或其部分中,可以通过化学方法或酶促方法可逆保护所述半胱氨酸的硫醇基团。具体地说,通过化学方法“可逆保护”或“可逆封闭”指烷基化,优选通过烷基化试剂例如活性卤素、乙烯亚胺或N-(碘乙基)三氟乙酰胺烷基化所述HCV包膜蛋白。在这方面,应当知道对半胱氨酸硫醇基团的烷基化指用(CH2)nR取代硫醇氢,其中n是0、1、2、3或4,R=H、COOH、NH2、CONH2、苯基或其任何衍生物。可以通过本领域内已知的任何方法进行烷基化,例如使用活性卤素X(CH2)nR,其中X是卤素例如I、Br、Cl或F。活性卤素的例子有甲基碘、碘乙酸、碘乙酰胺和2-溴乙胺。其它烷基化方法包括应用NEM(N-乙基顺丁烯二酰亚胺)或生物素-NEM、它们的混合物或乙烯亚胺或N-(碘乙基)三氟乙酰胺,它们都导致用-CH2-CH2-NH2取代-H(Hermanson,G.T.1996)。本文所用术语“烷基化试剂”指能够进行如本文所述的烷基化的化合物。所述烷基化最后导致修饰的半胱氨酸,所述修饰的半胱氨酸可以模拟其它氨基酸。通过乙烯亚胺烷基化导致类似于赖氨酸的结构,以致引入胰蛋白酶所用的新切割位点(Hermanson,G.T.1996)。相似地,应用甲基碘导致类似于甲硫氨酸的氨基酸,而应用碘乙酸和碘乙酰胺导致分别类似于谷氨酸和谷氨酰胺的氨基酸。依此类推,这些氨基酸优选用于直接突变半胱氨酸。因此,本发明适合于如本文所述的HCV包膜蛋白,其中如本文所述的HCV包膜蛋白中的至少一个半胱氨酸残基突变成为天然氨基酸,优选突变成为甲硫氨酸、谷氨酸、谷氨酰胺或赖氨酸。术语“突变(的)”指定点诱变编码这些氨基酸的核酸,即指本领域内众所周知的方法,例如通过如在(Sambrook,J.等1989)中所述的PCR或通过寡核苷酸介导的诱变进行定点诱变。应当知道,对于本发明的实施例部分,除特别指出外,烷基化指应用碘乙酰胺作为烷基化剂。
还应当知道,在纯化程序中,可以可逆地保护本发明所述HCV蛋白或其部分的半胱氨酸硫醇基团。可逆保护的目的是稳定所述HCV蛋白或其部分。尤其是在可逆保护后,包含硫的功能基团(如硫醇和二硫化物)保持在无反应性的状态。因此所述包含硫的功能基团不能与其它化合物反应,如已经丧失他们形成或交换二硫键的趋势,例如
在硫醇和/或二硫化物残基之间的所述反应不限于分子间的过程,但也可以在分子内发生。
本文所用术语“可逆保护”或“可逆封闭”设想使修饰剂共价结合所述半胱氨酸硫醇基团,并且操作所述HCV蛋白的环境,以便在纯化程序的随后步骤中所述半胱氨酸硫醇基团的氧化还原状态保持不受影响(屏蔽)。可以用化学方法或酶促方法进行所述半胱氨酸硫醇基团的可逆保护。
本文所用术语“通过酶促方法可逆保护”设想酶介导的可逆保护,例如酰基转移酶,如参与催化硫醇基酯化的酰基转移酶,例如棕榈酰酰基转移酶(见下文)。
本文所用术语“通过化学方法可逆保护”设想通过以下化学方法可逆保护:
1.通过例如通过磺化和硫醇酯化可逆修饰半胱氨酰基的修饰剂;
磺化是其中参与二硫键的硫醇或半胱氨酸被修饰成为S-磺酸盐的反应:RSH→RS-SO3 -(Darbre,A.1986)或RS-SR→2RS-SO3 -(亚硫酸盐解;(Kumar,N.等1986))。磺化剂是例如NaSO3或四硫代硫酸钠。后一种磺化剂以10-200mM的浓度使用,更优选以50-200mM的浓度使用。可选地在催化剂例如Cu2+(100μM-1mM)或半胱氨酸(1-10mM)存在下进行磺化。
可以在使蛋白失活的条件以及天然条件下进行所述反应(Kumar,N.等1985,Kumar,N.等1986)。
硫酯键形成或硫醇酯化的特征在于:
其中X优选是化合物R’CO-X的卤化物。
2.通过可逆修饰本发明的半胱氨酰基的修饰剂,例如重金属尤其是Zn2+、Cd2+,单硫代化物、二硫代化合物以及二硫化物(如芳基和烷基甲硫代磺酸酯、二硫代吡啶、二硫代吗啉、二氢硫辛酰胺、Ellmann试剂、aldrothiolTM(Alderich)(Rein,A.等1996)、二硫代氨基甲酸酯)或硫醇化剂(如gluthathion、N-乙酰半胱氨酸、半胱氨酸胺)。二硫代氨基甲酸酯包括一大类具有R1R2NC(S)SR3功能基团的分子,该基团赋予它们与巯基基团反应的能力。包含硫醇的化合物优选以0.1-50mM的浓度应用,更优选以1-50mM的浓度应用,甚至更优选以10-50mM的浓度应用;
3.通过保持硫醇化状态的修饰剂的存在(稳定),尤其是抗氧化剂,例如DTT、二氢抗坏血酸、维生素和衍生物、甘露醇、氨基酸、肽和衍生物(如组氨酸、麦角硫因、肌肽、甲硫氨酸)、没食子酸、羟基茴香醚、羟基甲苯、氢醌、羟甲基苯酚和它们的衍生物,浓度范围为10μM-10mM,更优选1-10mM的浓度;
4.通过硫醇稳定条件,例如,(i)辅因子例如金属离子(Zn2+、Mg2+)、ATP,(ii)pH控制(如对于蛋白,在大多数情况下是pH约5,或者优选pH为硫醇pKa-2;如对于通过反相层析纯化的肽,pH约2)。
如(1)、(2)、(3)和(4)中所述可逆保护的组合可能相似地导致纯的和重折叠的HCV蛋白。实际上,可以使用组合化合物,例如Z103(Zn肌肽),最好以1-10mM的浓度应用。应当清楚的是,可逆保护除上述修饰基团或屏蔽外,还指任何通过酶促方法或化学方法可以逆转、同时不打断肽骨架的半胱氨酰基保护方法。在这一方面,本发明特别地指通过传统化学合成(见下文)制备的肽,其中,例如通过在碱性缓冲液条件下通过硫酯酶(Beekman,N.J.等1997)或通过羟胺处理(Vingerhoeds,M. H.等1996)切割硫酯键。
例如可以在亲和层析树脂上纯化包含硫醇的HCV蛋白,所述亲和层析树脂包含(1)含有二硫键的可切割连接物(如固定化的5,5’二硫代二(2-硝基苯甲酸)(Jayabaskaran,C.等1987)以及在活化的硫醇-Sepharose 4B(Pharmacia)上的共价层析)或(2)作为固定化配体的氨基己酰-4-氨基苯胂。后一种亲和基质已经用于纯化蛋白,所述蛋白是受到氧化还原调节的蛋白以及氧化压力靶的二硫醇蛋白(Kalef,E.等1993)。
也可以使用可逆保护增加肽的稳定和提取(Pomroy,N.C.和Deber,C.M.1998)。
所述可逆保护和稳定硫醇的化合物也可以以单体、聚合物或脂质体的形式存在。
可以用化学方法或酶促方法去除所述半胱氨酸残基的可逆保护状态,如:
-还原剂,尤其是DTT、DTE、2-巯基乙醇、连二亚硫酸盐、SnCl2、硼氢化钠、羟胺、TCEP,尤其是1-200mM的浓度,更优选是50-200mM的浓度;
-通过例如增加pH去除所述稳定硫醇的条件或试剂;
-酶,尤其是硫酯酶、谷氧还蛋白、硫氧还蛋白,尤其是0.01-5μM的浓度,甚至更优选0.1-5μM的浓度范围;
-上述化学条件和/或酶促条件的组合。
可以在体外或体内,例如在细胞中或个体中去除所述半胱氨酸残基的可逆保护状态。
可以理解,在所述纯化程序中,所述半胱氨酸残基可以被或者不被可逆封闭,或者可以被或者不被上文列出的任何可逆修饰剂取代。
依照本发明的还原剂是还原半胱氨酸残基中的硫(如“S-S”二硫键)以及使所述半胱氨酸残基脱硫酰基(RS-SO3 -→RSH)的任何试剂。还原剂是保持所述硫醇状态或最小化“S-S”形成和/或交换的任何试剂。“S-S”二硫键的还原是其中将所述二硫键还原为硫醇(-SH)的化学反应。由Maertens等在WO 96/04385中公开的二硫键断裂剂和方法特此通过引用结合到本说明书中。可以通过(1)酶促级联途径或通过(2)还原化合物获得“S-S”还原。已知酶如硫氧还蛋白、谷氧还蛋白涉及二硫化物的体内还原,并且已经显示在体外有效还原“S-S”键。二硫键在pH7.0被还原的硫氧还蛋白快速切割,其表观二级反应速率是用DTT进行的反应的对应速率常数的约104倍。通过将蛋白溶液与1mM DTT或二氢硫辛酰胺预温育,可以显著加快还原动力学(Holmgren,A.1979)。能够还原蛋白二硫键的硫醇化合物有,例如,二硫苏糖醇(DTT)、二硫赤藓糖醇(DTE)、β-巯基乙醇、硫代氨基甲酸酯、二(2-巯基乙基)砜和N,N’-二(巯基乙酰基)肼和连二硫酸钠。也可使用没有硫醇基团的还原剂如抗坏血酸或氯化亚锡(SnCl2)还原HCV蛋白,已经证明所述没有硫醇基团的还原剂在还原单克隆抗体的二硫键时非常有用(Thakur,M.L.等1991),此外,pH值的变化也可能影响HCV蛋白的氧化还原状态。已经显示硼氢化钠处理有效还原肽中的二硫键(Gailit,J.1993)。三(2-羧乙基)膦(TCEP)能够在低pH还原二硫化物(Burns,J.等1991)。当使用DTT或硼氢化钠作为还原剂时,硒醇催化二硫化物还原为硫醇。使用一种可以购买到的联硒化物即硒代半胱胺作为催化剂的前体(Singh,R.和Kats,L.1995)。
术语“免疫原性”蛋白或物质产生免疫反应的能力。所述免疫反应是机体对引入抗原的总反应,包括抗体形成、细胞免疫、过敏性或免疫耐受性。细胞免疫指T辅助细胞反应和/或CTL反应。
术语“抗原性(的)”指蛋白或物质引起抗体形成或引发细胞反应的能力。
依照本发明的表述“刺激T细胞的表位”指能够分别刺激T细胞或CTL细胞的表位。可以如下选出刺激T辅助细胞的表位:监测对在它们的氨基酸序列中包含(推定的)刺激T细胞的表位的多肽的淋巴增殖反应。可以如下测量所述淋巴增殖反应:进行T辅助细胞测定,其中包括用不同浓度需要测试其刺激T细胞的活性的肽体外刺激来自患者血清的外周血单核细胞(PMBC),然后计数放射标记的胸苷摄入量。可以通过细胞毒性T细胞(CTL)测定选出刺激CTL的表位,所述所述细胞毒性T细胞测定使用51Cr释放测量细胞毒性细胞的裂解活性。当刺激指数(受到抗原刺激的培养物的平均cpm/对照培养物的平均cpm)大于1时,优选大于2时,最优选大于3时,认为增殖是阳性的。
本发明的另一方面涉及包含依照本发明的分离的HCV包膜蛋白或其片段的组合物。所述组合物还可以包含药学上可接受的载体,并且可以是药物或疫苗。
本发明的再一方面包括包含依照本发明的HCV包膜蛋白或其部分的药物或疫苗。
本发明的又一方面包括用于在哺乳动物体内诱导HCV特异性免疫反应的药用组合物,所述组合物包含有效量的依照本发明的HCV包膜蛋白或其部分,以及可选地包含在药学上可接受的佐剂。所述包含有效量依照本发明的HCV蛋白或其部分的药用组合物也能够在哺乳动物体内诱导HCV特异性抗体,或者能够在哺乳动物体内诱导T细胞功能。所述包含有效量依照本发明的HCV蛋白或其部分的药用组合物可以是预防组合物或治疗组合物。在特定实施方案中,所述哺乳动物是人。
“哺乳动物”应当被理解为是高等脊椎动物哺乳纲的任何成员,包括人;其特征在于婴儿安全出生、体毛和在雌性体内有分泌用于哺育幼子的奶的乳腺。因此,哺乳动物也包括非人类的灵长类动物和三跗节类小鼠(Zauberman等1999)。
“疫苗”或“药物”是能够引发抵抗疾病的保护的组合物,不论所述保护是部分的或完全的,不论是对抗急性或慢性疾病;在这种情况下所述疫苗或药物是预防型疫苗或药物。疫苗或药物也可以用于治疗已经生病的个体,在这种情况下称其为治疗性疫苗或药物。同样的,可以将药用组合物用于预防目的和/或治疗目的,在这两种情况下所述药用组合物分别是预防型组合物和/或治疗型组合物。
本发明的HCV包膜蛋白因此可以以生物素化形式使用(如WO93/18054中解释)和/或与Neutralite Avidin(Molecular Probes Inc.,Eugene,OR,USA)、抗生物素蛋白或链霉抗生物素形成复合物。应当注意到,“疫苗”或“药物”除活性物质外,可以包括“药学上可接受的载体”或“药学上可接受的佐剂”,它们可以是合适的赋形剂、稀释剂、载体和/或佐剂,它们本身不引起对接受所述组合物的个体有害的抗体产生,它们也不引发保护。合适的载体通常是大的代谢缓慢的大分子,例如蛋白、多糖、多聚乳酸、多聚乙醇酸、多聚氨基酸、氨基酸共聚物和无活性的病毒颗粒。所述载体对于本领域内技术人员是众所周知的。用于增强所述组合物的有效性的优选佐剂包括但不限于:氢氧化铝、如WO 93/19780中所述的铝与3-O-脱酰基单磷脂A组合应用、如WO 93/24148中所述的磷酸铝、如美国专利第4,606,918号中所述的N-乙酰-胞壁酰-L-苏氨酰-D-异谷氨酰胺、N-乙酰降胞壁酰-L-丙氨酰-D-异谷氨酰胺、N-乙酰胞壁酰-L-丙氨酰-D-异谷氨酰基-L-丙氨酸2-(1′2′二棕榈酰基-sn-甘油基-3-羟基磷酰氧基)乙胺、在2%角鲨烯/Tween 80乳剂中含单磷脂A、去毒的内毒素、海藻糖-6,6-二霉菌酸酯以及细胞壁骨架(MPL+TDM+CWS)的RIBI(ImmunoChem Research Inc.,Hamilton,MT,USA)。所述三种成分MPL、TDM或CWS中的任一种可以单独使用或两两组合使用。MPL也可以用其称为RC-529的合成类似物取代。此外,可以使用佐剂例如Stimulon(Cambridge Bioscience,Worcester,MA USA)、SAF-1(Syntex)或基于细菌DNA的佐剂例如ISS(Dynavax)或CpG(Coley Pharmaceuticals),以及佐剂例如QS21与3-脱氧乙酰化单磷脂A的组合(WO94/00153)、或MF-59(Chiron)、或基于聚[二(carboxylatophenoxy)磷腈]的佐剂(Virus Research Institute)、或基于阻断共聚物的佐剂例如Optivax(Vaxcel,Cythx)或基于旋复花粉的佐剂例如Algammulin和GammaInulin(Anutech)、不完全弗氏佐剂(IFA)或Gerbu制剂(Gerbu Biotechnik)。应当理解,也可以将完全弗氏佐剂(CFA)用于非人类应用和研究目的。“疫苗组合物”还可以包含在本质上无毒和无治疗性的赋形剂和稀释剂,例如水、盐水、甘油、乙醇、润湿剂或乳化剂、pH缓冲物质、防腐剂等等。通常将疫苗组合物制备成为可注射的形式,或者是液体溶液,或者是悬浮液。注射可以在皮下、肌内、静脉内、腹膜内、鞘内、真皮内进行。其它给药类型包括植入、栓剂、口服法、肠用、吸入、气溶胶化或鼻腔喷雾剂或滴剂。也可以制备适于在注射前溶于液体载体或悬浮于液体载体的固体形式。也可以在脂质体中乳化或胶囊化所述制剂,以增强佐剂效果。也可以将所述多肽与皂草苷掺入免疫刺激复合物中,例如Quil A(ISCOMS)。疫苗组合物包含有效量的活性物质以及任何其它上述提到的成分。活性物质的“有效量”指以单剂或作为一系列的部分将该量给予个体有效预防或治疗疾病或诱导所需的效应。该量将根据下面因素而变化:需要治疗的个体的健康和身体状况、需要治疗的个体的分类群(如人、非人类灵长类动物、灵长类动物等)、所述个体的免疫系统发动有效免疫反应的能力、所需保护的程度、疫苗配制方法、治疗医生的评估、感染病原体菌株以及其它相关因素。预期该量将在相当广的范围内,可以通过常规试验确定。通常该量将从0.01到1000μg/剂,更优选从0.1到100μg/剂。治疗可以是单剂治疗方案或多剂治疗方案。所述疫苗可以与其它免疫调节剂一起给予。
本发明的另一方面涉及生产依照本发明的分离的HCV包膜蛋白或其片段的方法。
所述生产HCV包膜蛋白或其部分的方法是,例如,包括用包含编码所述HCV包膜蛋白或其部分的读框的重组核酸或载体转化宿主细胞,其中所述宿主细胞能够表达所述HCV包膜蛋白或其部分。所述方法还可以包括在适于获得所述蛋白表达的培养基中培养所述宿主细胞、从所述宿主细胞的培养液或从所述细胞分离所表达的蛋白。所述分离可以包括以下一个或多个步骤:(i)在离液剂存在下裂解所述细胞,(ii)化学修饰所述分离的蛋白中的半胱氨酸硫醇基团,其中所述化学修饰可以是可逆或不可逆的,以及(iii)肝素亲和层析。
“离液剂”的例子有氯化胍和尿素。一般地说,离液剂是破坏水的氢键结构的化合物。在浓缩溶液中,它们能够变性蛋白,因为它们降低疏水效应。
“重组核酸”指已经受到至少一种重组DNA技术操作的天然或合成来源的核酸,所述重组DNA技术操作例如限制酶消化、PCR、连接、脱磷酸化、磷酸化、诱变、改变密码子以在异源细胞中表达等等。一般地说,重组核酸是天然核酸的片段,或者包含至少两个非天然连接的核酸片段,或者是完全合成的核酸。
术语“多核苷酸”、“多核酸”、“核酸序列”、“核苷酸序列”、“核酸分子”、“寡核苷酸”、“探针”或“引物”在本文中指核苷酸,即聚合物形式的任何长度或任何形状(如分支DNA)的核糖核苷酸、脱氧核糖核苷酸、肽核苷酸或闭锁的核苷酸或它们的组合物。所述术语还包括双链(ds)和单链(ss)多核苷酸以及三链多核苷酸。所述术语还包括已知的核苷酸修饰如甲基化、环化和“加帽”以及用类似物如肌苷或用不可扩增的单体如HEG(六乙二醇)取代一个或多个天然核苷酸。
核糖核苷酸表示为NTP,脱氧核糖核苷酸表示为dNTP,二脱氧核糖核苷酸表示为ddNTP。
通常核苷酸可以接受放射标记、化学发光标记、荧光标记、磷光标记或用红外染料标记或用表面增强的Raman标记物标记或用胞质基因组共振颗粒(PRP)标记。
所述术语“多核苷酸”、“多核酸”、“核酸序列”、“核苷酸序列”、“核酸分子”、“寡核苷酸”、“探针”或“引物”也包括肽核酸(PNA),即一种DNA类似物,其骨架是由N-(2-氨乙基)-甘氨酸单位而不是糖组成的假肽。PNA模拟DNA的行为并结合互补核酸链。PNA的中性骨架比一般骨架获得更强的结合和更大的特异性。此外,已经研究PNA的独特化学、物理和生物学性质,以生产强有力的生物分子工具、反义和反基因试剂、分子探针和生物传感器。PNA探针一般比DNA探针短,通常长度为6-20个碱基,更优选长度为12-18个碱基(Nielsen,P.E.2001)。所述术语还包括闭锁的核酸(LNA),闭锁的核酸是RNA衍生物,其中核糖环受到2’-氧和4’-碳之间的亚甲基键的束缚。LNA表现对DNA或RNA靶序列前所未有的结合亲和力。LNA核苷酸可以寡聚化,并且可以掺入嵌合或混合聚合的LNA/DNA或LNA/RNA分子。LNA看起来对培养细胞是无毒的(Orum,H.和Wengel,J.2001,Wahlestedt,C.等2000)。一般地说,考虑DNA、RNA、PNA和LNA的任何一种嵌合体或混合体,以及其中胸腺嘧啶受到尿嘧啶取代的DNA、RNA、PNA和LNA的任何一种嵌合体或混合体。
根据上文,清楚的是本发明还涉及应用依照本发明的核心糖基化HCV包膜蛋白或依照本发明的组合物生产HCV疫苗组合物。具体地说,本发明涉及应用依照本发明的核心糖基化HCV包膜蛋白在慢性HCV携带者体内诱导抗HCV免疫。更具体地说,本发明涉及应用如本文所述的核心糖基化HCV包膜蛋白在任何其它疗法之前、同时或之后在慢性HCV携带者体内诱导抗HCV免疫,所述疗法例如众所周知的干扰素疗法,所述干扰素疗法与或者不与给予治疗HCV的小分子药物如利巴韦林联合应用。所述组合物还可以在肝移植之前或之后、或在推定感染(例如针刺创伤)之后使用。
本发明的再一方面涉及怀疑包含抗HCV抗体的样品中抗HCV抗体存在的方法,所述方法包括:
(i)使依照本发明的HCV包膜蛋白或其部分与所述样品在允许所述HCV包膜蛋白或其部分与所述抗HCV抗体形成复合物的条件下接触,
(ii)检测(i)中形成的所述复合物,然后
(iii)根据(ii)推断所述样品中所述抗HCV抗体的存在。
在特定实施方案中,所述方法步骤(i)中的接触在竞争条件下发生。在所述方法的另一特定实施方案中,所述HCV包膜蛋白或其部分附着到固体支持物上。在另一实施方案中,所述怀疑包含抗HCV抗体的样品是生物学样品。
本发明的又一方面涉及用于检测怀疑包含抗HCV抗体的样品中抗HCV抗体存在的诊断试剂盒,所述试剂盒包含依照本发明的HCV包膜蛋白或其部分。在其特定实施方案中,所述HCV包膜蛋白或其部分附着到固体支持物上。在另一实施方案中,所述怀疑包含抗HCV抗体的样品是生物学样品。
本文所用术语“生物学样品”指分离自个体的组织或体液样品,包括但不限于例如血清、血浆、淋巴液、皮肤外部、呼吸道、肠道或生殖泌尿道、卵母细胞、眼泪、唾液、奶、血细胞、肿瘤、器官、胃分泌物、粘液、脊髓液、外分泌物如粪便、尿、精子等等。
本发明的HCV包膜蛋白或其部分尤其适于加入方法,例如用于检测HCV和/或确定HCV基因型、用于预测/监测HCV疾病的免疫测定方法,或者用作治疗剂。
依照本发明的方法例如免疫测定方法利用保持线性(在肽的情况下)和构象表位的本发明HCV包膜蛋白,所述线性和构象表位受到感染HCV的个体的血清中抗体的识别。在使用已知抗原检测抗体的任何测定形式中,可以使用本发明的HCV E1和E2抗原。当然,应当避免或改进应用失活所述HCV构象表位的形式。所有这些测定的共同特点是所述抗原与怀疑含有HCV抗体的机体成分在允许所述抗原结合在所述成分中存在的任何所述抗体的条件下接触。所述条件一般是生理温度、pH和使用过量抗原的离子强度。使所述抗原与所述标本温育,然后检测包含所述抗原的免疫复合物。
免疫测定的设计可以有许多变化,并且许多形式是本领域内已知的。例如,方法可以使用固体支持物或免疫沉淀。大多数测定涉及应用标记抗体或多肽;所述标记可以是例如酶分子、荧光分子、化学发光分子、放射性分子或染料分子。从所述免疫复合物扩增信号的测定也是已知的;例子有利用生物素和抗生物素蛋白或链霉抗生物素蛋白的测定、以及酶标记及介导的免疫测定,例如ELISA和RIA测定。
免疫测定可以但不限于采取异源或同源形式,以及标准或竞争性类型。在异源形式中,所述多肽一般结合于固体基质或支持物,以便利于在温育后将样品与多肽分离开来。可以使用的固体支持物的例子有硝酸纤维素(如采用膜的形式或微量滴定孔形式)、聚氯乙烯(如采用薄片或微量滴定板的形式)、聚苯乙烯乳胶(在珠上或微量滴定板中)、聚偏氟乙烯(为ImmunolonTM)、重氮化纸、尼龙膜、活化珠和A蛋白珠。例如,在异源形式中可以使用Dynatech ImmunolonTM 1或ImmunlonTM 2微量滴定板。通常在将包含所述抗原性多肽的固体支持物与所述测试样品分离之后、检测结合的抗体之前洗涤所述固体支持物。标准形式和竞争性形式都是本领域内已知的。
在同源形式中,所述测试样品与抗原组合物溶液温育。例如,可以在沉淀形成的任何抗原-抗体复合物的条件下进行温育。用于这些测定的标准形式和竞争性形式都是本领域内已知的。
在标准形式中,直接监测所述抗体-抗原复合物中抗体如抗HCV抗体的量。这可以如下完成:测定受到标记的识别所述抗体(例如所述抗HCV抗体)上表位的抗异源(如抗人)抗体是否会由于形成复合物而结合。在竞争性形式中,如下推导样品中所述抗体如所述抗HCV抗体的量:监测对于所述复合物中已知量(受标记的)抗体(或其它竞争配体)或抗原结合的竞争性效应。
根据形式,可以通过多种已知技术中的任何一种检测抗原-抗体复合物。例如,可以使用与标记(如酶标记)复合的抗异源Ig的缀合物检测所述复合物中的未标记抗体如抗HCV抗体。
在免疫沉淀或凝集测定形式中,抗原和抗体之间的反应形成从所述溶液或悬浮液沉淀的蛋白簇,并形成可见的沉淀层或膜。假如所述测试标本或样品中没有抗体存在,那么不形成所述沉淀。
包含构象表位的本发明的HCV包膜蛋白或其特定部分通常包装成试剂盒的形式用于这些免疫测定中。所述试剂盒一般在不同容器中装有天然HCV抗原、对照抗体制剂(阳性和/或阴性)、标记抗体(如果测定形式要求如此),如果所述标记并不直接产生信号,则还有产生信号的试剂(如酶底物)。所述天然HCV抗原可以是已经结合到固体基质上或者与将其结合到所述基质上的试剂分开。所述试剂盒中通常包括执行所述测定的说明书(如书面物质、磁带、CD-ROM等)。
选定的固相可以包括聚合物珠或玻璃珠、硝酸纤维素、微粒、反应盘微孔、试管和磁珠。所述产生信号的化合物可以包括酶、发光化合物、色素原、放射性元素和化学发光化合物。酶的例子包括碱性磷酸酶、辣根过氧化物酶和β-半乳糖苷酶。增强剂化合物的例子包括生物素、抗生物素和抗生物素蛋白。结合增强剂的成员例子包括生物素、抗生物素和抗生物素蛋白。为阻断类风湿因子样物质的效应,所述测试样品置于足以阻断类风湿因子样物质的效应的条件下。这些条件包括使所述测试样品与一定量抗人IgG接触形成混合物,然后在一定时间和足以形成基本不含类风湿因子样物质的反应混合物产物的条件下温育所述混合物。
特别地,本发明涉及应用依照本发明的HCV包膜蛋白或其部分来制备诊断试剂盒。
由于依照本发明的核心糖基化HCV包膜蛋白有高度的免疫原性,并且刺激体液免疫反应和细胞免疫反应,因此本发明还涉及检测HCV相关T细胞反应的试剂盒,所述试剂盒包括本发明的寡聚物颗粒或纯化的单一HCV包膜蛋白。可以例如根据Leroux-Roels等在WO95/12677中所述测量HCV T细胞反应。
本发明的又一方面涉及在哺乳动物体内诱导HCV特异性免疫反应的方法,所述方法包括给予所述哺乳动物有效量依照本发明的HCV包膜蛋白或其部分,可选地还包括药学上可接受的佐剂。所述包括给予所述哺乳动物有效量依照本发明的HCV包膜蛋白或其部分的方法也可以用于在哺乳动物体内诱导HCV特异性抗体或在哺乳动物体内诱导特异性T细胞功能。在所述方法中,所述给药可以是用于预防目的,即预防给药,或者用于治疗目的,即治疗给药。
本发明的再一方面涉及免疫哺乳动物的方法,所述方法包括给予所述哺乳动物有效量依照本发明的HCV包膜蛋白或其部分,可选地包括给予药学上可接受的佐剂。
本发明还涉及治疗感染HCV的哺乳动物的方法,所述方法包括给予所述哺乳动物有效量依照本发明的HCV包膜蛋白或其部分,可选地包括给予药学上可接受的佐剂。
上文所述的本发明任一方面或特异性用于所述方面的实施方案也可一般性应用于目的蛋白,所述目的蛋白是在真核细胞中表达的产物,其特征还在于如上文针对两种不同HCV包膜蛋白所述的同样糖基化性质。
更具体地说,本发明由此涉及包含至少一个N-糖基化位点的分离的目的蛋白或其片段,所述目的蛋白或其片段的特征在于它是在真核细胞中表达的产物,并且平均高达50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%或80%的N-糖基化位点受到核心糖基化。更具体地说其中超过60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%或95%的所述N-糖基化位点受到结构为Man(8-10)-GlcNAc(2)的寡甘露糖的糖基化。更具体地定义上面任一N-糖基化特征,受到结构为Man(7)-GlcNAc(2)的寡甘露糖核心糖基化的位点与受到结构为Man(8)-GlcNAc(2)的寡甘露糖核心糖基化的位点的比例小于或等于0.15、0.2、0.25、0.30、0.35、0.40、0.45或0.50。另外更具体地定义上面任一N-糖基化特征,所述寡甘露糖含少于20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%或5%的末端α1,3甘露糖。
本发明另一替代的方面涉及包含至少一个N-糖基化位点的分离的目的蛋白或其片段,所述蛋白或其片段的特征在于它是真核细胞中表达的产生,并且N-糖基化位点被寡甘露糖占据,其中结构为Man(7)-GlcNAc(2)的寡甘露糖与结构为Man(8)-GlcNAc(2)的寡甘露糖的比例小于或等于0.15、0.2、0.25、0.30、0.35、0.40、0.44、0.45或0.50。另外更具体地定义上面任一N-糖基化特征,所述寡甘露糖含少于20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%或5%的末端α1,3甘露糖。
特别的,所述分离的目的蛋白或其片段是在酵母细胞如汉逊酵母属细胞中表达的产物。所述分离的目的蛋白或其片段可以是,例如,病毒包膜蛋白或其片段,如HCV包膜蛋白或HBV(乙型肝炎)包膜蛋白或它们的片段。其它病毒包膜蛋白的例子包括HIV(人类免疫缺陷病毒)包膜蛋白gp120和属于黄病毒科(Flavirideae)的病毒的病毒包膜蛋白。一般地说,所述分离的目的蛋白或其片段可以是需要本发明的N-糖基化特征的任何蛋白。
“HCV重组痘苗病毒”指包含编码HCV蛋白或其片段的核酸序列的痘苗病毒。
术语“HCV包膜蛋白形成的HCV病毒样颗粒”“HCV包膜蛋白形成的寡聚物颗粒”在本文中定义为包含HCV E1和/或E2包膜蛋白的若干基本单位的有特定性质和形状的结构,所述包膜蛋白本身被认为分别包含一个或两个E1和/或E2单体。清楚的是,本发明的所述颗粒限定为不含传染性HCV RNA基因组。本发明的所述颗粒可以是球形性质的更高等级的颗粒,所述颗粒可以是空的,由包膜蛋白组成外壳,其中掺入脂类、去污剂、所述HCV核心蛋白或佐剂分子。后一种颗粒也可以用脂质体或载脂蛋白例如载脂蛋白B或低密度脂蛋白包囊化,或者通过使所述颗粒靶向特定器官或组织的任何其它方法包囊化。在这种情况下,所述空的球形颗粒常常被称为“病毒样颗粒”或VLP。或者,所述更高级别的颗粒可以是固体球形结构,其中完整的球由HCV E1或E2包膜蛋白寡聚物组成,其中掺入脂质、去污剂、HCV核心蛋白或佐剂分子,或者它们本身又可以被脂质体或载脂蛋白如载脂蛋白B、低密度脂蛋白包囊化,或者用任何使所述颗粒靶向特定器官或组织的其它方法如脱唾液酸糖蛋白包囊化。所述颗粒用可以由更小的结构组成(与上文所述空的或固体球形结构相比),所述更小的结构常常是圆(见下文)形的,并且通常不包含超过一层HCV包膜蛋白。所述更小颗粒的典型例子有玫瑰花结样结构,所述结构由更少数量的HCV包膜蛋白组成,通常是4到16个HCV包膜蛋白。后者的一个特定例子是用如本文举例说明的用E1在0.2%CHAPS中形成的更小颗粒,所述颗粒在表观上包含8-10个E1单体。所述玫瑰花结样结构通常在平面内组织成圆形,即轮形。此外可以另外掺入脂质、去污剂、HCV核心蛋白或佐剂分子,或者所述更小的颗粒可以被脂质体或载脂蛋白如载脂蛋白B或低密度脂蛋白包囊化,或者用任何使所述颗粒靶向特定器官或组织的其它方法包囊化。更小的颗粒也可以形成小的球形或球状结构,所述球形或球状结构由相似的更少数量的HCV E1或E2包膜蛋白组成,其中可以另外掺入脂质、去污剂、HCV核心蛋白或佐剂分子,或者可以被脂质体或载脂蛋白如载脂蛋白B或低密度脂蛋白包囊化,或者用任何使所述颗粒靶向特定器官或组织的其它方法包囊化。根据本领域内众所周知的动态光散射技术(见实施例部分)测量,上面定义的颗粒的大小(即直径)通常在1-100nm,更优选在2-70nm,甚至更优选在2-40nm、3-20nm、5-16nm、7-14nm或8-12nm。
特别的,本发明涉及纯化适用于免疫测定或疫苗的核心糖基化丙型肝炎病毒(HCV)包膜蛋白或其任何部分的方法,所述方法包括:
(i)在合适培养基中培养用编码HCV E1和/或HCV E2蛋白的包膜基因或其任何部分转化的汉逊酵母属或酵母属糖基化负型株;
(ii)引起所述HCV E1和/或HCV E2基因或其任何部分的表达;然后
(iii)从所述细胞培养物纯化所述核心糖基化HCV E1和/或HCVE2蛋白或其任何部分。
本发明还涉及纯化适用于免疫测定或疫苗的核心糖基化丙型肝炎病毒(HCV)包膜蛋白或其任何部分的方法,所述方法包括:
(i)在合适培养基中培养用编码HCV E1和/或HCV E2蛋白的包膜基因或其任何部分转化的汉逊酵母属或酵母属糖基化负型株;
(ii)引起所述HCV E1和/或HCV E2基因或其任何部分的表达;然后
(iii)在裂解所述转化宿主细胞时,纯化所述细胞内表达的核心糖基化HCV E1和/或HCV E2蛋白或其任何部分。
本发明还涉及纯化适用于免疫测定或疫苗的核心糖基化丙型肝炎病毒(HCV)包膜蛋白或其任何部分的方法,所述方法包括:
(i)在合适培养基中培养用编码HCV E1和/或HCV E2蛋白的包膜基因或其任何部分转化的汉逊酵母属或酵母属糖基化负型株,其中所述HCV E1和/或HCV E2蛋白或其任何部分包含至少两个Cys氨基酸;
(ii)引起所述HCV E1和/或HCV E2基因或其任何部分的表达;然后
(iii)从所述培养物纯化所述核心糖基化HCV E1和/或HCV E2蛋白或其任何部分,其中通过化学方法和/或酶促方法可逆保护所述Cys氨基酸。
本发明还涉及纯化适用于免疫测定或疫苗的核心糖基化丙型肝炎病毒(HCV)包膜蛋白或其任何部分的方法,所述方法包括:
(i)在合适培养基中培养用编码HCV E1和/或HCV E2蛋白的包膜基因或其任何部分转化的汉逊酵母属或酵母属糖基化负型株,其中所述HCV E1和/或HCV E2蛋白或其任何部分包含至少两个Cys氨基酸;
(ii)引起所述HCV E1和/或HCV E2基因或其任何部分的表达;然后
(iii)在裂解所述转化宿主细胞后纯化所述细胞内表达的核心糖基化HCV E1和/或HCV E2蛋白或其任何部分,其中通过化学方法和/或酶促方法可逆保护所述Cys氨基酸。
本发明专门涉及纯化如本文所述的重组的核心糖基化HCV酵母蛋白或其任何部分的方法,其中所述纯化包括肝素亲和层析。
因此,本发明还涉及纯化如上所述的重组的核心糖基化HCV酵母蛋白或其任何部分的方法,其中所述化学方法是磺化。
因此,本发明还涉及纯化如上所述的重组的核心糖基化HCV酵母蛋白或其部分的方法,其中所述对Cys氨基酸的可逆保护改变为通过化学方法和/或酶促方法的不可逆保护。
因此,本发明还涉及纯化如上所述的重组的核心糖基化HCV酵母蛋白或其部分的方法,其中所述通过化学方法进行的不可逆保护是碘乙酰胺。
因此,本发明还涉及纯化如上所述的重组的核心糖基化HCV酵母蛋白或其部分的方法,其中所述通过化学方法进行的不可逆保护是NEM或生物素-NEM或它们的混合物。
本发明还涉及如上文定义的组合物,所述组合物还包含HCV核心蛋白、E1、E2、P7、NS2、NS3、NS4A、NS4B、NS5A和/或NS5B蛋白或其部分。本发明核心糖基化蛋白E1、E2和/或E1/E2可以例如与其它HCV抗原组合应用,所述其它HCV抗原例如核心蛋白、P7、NS3、NS4A、NS4B、NS5A和/或NS5B。对这些NS3蛋白的纯化优选包括对半胱氨酸残基的可逆修饰,甚至更优选磺化半胱氨酸。在Maertens等(PCT/EP99/02547)中已经针对NS3蛋白描述获得所述可逆修饰包括磺化的方法。应当强调,上述文件的全文,包括所有定义,都通过引用结合到本申请中。
此外,本发明涉及应用如本文所述的核心糖基化包膜蛋白诱导针对HCV的免疫,其特征在于所述核心糖基化包膜蛋白作为一系列时间和化合物的部分使用。在这一方面,应当理解,术语“一系列时间和化合物”指间隔一定时间给予个体用于引发免疫反应的所述化合物。所述化合物可以包含下面成分中的任何一种:核心糖基化包膜蛋白、HCV DNA疫苗组合物、HCV多肽。在这一方面,一系列包括给予下面选出的一种:
(i)间隔一定时间给予HCV抗原,例如核心糖基化抗原,或
(ii)HCV抗原以及HCV DNA疫苗组合物,所述HCV抗原例如核心糖基化包膜蛋白,其中所述核心糖基化包膜蛋白寡聚物颗粒和所述HCV DNA疫苗组合物可以同时给予,或者按不同时间间隔给予,包括按交替时间间隔给予,或者
(iii)间隔一定时间应用(i)或(ii),可以的话还可联合应用其它HCV肽。
在这一方面,应当清楚,HCV DNA疫苗组合物包含编码HCV包膜肽的核酸,所述HCV包膜肽包括E1-肽、E2-肽、E1/E2-肽、NS3肽、其它HCV肽或部分所述肽。此外,应当理解,所述HCV肽包括HCV包膜肽,其中包括E1-肽、E2-肽、E1/E2-肽、其它HCV肽或部分所述肽。术语“其它HCV肽”指任何HCV肽或其片段。在上述计划的项(ii)中,所述HCV DNA疫苗组合物优选包含编码HCV包膜肽的核酸。在上述计划的项(ii)中,所述HCV DNA疫苗组合物甚至更优选包含编码HCV包膜肽的核酸,可能的话还包含HCV-NS3DNA疫苗组合物。在这一方面,应当清楚,HCV DNA疫苗组合物包含质粒载体,所述质粒载体包含操作性连接转录调节元件的编码如上所述HCV肽的多核苷酸序列。本文所用的“质粒载体”指能够转运其所连接的另一核酸的核酸分子。优选载体是那些能够自主复制和/或表达它们连接的核酸的载体。一般地说,质粒载体包括但不限于环状双链DNA环,所述环状双链DNA环载体形式不结合染色体。本文所用“多核苷酸序列”指多核苷酸如脱氧核糖核酸(DNA),以及在合适情况下指核糖核酸(RNA)。应当理解,该术语还包括作为等价物的用核苷酸类似物制造的RNA或DNA的类似物以及单链(有义或反义)和双链多核苷酸。本文所用术语“转录调节元件”指包含基本调节元件的核苷酸序列,以便当该核苷酸序列引入活的脊椎动物细胞时能够指导细胞机制生产由所述多核苷酸编码的翻译产物。术语“操作性连接”指并列,其中组件的排列结构使得可以行使它们的有用功能。因此,操作性连接核苷酸序列的转录调节元件能够实现所述核苷酸序列的表达。
本领域内的技术人员能够理解,可以成功使用不同的转录启动子、终止子、携带载体(carrier vector)或特定基因序列。
或者,可以通过活载体例如腺病毒、金丝雀痘病毒、MVA等传递所述DNA疫苗。
将通过下面的实施例举例说明本发明。这些实施例仅是示例性的,不应当认为它们以任何方式约束或限制本发明。
实施例
                      实施例1
           构建pFPMT-MFα-E1-H6穿梭载体
如下构建用于转化多形汉逊酵母的质粒。已经在多步骤程序中构建所述pFPMT-MFα-E1-H6穿梭载体。起初将编码HCV E1s蛋白的核酸序列(SEQ ID NO:2)克隆在CHH前导序列(CHH=Carcinusmaenas高血糖激素)之后,而随后用MFα前导序列(MFα=酿酒酵母α-交配因子)取代所述CHH前导序列。
首先用无缝克隆方法构建pUC18衍生物,所述pUC18衍生物携带作为EcoRI/BamHI片段的CHH-E1-H6单位(Padgett,K.A.和Sorge,J.A.1996)。因此,通过如下文所述的PCR产生编码E1s-H6的DNA片段以及pCHH-Hir衍生的受体质粒。
产生编码E1s-H6的DNA片段
通过PCR从质粒pGEMTE1sH6(SEQ ID NO:6;图1)分离所E1-H6 DNA片段(编码HCV 1b型E1s蛋白,该蛋白包括用6His残基延长的E1s的氨基酸192-326;SEQ ID NO:5)。其中使用下面引物:
CHHE1-F:5′-agtta ctcttca.aggtatgaggtgcgcaacgtgtccg-3′
(SEQ ID NO:7);
下划线Eam1104I位点,点指示切割位点。粗体打印的碱基与引物CHH连接的碱基互补。未标记的碱基在E1起始区(192-326)的有义方向退火;和
-CHHE1-R:
5′-agtta ctcttca.cagggatcctccttaatggtgatggtggtggtgcc-3′
(SEQ ID NO:8);
下划线Eam1104I位点,点指示切割位点。粗体打印的碱基与引物MF30-rechts的碱基互补。形成用于后面克隆程序的BamHI位点用斜体打印。未标记的碱基在所述E1-H6单位内以反义方向退火,其中包括终止密码子以及在终止密码子和BamHI之间的另外三个碱基。
反应混合物组成如下:总体积50μL,其中含20ng Eco311线性化的pGEMTE1sH6、引物CHHE1-F和CHHE1-R各0.2μM、dNTP(各0.2μM)、1x缓冲液2(Expand Long Template PCR System;Boehringer;目录号1681 834)、2.5U聚合酶混合物(Expand Long Template PCRSystem;Boehringer;目录号1681 834)。
使用程序1,所述程序由下面步骤组成:
1.变性:95℃5分钟;
2.95℃变性30秒、65℃退火30秒、68℃延伸130秒,总共10个循环
3.在4℃终止。
然后在得自程序1的样品中加入5μL 10x缓冲液2(ExpandLong Template PCR System;Boehringer;目录号1681 834)、40μL H2O和5μL[dATP、dGTP和dTTP(每种2mM);10mM 5-甲基-dCTP],然后使用包括下面步骤的程序2进行进一步扩增:
1.变性:95℃5分钟;
2.95℃变性45秒、65℃退火30秒、68℃延伸130秒,总共5个循环
3.在4℃终止。
产生pCHH-Hir衍生的受体质粒
通过PCR从pCHH-Hir质粒(SEQ ID NO:9;图2)制造受体片段,所述受体片段包括几乎完整的pCHH-Hir质粒,只是在所述PCR产物中不存在Hir编码序列。该PCR使用下面引物:
1.CHH-links:5′-agtta ctcttca.cctcttttccaacgggtgtgtag-3′
(SEQ ID NO:10);
下划线Eam1104I位点,点指示切割位点。粗体打印的碱基与引物CHHE1-F的碱基互补。未标记的碱基在CHH序列末端的反义方向退火;和
2.MF30-rechts:5′-agtca ctcttca.ctgcaggcatgcaagcttggcg-3′
(SEQ ID NO:11);
下划线Eam1104I位点,点指示切割位点。粗体打印的碱基与引物CHHE1-R的碱基互补。未标记的碱基在pUC18序列内在所克隆的pCHH-Hir的CHH-Hirudin HL20之后互补,指向远离所述插入片段的方向。
反应混合物组成如下:总体积50μL,其中含20ng Asp718I线性化的pCHH-Hir、引物CHH-Links和MF30-rechts各0.2μM、dNTP(各0.2μM)、1x缓冲液2(Expand Long Template PCR System;Boehringer;目录号1681 834)、2.5U聚合酶混合物(Expand LongTemplate PCR System;Boehringer;目录号1681 834)。
使用如上文所述的程序1。
然后在得自程序1的样品中加入5μL 10x缓冲液2(ExpandLong Template PCR System;Boehringer;目录号1681 834)、40μL H2O和5μL[dATP、dGTP和dTTP(每种2mM);10mM 5-甲基-dCTP],然后使用上文所述的程序2进行进一步扩增。
产生载体pCHHE1
使用PCR产物纯化试剂盒(Qiagen),根据供应商的说明书,纯化如上文所述通过PCR产生的编码E1s-H6的DNA片段和所述pCHH-Hir衍生的受体质粒。随后单独用Eam1104I消化所述纯化的片段。随后,使用T4连接酶(Boehringer),根据供应商的说明书将所述E1s-H6 DNA片段连接进所述pCHH-Hir衍生的受体质粒。
用所述连接混合物转化大肠杆菌XL-Gold细胞,然后通过用EcoRI和BamHI消化,分析几个氨苄青霉素抗性集落的质粒DNA。选出一个阳性克隆,将其命名为pCHHE1。
产生载体pFPMT-CHH-E1H6
所述pCHHE1的EcoRI/BamHI片段与用EcoRI/BamHI消化的载体pFPMT121(SEQ ID NO:12;图3)连接。依照供应商的说明书使用T4连接酶(Boehringer)。使用所述连接混合物转化大肠杆菌DH5αF’细胞。分析几个转化子的质粒DNA的限制模式,保留一个阳性克隆,将该克隆命名为pFPMT-CHH-E1H6(SEQ ID NO:13;图4)。
产生pFPMT-MFα-E1-H6
最后通过连接三个片段产生穿梭载体pFPMT-MFα-E1-H6,所述片段是:
1. 6.961kb的EcoRI/BamHI消化的pFPMT121(SEQ ID NO:12;图3),
2.pUC18-MFa的0.245 EcoRI/HindHI片段(SEQ ID NO:62;图36),和
3.得自pFPMT-CHH-E1H6的一个0.454kb PCR产物的0.442kbHindIII/BamHI片段。
通过PCR获得产生第三种片段的所述0.454kb PCR产物,其中使用下面引物:
1.引物MFa-E1 f-Hi:
5′-aggggtaagcttggataaaaggtatgaggtgcgcaacgtgtccgggatgt-3′(SEQ IDNO:14);和
2.引物E1 back-Bam:
5′-agttacggatccttaatggtgatggtggtggtgccagttcat-3′(SEQ ID NO:15).
如下组成反应混合物:反应混合物体积50μL,pFPMT-CHH-E1-H6(EcoRI线性化;15ng/μL),0.5μL;引物MFa-E1 f-Hi(50μM),0.25μL;引物E1 back-Bam(50μM),0.25μL;dNTP(都是2mM),5μL;DMSO,5μL;H2O,33.5μL;Expand Long Template PCR System(Boeringer Mannheim;目录号1681 834)缓冲液2(10x浓缩),5μL;Expand Long Template PCR System Polymerase混合物(1U/μL),0.5μL。
使用包括如下步骤的PCR程序:
1.变性:95℃5分钟;
2.95℃变性45秒、55℃退火45秒、68℃延伸40秒,总共29个循环
3.在4℃终止。
根据所使用的引物,所得到的0.454kb PCR产物包含E1的密码子(192-326),在所述E1的密码子之后是六个组氨酸密码子和一个“taa”终止密码子,上游侧翼是MFα前原序列的22 3′-末端碱基对(包括克隆相关HindIII位点加六碱基对突出端),下游侧翼是一个(克隆相关的)BamHI位点和一个六碱基对突出端。
为进行连接反应,已经根据供应商的条件(样品体积20μL)使用T4 DNA连接酶(Boehringer Mannheim)。
用所述连接混合物转化大肠杆菌HB101细胞,在对从几个转化子分离的质粒进行限制分析后,保留阳性集落。选出一个阳性质粒,命名为pFPMT-MFα-E1-H6(SEQ ID NO:16;图5)。
                      实施例2
            构建pFPMT-CL-E1-H6穿梭载体
如下构建用于转化多形汉逊酵母的质粒。从pFPMT-MFα-E1-H6(SEQ ID NO:16,图5)开始,按三个步骤构建所述pFPMT-CL-E1-H6穿梭载体。
在第一个步骤,将pFPMT-MFα-E1-H6的MFα-E1-H6可读框亚克隆进pUC18载体。因此,用T4连接酶(Boehringer),按照供应商的条件,将pFPMT-MFα-E1-H6的1.798kb SalI/BamHI片段(包含FMD启动子加MFα-E1-H6)连接进pUC18的SalI/BamHI载体片段。这产生在图6中描述的质粒(SEQ ID NO:17),将该质粒命名为pMa12-1(pUC18-FMD-MFα-E1-H6)。使用所述连接混合物转化大肠杆菌DH5αF’细胞。捡出几个氨苄青霉素抗性克隆,通过限制酶消化从所述捡出克隆分离的质粒DNA,对所述克隆进行分析。通过测定所述MFα-E1-H6编码序列的DNA序列,进一步对一个阳性克隆进行分析。一个正确的克隆用于PCR定向诱变,用鸟溶菌酶前序列(“CL”;对应于鸟溶菌酶的氨基酸1-18;SEQ ID NO:1)取代所述MFα前原序列。应用性PCR定向诱变方法的原则是基于用位于引物5′末端的所需改变扩增完整质粒。在下游步骤,在自连接之前修饰所述线性化的PCR产物,产生所需的受到改变的质粒。
1.引物CL hin:
5′- tgcttcctaccactagcagcactaggatatgaggtgcgcaacgtgtccggg-3′(SEQ IDNO:18);
2.引物CL her neu:
5′- tagtactagtattagtaggcttcgcatgaattcccgatgaaggcagagagcg-3′(SEQ IDNO:19).
所述引物下划线的5′区包含约一般所述鸟溶菌酶前序列的密码子。引物CL her neu包括一个SpeI限制位点(斜体)。所述引物未下划线的区与编码E1氨基酸残基192-199的密码子(CL hin)退火,或者与EcoRI位点的“atg”起始密码子直到FMD启动子的位置-19(从所述EcoRI位点开始计算)退火。所述引物设计为扩增完整pMa12-1,由此用所述鸟溶菌酶前序列的密码子取代所述MFα前原序列的密码子。
如下组成反应混合物:pUC18-FMD-Mfα-E1-H6(pMa12-1;1.3ng/μL),1μL;引物CL hin(100μM),2μL;引物CL her neu(100μM),2μL;dNTP(都是2.5mM),8μL;H2O,76μL;Expand Long TemplatePCR System(Boeringer;目录号1681 834)缓冲液2(10x浓缩),10μL;Expand Long Template PCR System聚合酶混合物(1U/μL),0.75μL。
应用由下面步骤组成的PCR程序:
1.变性:95℃15分钟;
2.95℃变性30秒、60℃退火1分钟、72℃延伸1分钟,总共35个循环
3.在4℃终止。
通过琼脂糖凝胶电泳检查所得到的PCR产物的正确大小(3.5kb)。然后通过T4聚合酶反应,从所述PCR产物除去3’-A突出端,导致具有3’-和5’-OH基团的平端。因此,用T4聚合酶(Boehringer;1U/μL)处理所述PCR产物:在剩余的95μL PCR反应混合物中,加入1μL T4聚合酶和4μL dNTP(都是2.5mM)。所述样品在37℃温育20分钟。随后,用乙醇沉淀DNA,并在16μL H2O中吸收。
然后,通过激酶反应在所述平端PCR产物中加入5’-磷酸。因此,在所述16μL平端PCR产物中加入1μL T4多核苷酸激酶(Boehringer;1U/μL),2μL 10倍浓缩的T4多核苷酸激酶反应缓冲液(Boehringer)和1μL ATP(10mM)。所述样品在37℃温育30分钟。
随后,将所述DNA加样到1%琼脂糖凝胶上,通过凝胶提取试剂盒(Qiagen),按照供应商的条件分离正确的产物带。然后应用T4连接酶(Boehringer),按照供应商的条件自连接五十(50)ng所述纯化的产物。在16℃温育72h后,用乙醇沉淀所述连接混合物中的DNA,然后溶解于20μL水。
然后用10μL所述连接样品转化大肠杆菌DH5α-F’细胞。通过限制酶消化检查几个氨苄青霉素抗性集落的质粒DNA。保留一个阳性克隆,命名为p27d-3(pUC18-FMD-CL-E1-H6,SEQ ID NO:20,图7)。随后通过DNA测序证实所述CL-E1-H6可读框。
在最后一个步骤,如下构建所述pFPMT-CL-E1-H6穿梭载体。将p27d-3的0.486kb EcoRI/BamHI片段(携带CL-E1(192-326)-H6)与EcoRI/BamHI消化的pFPMT121(SEQ ID NO:12,图3)连接。对于该反应,按照供应商的推荐应用T4连接酶(Boehringer)。用乙醇沉淀所述连接样品中的DNA,然后溶解于10μL H2O。用10μL所述连接样品转化大肠杆菌DH5αF′细胞,然后通过用EcoRI和BaHI消化,分析几个氨苄青霉素抗性集落的质粒DNA。质粒克隆p37-5(pFPMT-CL-E1-H6;SEQ ID NO:21,图8)显示0.486kb和6.961kb的所需片段大小。通过测序证实p37-5的CL-E1-H6的正确序列。
                      实施例3
   构建pFPMT-MFα-E2-H6和pMPT-MFα-E2-H6穿梭载体
如下构建用于转化多形汉逊酵母的质粒。从质粒pSP72E2H6(SEQ ID NO:22,图9)分离作为1.331kb EcoRI/BglII片段的编码MFα-E2s(HCV E2的氨基酸384-673)-VIEGR-His6的DNA片段(SEQ IDNO:5)。使用T4 DNA连接酶(Boehringer Mannheim),按照供应商的推荐将该片段与EcoRI/BglII消化的载体pFPMT121(SEQ ID NO:12,图C+2)或pMPT121(SEQ ID NO:23,图10)连接。转化大肠杆菌并通过限制酶消化检查从不同转化子分离的质粒DNA后,保留阳性克隆,将得到的穿梭质粒分别命名为pFPMT-MFα-E2-H6(SEQ ID NO:22,图11)和pMPT-MFα-E2-H6(SEQ ID NO:23,图12)。
                     实施例4
           构建pFPMT-CL-E2-H6穿梭载体
按照三步骤程序组装穿梭载体pFPMT-CL-E2-H6。制备一个中间构建物,其中将E2编码序列克隆在许旺酵母(Schwanniomycesaccidentalis)α-淀粉酶的信号序列之后。这通过无缝克隆方法进行(Padgett,K.A.和Sorge,J.A.1996)。
产生编码E2s-H6的DNA片段
首先通过PCR从pSP72E2H6质粒(SEQ ID NO:24,图11)扩增编码E2-H6(用连接肽“VIEGR”和6个His残基延伸的HCV E2的氨基酸384-673,SEQ ID NO:5)的DNA片段。所用的引物命名为MF30E2/F和MF30E2/R,具有下面序列:
-引物MF30E2/F:
5′-agtca ctcttca.aggcatacccgcgtgtcaggaggg-3′(SEQ ID NO:26;下划线Eam1104位点,所述点指示酶的切割位点;许旺酵母信号序列的最后一个密码子用粗体打印;未标记的碱基与E2的密码子(HCV E2的氨基酸384-390)退火;
-引物MF30E2/R:
5′-agt cactcttca.cagggatccttagtgatggtggtgatg-3′(SEQ ID NO:27;下划线Eam1104位点,所述点指示酶的切割位点;粗体打印的碱基与引物MF30-Rechts(见下文)的粗体打印碱基互补;引入所述构建物的BamHI位点打印成斜体;未标记的序列与E2(384-673)-VIEGR-H6(SEQ ID NO:5)的终止密码子和六个末端His密码子退火。
如下组成反应混合物:总体积50μL,含20ng pSP72E2H6的1.33kb EcoRI/BglII片段,引物MF30E2/F和MF30E2/R各0.2μM,dNTP(各0.2μM),1x缓冲液2(Expand Long Template PCR System;Boeringer;目录号1681 834),2.5U聚合酶混合物(Expand LongTemplate PCR System;Boeringer;目录号1681 834)。
使用由下面步骤组成的PCR程序3:
1.变性:95℃5分钟;
2.95℃变性30秒、65℃退火30秒、68℃延伸1分钟,总共10个循环
3.在4℃终止。
然后在从PCR程序3获得的样品中加入10μL 10x缓冲液2(Expand Long Template PCR System;Boeringer;目录号1681 834),40μL H2O,和5μL[dATP,dGTP和dTTP(每种2mM);10mM 5-甲基-dCTP],然后使用由下面步骤组成的PCR程序4:
1.变性:95℃5分钟;
2.95℃变性45秒、65℃退火30秒、68℃延伸1分钟,总共5个循环
3.在4℃终止。
产生pMF30衍生的受体质粒
第二个片段源自质粒pMF30(SEQ ID NO:28,图13),该扩增子几乎是完整的pMF30质粒,只是不包含许旺酵母成熟α-淀粉酶的密码子,通过引物设计引入与克隆相关的修饰。使用下面一组引物:
-引物MF30-Links:
5′-agtca ctcttca.cctcttgtcaaaaataatcggttgag-3′(SEQ ID NO:29;下划线Eam1104I位点,所述点指示酶的切割位点;粗体打印的“cct”与引物MF30E2/F(见下文)中粗体打印的“agg”互补;未标记的碱基和粗体打印的碱基与pMF30中许旺酵母α-淀粉酶密码子的26个末端碱基退火);
-引物MF30-Rechts:
5′-agtca ctcttca.ctgcaggcatgcaagcttggcg-3′(SEQ ID NO:11;下划线Eam1104I位点,所述点指示酶的切割位点;粗体打印的“ctg”与引物MF30E2/R(见上文)中粗体打印的“cag”互补;未标记的碱基与pMF30中许旺酵母α-淀粉酶的终止密码子下游的pCU18序列退火)。
如下组成反应混合物:总体积50μL,含20ng BglII线性化的pMF30,引物MF30-Links和MF30-Rechts各0.2μM,dNTP(各0.2μM),1x缓冲液1(Expand Long Template PCR System;Boeringer;目录号1681 834),2.5U聚合酶混合物(Expand Long Template PCRSystem;Boeringer;目录号1681 834)。使用上文所述的同样PCR程序(程序3和4),只是在两个程序中延伸时间从1分钟延长到4分钟。
产生载体pAMY-E2
通过PCR获得的编码E2s-H6的DNA片段和pMF30衍生的受体质粒根据它们各自的大小在1%琼脂糖凝胶上通过凝胶电泳进行比较。用PCR产物纯化试剂盒(Qiagen),按照供应商的指导纯化所述PCR产物。随后用Eam11004I分别消化所述纯化的片段。使用T4连接酶(Boehringer),根据供应商的推荐,将所述E2s-H6片段连接到所述pMF30衍生的受体质粒。使用所述连接混合物转化大肠杆菌DH5αF’细胞,然后通过EcoRI/BamHI消化分析几个集落的质粒DNA。选出一个阳性集落,其质粒命名为pAMY-E2,使用该质粒进行如下文所述的进一步修饰。
产生载体pUC18-CL-E2-H6
对所述pAMY-E2进行PCR定向诱变,以便用鸟溶菌酶前序列的密码子取代α-淀粉酶信号序列的密码子。将其命名为“CL”,它对应于鸟溶菌酶ORF(SEQ ID NO:1)的头18个氨基酸。该诱变使用下面引物:
-引物CL2 hin:
5′- tgcttcctaccactagcagcactaggacatacccgcgtgtcaggaggggcag-3′(SEQID NO:30);和
-引物CL2 her:
5′- tagtactagtattagtaggcttcgcatg
Figure A0281260700701
actggccgtcgtttta-caacgtc-3′(SEQ ID NO:31).
该引物下划线的5′区包含约一半所述鸟溶菌酶前序列的DNA序列。引物CL2 her包括SpeI(斜体)和EcoRI(斜体,双下划线)限制位点。该引物未下划线的区与E2氨基酸残基384-392的密码子(CL2 bin)退火,或者与所述EcoRI位点上“atg”起始密码子直到FMD启动子位置-19(从所述EcoRI位点开始计算)退火。该引物设计为扩增完整的pAMY-E2载体,由此用所述鸟溶菌酶前序列的密码子取代所述α-淀粉酶信号序列的密码子。
根据下面程序进行PCR反应:
1.变性:95℃15分钟;
2.95℃变性30秒、60℃退火1分钟、72℃延伸1分钟,总共35个循环
3.在4℃终止。
使用下面反应混合物:pAMY-E2(1ng/μL),1μL;引物CL2 hin(100μM),2μL;引物CL2 her(100μM),2μL;dNTP(各2.5mM),8μL;H2O,76μL;Expand Long Template PCR System(Boeringer;目录号1681 834)缓冲液2(10x浓缩),10μL;Expand Long Template PCRSystem聚合酶混合物(1U/μL),0.75μL。
在1%琼脂糖凝胶上通过电泳检查得到的PCR产物。在连接前如下修饰所述PCR片段。通过T4聚合酶除去3’-A突出端,导致具有3’-和5’-OH基团的平端。在剩余的95μL PCR反应混合物中,加入1μL T4聚合酶(Boehringer,1U/μL)和4μL dNTP(各2.5mM)。所述样品在37℃温育20分钟。随后,用乙醇沉淀DNA,并溶解于16μL去离子水。然后,通过激酶处理在所述平端PCR产物中加入5’-磷酸。因此,在所述16μL溶解的平端PCR产物中加入1μL T4多核苷酸激酶(Boehringer;1U/μL),2μL 10倍浓缩的T4多核苷酸激酶反应缓冲液(Boehringer)和1μL ATP(10mM)。所述样品在37℃温育30分钟。
随后在1%琼脂糖凝胶上分离所述激酶处理的样品。分离产物带。通过凝胶提取试剂盒(Qiagen),按照供应商的条件从凝胶切片提取DNA。然后应用T4连接酶(Boehringer),按照供应商的条件自连接五十(50)ng所述纯化的产物。在16℃温育16h后,用乙醇沉淀所述连接混合物中的DNA,然后溶解于20μL水(连接样品)。
然后用10μL所述连接样品转化大肠杆菌DH5αF’细胞。通过限制酶消化分离的质粒DNA,表征几个氨苄青霉素抗性克隆。一个阳性克隆被命名为pUC18-CL-E2-H6,用该克隆进行下文所述进一步的修饰。
产生穿梭载体pFPMT-CL-E2-H6
从pUC18-CL-E2-H6(携带CL-E2(384-673)-VIEGR-H6)分离一个0.966kb EcoRI/BamHI片段,连接进EcoRI/BamHI消化的pFPMT121(SEQ ID NO:12,图3)。对于该反应,按照供养商的条件使用T4连接酶(Boehringer)。用乙醇沉淀所述连接样品,然后溶解于10μL水。用其转化大肠杆菌DH5αF’细胞,在限制消化后保留一个阳性集落,将该质粒命名为pFPMT-CL-E2-H6(SEQ ID NO:32,图14)。
                        实施例5
             构建pFPMT-CL-K-H6-E1穿梭载体
所述穿梭载体的构建包括两个步骤。
在第一个步骤,通过定点诱变构建pUC18-FMD-CL-H6-K-E1-H6构建物。使用pUC18-FMD-CL-E1-H6作为模板(SEQ ID NO:20;图7)。使用下面引物:
-引物H6K hin neu:
5′- catcacaaatatgaggtgcgcaacgtgtccgggatgtac-3′(SEQID NO:37).
-引物H6KRK her neu:
5′- gtgatggtggtgtcctagtgctgctagtggtaggaagcatag-3′(SEQ ID NO:38).
(下划线为提供额外密码子的碱基。)
如下组成所述PCR反应混合物:pUC18-FMD-CL-E1-H6(2ng/μL),1μL;引物H6K hin neu(100μM),2μL;引物H6KRK her neu(100μM),2μL;dNTP(各2.5mM),8μL;H2O,76μL;Expand LongTemplate PCR System(Boeringer;目录号1681 834)缓冲液2(10x浓缩),10μL;Expand Long Template PCR System聚合酶混合物(1U/μL),0.75μL。
使用由下面步骤组成的PCR程序:
-变性步骤:95℃15分钟
-95℃变性30秒,60℃退火1分钟,然后72℃延伸5分钟,共35个循环
-在4℃终止。
在1%琼脂糖凝胶上分析等量PCR样品以检查其大小,证明正确(约4.2kb)。
此后,通过T4聚合酶反应从所述PCR产物除去3’-A突出端,导致具有3’-和5’-OH基团的平端。因此,在剩余的95μL PCR反应混合物中,加入1μL T4聚合酶(Boehringer,1U/μL)和4μL dNTP(各2.5mM)。所述样品在37℃温育20分钟。随后,用乙醇沉淀DNA,并溶解于16μL H2O。
然后,通过激酶反应在所述平端PCR产物中加入5’-磷酸。因此,在所述16μL溶解的平端PCR产物中加入1μL T4多核苷酸激酶(Boehringer;1U/μL),2μL 10倍浓缩的T4多核苷酸激酶反应缓冲液(Boehringer)和1μL ATP(10mM)。所述样品在37℃温育30分钟。
随后,将所述样品加样到1%琼脂糖凝胶上,通过凝胶提取试剂盒(Qiagen),按照供应商的条件,分离正确的产物带。然后应用T4连接酶(Boehringer),按照供应商的条件,自连接五十(50)ng所述纯化的产物。在16℃温育72h后,用乙醇沉淀所述连接混合物中的DNA,然后溶解于10μL水。
然后用5μL所述连接样品转化大肠杆菌DH5α-F’细胞。通过限制酶消化分析几个氨苄青霉素抗性集落的质粒DNA,保留一个阳性集落,将对应的质粒命名为pUC18-FMD-CL-H6-E1-K-H6(SEQ IDNO:39,图17)。
在第二个步骤中,通过双片段连接构建转移载体。在下面构建中涉及具有BclI粘端的片段。由于BclI仅能在未甲基化的DNA上切割其位点,因此用涉及的质粒pUC18-FMD-CL-H6-K-E1-H6(SEQID NO:39,图17)和pFPMT-CL-E1(SEQ ID NO:36,图16)转化大肠杆菌dam-株。在每次转化后,捡出氨苄青霉素抗性集落,在液体培养基上培养,然后制备未甲基化的质粒DNA用于进一步的应用。制备未甲基化质粒pUC18-FMD-CL-H6-K-E1-H6的1.273kb BclI/HindIII片段(携带FMD启动子、CL-H6-K单位的密码子和E1的起始部分)和质粒pFPMT-CL-E1的6.057kb BclI/HindIII片段(携带没有C末端His标记的从BclI位点开始的E1可读框的缺失部分,以及除FMD启动子外位于pFPMT121上的元件),使用T4连接酶(Boehringer),按照供应商的说明书,在总体积20μL内在16℃相互连接72h。随后将所述连接混合物置于一片浮在无菌去离子水表面的硝酸纤维素膜上,以使所述连接混合物脱盐(室温下温育30分钟)。用5μL所述脱盐的样品通过电穿孔转化大肠杆菌TOP10细胞。通过限制酶消化分析几个得到的氨苄青霉素抗性集落的质粒DNA。保留一个阳性克隆,命名为pFPMT-CL-H6-K-E1(SEQ ID NO:40,图18)。
                       实施例6
            转化多形汉逊酵母并选择转化子
用如实施例1-5所述的不同亲代穿梭载体转化(PEG介导的DNA摄取方法,基本如(Klebe,R.J.等1983)所述,按照(Roggenkamp,R.等1986)的修改,转化多形汉逊酵母株RB11。对于每次转化,选择72个尿嘧啶原养型集落,用于通过下面程序产生株。对于每个集落,接种2mL液体培养物,在试管内的选择培养基(YNB/葡萄糖,Difco)培养48小时(37℃;160rpm;角度45°)。该步骤定义为第一个传代步骤。将所述第一个传代步骤培养物的一份150μL等分物用于接种2mL新鲜YNB/葡萄糖培养基。再次如上文所述温育所述培养物(第二个传代步骤)。总共进行八个所述传代步骤。使用第三个和第八个传代步骤后培养物的等分物接种2mL非选择性YPD培养基(Difco)。在37℃温育48小时后(160rpm;角度45°;所谓第一个稳定步骤),将这些YPD培养物的150μl等分物用于接种新鲜的2mL YPD培养基,然后如上文所述温育(第二个稳定步骤)。将所述第二个稳定步骤培养物的等分物在含选择性YNB/琼脂的平板上划线。这些平板培养四天,直到出现肉眼可见的集落。定义每次分离的已经良好定义的单集落为株,用于进一步的表达分析。
在小规模摇瓶培养物中进行表达分析。从上文提到的YNB/琼脂平板中捡出一个集落,接种在2mL YPD中,如上文所述温育48小时。该2mL等分物用作20mL摇瓶培养物的种子培养物。使用YPGlycerol(1%)作为培养基,摇瓶在旋转式摇瓶机上温育(200rpm,37℃)。培养48小时后,在培养物中加入1%MeOH,诱导所述表达盒。在不同时间间隔,收集细胞沉淀的1mL等分物,保存于-20℃直到进一步的分析。通过SDS-PAGE/蛋白质印迹分析特定蛋白表达。因此,将细胞培养物溶解于样品缓冲液(TrisHCl-SDS),在95℃温育15分钟以上。在15%聚丙烯酰胺凝胶上分离蛋白,然后印迹转移(湿印迹;碳酸氢盐缓冲液)到硝酸纤维素膜上。使用特异性鼠抗E1(IGH201)鼠抗E2(IGH 216,由Maertens等在WO96/04385中描述)作为第一抗体,兔抗小鼠AP作为第二抗体,显影印迹。用NBT-BCIP进行染色。
保留阳性株用于进一步的研究。
这些阳性集落中的五个用于摇瓶表达实验。从YNB平板上捡出各个株的一个集落,接种2mL YPD。如上文所述温育这些培养物。使用该细胞悬浮液接种第二种子培养物,即500mL摇瓶内的100mLYPD培养基。该摇瓶在旋转式摇瓶机上于37℃ 200rpm温育48小时。用该种子培养物的25mL等分物接种250mL YPGlycerol(1%)培养基,在上述条件下于有档板的2-1摇瓶内温育。接种48小时后,加入1%MeOH(诱导启动子),继续在上述条件下温育所述摇瓶。诱导24小时后,终止实验,通过离心收集细胞沉淀。通过SDS-PAGE/蛋白质印迹(条件如上文)分析所述五个不同集落的表达水平。将每个集落的滴度系列加样到凝胶上,选出最具有生产性的株用于进一步的发酵和纯化实验。
惊人的是,与巴斯德毕赤酵母(Gellissen,G.2000)密切相关的酵母菌株多形汉逊酵母能够基本没有受到高度糖基化的HCV蛋白,因此所述HCV蛋白的糖部分与由HCV重组痘苗病毒感染的哺乳动物细胞所表达的HCV包膜蛋白的糖部分在大小上相似。
所述多形汉逊酵母菌株RB11于2002年4月19日按照布达佩斯条约的条件保藏于Myecotheque de 1’UCL(MUCL),UniversiteCatholique de Louvain,Laboratoire de mycologie,Place Croix du Sud 3bte 6,B-1348 Louvain-la-Neuve,Belgium,其MUCL保藏号为MUCL43805。
                          实施例7
                   构建pSY1aMFE1sH6a载体
如下文构建所述酿酒酵母表达质粒。从pGEMT-E1sH6分离作为NsI1/Eco52I片段的E1编码序列(SEQ ID NO:6,图1),将该序列平端化(使用T4 DNA聚合酶),然后使用T4 DNA连接酶(Boehringer),根据供应商的说明书,克隆进pYIG5载体(SEQ ID NO:41,图19)。所述克隆使得所述E1s-H6编码片段直接并且符合读框地连接到αMF编码序列。将所述连接混合物转化进大肠杆菌DH5αF’细胞。然后,通过限制性消化分析几个氨苄青霉素抗性集落的质粒DNA,保留一个阳性克隆,命名为pYIG5E1H6(ICCG3470;SEQ ID NO:42,图20)。
将所述表达盒(包含所述αMF序列、所述E1s编码区和一个His标记)作为pYIG5E1H6的BamHI片段(2790bp)转移进BamHI消化的大肠杆菌/酿酒酵母pSY1穿梭载体(SEQ ID NO:21,图43)。用T4 DNA连接酶(Boehringer),根据供应商的条件,进行所述连接。用所述连接混合物转化大肠杆菌DH5αF’细胞,通过限制酶消化分析几个氨苄青霉素抗性集落的质粒DNA。保留一个阳性克隆,命名为pSY1aMFE1sH6a(ICCG3479;SEQ ID NO:44,图22)。
                         实施例8
                  构建pSYYIGSE2H6载体
如下构建酿酒酵母表达质粒pSYYIGSE2H6。从pBSK-E2sH6分离作为SalI/KpnI片段的E2编码序列(SEQ ID NO:45,图23),将其平端化(使用T4 DNA聚合酶),随后使用T4 DNA连接酶(Boehringer),根据供应商的说明书,克隆进pYIG5载体(SEQ ID NO:41,图19)。所述克隆使得所述E2-H6编码片段直接并且符合读框地连接到αMF编码序列。将所述连接混合物转化进大肠杆菌DH5αF’细胞。然后,通过限制性消化分析几个氨苄青霉素抗性集落的质粒DNA,保留一个阳性克隆,命名为pYIG5HCCL-22aH6(ICCG2424;SEQ ID NO:46,图24)。
将所述表达盒(包含所述αMF序列、所述E2(384-673)编码区和一个His标记)作为pYIG5HCCL-22aH6的BamHI片段(3281bp)转移进BamHI打开的大肠杆菌/酿酒酵母pSY1穿梭载体(SEQ ID NO:43,图21)。用T4 DNA连接酶(Boehringer),根据供应商的条件,进行所述连接。用所述连接混合物转化大肠杆菌DH5αF’细胞,通过限制酶消化分析几个氨苄青霉素抗性集落的质粒DNA。保留一个限制阳性克隆,命名为pSYYIGSE2H6(ICCG2466;SEQ ID NO:47,图25)。
                         实施例9
                  构建pSY1YIG7E1s载体
如下构建酿酒酵母表达质粒pSY1YIG7E1s。从pGEMT-E1s分离作为NsI1/Eco52I片段的E1编码序列(SEQ ID NO:6,图1),将其平端化,随后使用T4 DNA连接酶(Boehringer),根据供应商的说明书,克隆进pYIG7载体(SEQ ID NO:48,图26)。所述克隆使得所述E1编码片段直接并且符合读框地连接到αMF编码序列。将所述连接混合物转化进大肠杆菌DH5αF’细胞,通过限制性消化分析几个氨苄青霉素抗性集落的质粒DNA,保留一个阳性克隆,命名为pYIG7E1(SEQ ID NO:49,图27)。
将所述表达盒(包含所述CL前导序列、所述E1(192-326)编码区)作为pYIG7E1的BamHI片段(2790bp)转移进BamHI消化的大肠杆菌/酿酒酵母pSY1穿梭载体(SEQ ID NO:43,图21)。用T4 DNA连接酶(Boehringer),根据供应商的条件,进行所述连接。用所述连接混合物转化大肠杆菌DH5αF’细胞,通过限制酶消化分析几个氨苄青霉素抗性集落的质粒DNA。保留一个限制阳性克隆,命名为pSY1YIG7E1s(SEQ ID NO:50,图28)。
                      实施例10
              转化酿酒酵母并选择转化子
为克服对于在酿酒酵母中过量表达的蛋白经常报道的高度糖基化的问题,建立一个突变子筛选。该筛选基于Ballou的方法(Ballou,L.等1991),由此选出自发的隐性原钒酸盐抗性突变子。根据非变性凝胶电泳所观察到的转化酶的糖基化模式,进行初步株筛选。保留一个糖基化能力减少的株用于进一步的重组蛋白表达实验,将其命名为菌株IYCC155。还没有进一步研究突变的性质。
基本根据Elble(Elble,R.1992)所述的醋酸锂方法,用如实施例7-9中所述的质粒转化所述糖基化缺陷型株IYCC155。从选择性YNB+2%琼脂平板(Difco)上捡出几个尿嘧啶互补株,用于接种2mlYNB+2%葡萄糖。这些培养物在定轨摇床上于37℃ 200rpm温育72小时,通过用E1特异性鼠单克隆抗体(IGH201)显影的蛋白质印迹分析培养物上清和细胞内组分中E1的表达。保留一个高度生产性的集落用于进一步的实验。
本文所用的酿酒酵母糖基化缺陷型突变子中的蛋白表达受到所述菌株非最佳生长特征的阻碍,这导致与野生型酿酒酵母菌株相比更低的生物量产量和因此更低的目的蛋白产量。目的蛋白的产量仍然明显比哺乳动物细胞中的产量更高。
                      实施例11
    构建pPICZalphaD’E1sH6和pPICZalphaE’E1sH6载体
从pPICZalphaA载体(Invitrogen;SEQ ID NO:51,图29)开始构建穿梭载体pPICZalphaE’E1sH6。在第一个步骤,改造所述载体,以便能够将所述E1编码序列分别克隆到紧接在KEX2或STE13加工蛋白酶的切割位点之后。因此,用XhoI和NotI消化pPICZalphaA。在1%琼脂糖凝胶上分离所述消化物,通过凝胶提取试剂盒(Qiagen)分离和纯化3519kb片段(载体的主要部分)。然后用T4聚合酶(Boehringer),根据供应商的条件,在特定寡核苷酸存在下连接该片段,产生pPICZalphaD’(SEQ ID NO:52,图30)或pPICZalphaE’(SEQ ID NO:53,图31)。
使用下面寡核苷酸:
-构建pPICZalphaD’:
8822:5’-TCGAGAAAAGGGGCCCGAATTCGCATGC-3’(SEQ ID NO:54);和
8823:5’-GGCCGCATGCGAATTCGGGCCCCTTTTC-3’(SEQ ID NO:55)
在退火后产生下面连接物寡核苷酸:
TCGAGAAAAGGGGCCCGAATTCGCATGC(SEQ ID NO:54)
CTTTTCCCCGGGCTTAAGCGTACGCCGG(SEQ ID NO:55)
-构建pPICZalphaE’
8649:5’-TCGAGAAAAGAGAGGCTGAAGCCTGCAGCATATGC-3’(SEQ ID NO:56)
8650:5’-GGCCGCATATGCTGCAGGCTTCAGCCTCTCTTTTC-3’(SEQ ID NO:57)
退火后产生下面连接物寡核苷酸:
TCAGAAAAGAGAGGCTGAAGCCTGCAGCATATGC   (SEQ ID NO:56)
CTTTTCTCTCCGACTTCGGACGTCGTATACGCCGG  (SEQ ID NO:57)
这些穿梭载体pPICZalphaD’和pPICZalphaE’已经紧接在相应加工蛋白酶KEX2和STE13的切割位点之后分别新引入克隆位点。从pGEMT-E1sH6分离作为NsI1/Eco52I片段的E1-H6编码序列(SEQ IDNO:6,图1)。在1%琼脂糖凝胶上分离所述消化物后,使用凝胶提取试剂盒(Qiagen)纯化所述片段。平端化所得的片段(使用T4 DNA聚合酶),然后连接进pPICZalphaD’或pPICZalphaE’中,紧接在各自所述加工蛋白酶切割位点之后。
将所述连接混合物转化进大肠杆菌TOP10F’细胞,然后通过限制酶消化分析几个zeocin抗性集落的质粒DNA。保留阳性克隆,分别命名为pPICZalphaD’E1sH6(ICCG3694;SEQ ID NO:58,图32)和pPICZalphaE’E1sH6(ICCG3475;SEQ ID NO:59,图33)。
                        实施例12
      构建pPICZalphaD’E2sH6和pPICZalphaE’E2sH6载体
如实施例11中所述构建穿梭载体pPICZalphaD’和pPICZalphaE’。
从pBSK-E2sH6(SEQ ID NO:45,图23)分离作为SalI/KpnI片段的E2-H6编码序列。在1%琼脂糖凝胶上分离所述消化物后,用凝胶提取试剂盒(Qiagen)纯化所述片段。平端化得到的片段(使用T4 DNA聚合酶),连接进pPICZalphaD’或pPICZalphaE’中,紧接在各自所述加工蛋白酶切割位点之后。
将所述连接混合物转化进大肠杆菌TOP10F’细胞,然后通过限制酶消化分析几个zeocin抗性集落的质粒DNA。保留阳性克隆,分别命名为pPICZalphaD’E2sH6(ICCG3692;SEQ ID NO:60,图34)和pPICZalphaE’E2sH6(ICGG3476;SEQ ID NO:61,图35)。
                        实施例13
              转化巴斯德毕赤酵母并选择转化子
将如实施例11和12中所述的巴斯德毕赤酵母穿梭质粒根据供应商(Invitrogen)的条件转化进巴斯德毕赤酵母细胞。保留一个产生E1的株和一个产生E2的株用于进一步的特征鉴定。
在巴斯德毕赤酵母中表达所述HCV包膜蛋白,众所周知巴斯德毕赤酵母通常缺乏高度糖基化(Gellissen,G.2000),以前用于表达GST融合体形式的登革热病毒E蛋白(Sugrue,R.J.等1997)。引人注目的是,所得到的巴斯德毕赤酵母表达的HCV包膜蛋白表现与野生型酵母菌株类似的糖基化。更举具体地说,所述由巴斯德毕赤酵母产生的HCV包膜蛋白受到高度糖基化(根据对从转化巴斯德毕赤酵母细胞分离的蛋白进行的蛋白质印迹中检测到的表达产物的分子量)。
                         实施例14
     酿酒酵母、多形汉逊酵母和巴斯德毕赤酵母的培养条件
酿酒酵母
细胞库
为所选择的重组子克隆建立原细胞库和工作细胞库。从生长到对数期中期的摇瓶培养物(培育条件同用于发酵种子培养物的培育条件,见下文)制备冻存管。加入甘油(终浓度50%)作为冰冻保护剂。
发酵
种子培养物从冰冻保存的工作细胞库小管开始,在2L锥形摇瓶的500mL培养基(补充2%蔗糖的YNB,Difco)中于37℃,200rpm下培养48小时。
通常在工作体积为15L的Biostat C发酵罐(B.Braun Int.,Melsungen,Germany)中进行发酵。发酵培养基含1%酵母提取物、2%蛋白胨,并含2%蔗糖作为碳源。使用聚乙二醇作为消泡剂。
通常在发酵过程中控制温度、pH和溶氧,可应用的设定点在表1中综述。通过搅拌/通气级联控制溶氧。通过加入NaOH(0.5M)或H2PO4溶液(8.5%)控制pH。
表1.酿酒酵母发酵的一般参数设置
参数 设置点
温度 33-37℃
pH 4.2-5.0
DO(生长期) 10-40%空气饱和度
DO(诱导期) 0-5%
通气 0.5-1.8vvm*
搅拌 150-900rpm
*每分钟更换的体积
从加入10%种子培养物开始发酵。在生长期期间,通过HPLC分析(Polysphere Column OAKC Merck)离线监测蔗糖浓度。
在生长期期间,通过级联控制(搅拌/通气)控制溶氧。在完成蔗糖代谢后,通过内源产生的乙醇以及逐步添加EtOH以将浓度维持在约0.5%(离线HPLC分析,polyspher OAKC柱),驱动异源蛋白生产。在该诱导期内,通过手动调节空气流速和搅拌转速,将溶氧控制在5%空气饱和度以下。
通常在诱导后48-72小时收获发酵物:切向流过滤浓缩,然后离心所述浓缩的细胞悬浮液,获得细胞沉淀。如果不立即进行分析,将细胞沉淀保存在-70℃。
多形汉逊酵母
细胞库
为所选择的重组子克隆建立原细胞库和工作细胞库。从生长到对数期中期的摇瓶培养物(培育条件同用于发酵种子培养物的培育条件,见下文)制备冻存管。加入甘油(终浓度50%)作为冰冻保护剂。
发酵
种子培养物从冰冻保存(-70℃)的工作细胞库小管开始,在2L锥形摇瓶的500mL培养基(YPD,Difco)中于37℃,200rpm下培养48小时。
通常在工作体积为15L的Biostat C发酵罐(B.Braun Int.,Melsungen,Germany)中进行发酵。发酵培养基含1%酵母提取物、2%蛋白胨,并含1%甘油作为碳源。使用聚乙二醇作为消泡剂。
通常在发酵过程中控制温度、pH、通气和溶氧,可应用的设定点在表2中综述。通过搅拌控制溶氧。通过加入NaOH(0.5M)或H2PO4溶液(8.5%)控制pH。
表2.多形汉逊酵母发酵的一般参数设置
参数 设置点
温度 30-40℃
pH 4.2-5.0
DO 10-40%空气饱和度
通气 0.5-1.8vvm*
搅拌 150-900rpm
*每分钟更换的体积
从加入10%种子培养物开始发酵。在生长期期间,通过HPLC分析(Polysphere Column OAKC Merck)离线监测蔗糖浓度,在甘油消耗完全后24小时,加入1%甲醇以诱导异源蛋白表达。在诱导后24小时收获发酵物:切向流过滤浓缩,然后离心所述浓缩的细胞悬浮液,获得细胞沉淀。如果不立即进行分析,将细胞沉淀保存在-70℃。
巴斯德毕赤酵母
在摇瓶培养物中建立用重组巴斯德毕赤酵母进行的小规模蛋白生产实验。种子培养物在YPD培养基(Difco)中培养过夜。将初始培养基pH调整到4.5。在旋转式摇床上于200-250rpm,37℃培养摇瓶。
通常在2L摇瓶的500mL规模上进行小规模生产,从在表达培养基中10%接种开始,所述表达培养基含1%酵母提取物、2%蛋白胨(都来自Difco),并含2%甘油作为碳源。培育条件与所述种子培养物的培育条件相同。在接种后约72小时加入1%MeOH,开始诱导。诱导后24小时通过离心收集细胞。如果不立即进行分析,就将细胞沉淀保存在-70℃。
                       实施例15
从在选出的酵母细胞中表达的MFα-E1-H6和MFα-E2-H6蛋白
                      去除前导肽
进一步分析多形汉逊酵母和酿酒酵母糖基化负型株中携带酿酒酵母α交配因子(αMF)前导序列的HCV E1和E2蛋白构建物的表达产物。由于基因型1b HCV E1s(氨基酸192-326)和HCV E2s(氨基酸383-673,由VIEGR(SEQ ID NO:69)序列延长)都表达成为C末端his标记(H6,HHHHHH,SEQ ID NO:63;所述HCV蛋白在本实施例中另外命名为αMF-E1-H6和αMF-E2-H6)蛋白,因此在用盐酸胍(GuHCl)溶解所述酵母细胞后,在Ni-IDA(Ni-亚氨基二乙酸)上进行所述表达产物的快速有效纯化。简要地说,将细胞沉淀重悬浮于50mM磷酸,6M GuHCl,pH7.4(9体积/g细胞)。蛋白在320mM(4%w/v)亚硫酸钠和65mM(2%w/v)连四硫酸钠存在下,于室温下磺化过夜。经过一个冻融循环后,离心(10.000g,30分钟,4℃)清除裂解物,在上清中加入Empigen(Albright & Wilson,UK)和咪唑分别达到1%(w/v)和20mM的终浓度。过滤(0.22μM)所述样品,加样到Ni-IDA Sepharose FF柱上,该柱在此之前用补充20mM咪唑的50mM磷酸,6M GuHCl,1%Empigen(缓冲液A)平衡。该柱顺序用分别含20mM和50mM咪唑的缓冲液A冲洗,直到280nm处的吸光度达到基线水平。应用缓冲液D洗脱所述his标记的产物,所述缓冲液D含50mM磷酸,6MGuHCl,0.2%(对于E1)或1%(对于E2)Empigen,200mM咪唑。通过SDS-PAGE和使用针对E1(IGH201)或E2(IGH212)的特异性单克隆抗体的蛋白质印迹分析洗脱的物质。
立即通过Edman降解法分析所述E1产物。
由于在该阶段,SDS-PAGE已经揭示HCV E2有非常复杂的蛋白带图,因此通过大小排阻层析进行另一次分级分离。通过超滤(MWCO 10kDa,centriplus,Amicon,Millipore)浓缩所述Ni-IDA洗脱物,然后在PBS,1%Empigen或PBS,3%Empigen中加样到SuperdexG200(10/30或16/60;Pharmacia)上。汇集和烷基化(与10mM DTT在室温下温育3小时,然后与30mM碘乙酰胺在室温下温育3小时)含E2产物的洗脱组分,根据在SDS-PAGE上的迁移(图38),所述组分的Mr在约80kDa到约45kDa之间,即图37中洗脱分布的组分17-23。用于进行氨基末端测序的样品接受Endo H(Roche Biochemicals)处理或不处理。将所述糖基化和脱糖基化的E2产物印迹转移到PVDF膜上,进行氨基末端测序。图39显示糖基化和脱糖基化E2的酰胺黑染色印迹。
对E1和E2纯化产物的测序都获得令人失望的观察结果,即仅部分出现信号序列从所述HCV包膜蛋白的去除(见表3)。此外,大部分副产物(降解产物和仍然包含所述前导肽或其部分的产物)受到糖基化。该糖基化甚至部分在于还包含一个N-糖基化位点的所述信号序列的未切割片段。可以突变这些位点,以有较少受到糖基化的副产物。然而,甚至更有问题的是,发现一些受到其它形式切割的产物与所需的完整包膜蛋白相比,仅有1-4个氨基酸不同。因此,由于在不同表达产物之间缺乏足够有区别性的生化特征,纯化受到正确加工的产物事实上是不可能的。几种降解产物可能是Kex-2样切割的结果(如观察到的在E1的氨基酸196后的切割,该切割是在精氨酸之后的切割),这也是切割所述α-交配因子前导肽所需的,因此阻断其将干扰该基本过程。
将一个用pSY1YIG7E1s(SEQ ID NO:50;图28)转化酿酒酵母IYCC155得到的E1高生产性克隆与一个用pSY1aMFE1sH6aYIG1E1s(SEQ ID NO:44;图22)转化酿酒酵母IYCC155得到的高生产性集落进行比较。在诱导后2天直到7天评估E1蛋白的细胞内表达,这通过使用E1特异性单克隆抗体(IGH 201)的蛋白质印迹进行。如可以从图40判断出的,两个株在2天后都观察到最大表达,但两个株的表达模式是完全不同的。与α-交配因子前导序列表达导致非常复杂的带模式,这是由于对所述前导肽的加工不有效的结果。这导致带有不同氨基末端的表达产物,其中有一些受到1到5个N-糖基化修饰。然而,对于与CL前导肽表达的E1,如对于来自汉逊酵母属的与同样CL前导肽表达的E1所观察到的(见实施例16),只看到有限数量的清楚的带,这反映高水平的正确去除CL前导序列,以及仅有该受到正确加工的物质受到N-糖基化修饰(1-5条链)。
产生针对E1的单克隆抗体(IGH201)的杂交瘤细胞系于1998年3月12日按照布达佩斯条约的条件保藏于European Collection of CellCultures,Centre for Applied Microbiology & Research,Salisbury,Wiltshire SP4 OJP,UK,保藏号为ECACC 98031216。所述针对E2的单克隆抗体(IGH212)已经由Maertens等在WO96/04385中的实施例7.4描述为抗体12D11F2。
表3.鉴定在酿酒酵母或多形汉逊酵母中表达的αMF-E1-H6和αMF-E2-H6蛋白的N末端。根据N末端测序,可以估计成熟E1-H6和E2-H6蛋白的N末端的量(“成熟”指正确去除所述αMF信号序列)。根据通过Edman降解回收的峰的强度,计算蛋白产物总量,以pmol蛋白表示。然后,对于每种特定蛋白(即对于每种“检测到的N末端”),估计占总量的摩尔百分率。
    酵母     αMF-E1-H6  αMF-E2-VIEGR-H6
酿酒酵母 实验1:-16%的蛋白仍然含有αMF序列-18%的蛋白在E1的氨基酸195和196之间受到切割-66%的蛋白正确去除αMF实验2:-18%的蛋白仍然含有αMF序列-33%的蛋白在E1的氨基酸195和196之间受到切割-8%属于其它E1切割产物的其它蛋白-44%的蛋白正确去除αMF           //
多形汉逊酵母 -64%的蛋白仍然含有αMF序列-6%的蛋白在E1的氨基酸195和196之间受到切割-30%的蛋白正确去除αMF -75%的蛋白仍然含有αMF序列-25%的蛋白正确去除αMF
                      实施例16
   在适于大规模生产和纯化的酵母中表达一个E1构建物
使用几种其它前导序列取代酿酒酵母αMF前导肽并连接到E1-H6(即带有C末端his标记的E1),所述其它前导序列包括CHH(Carcinus maenas高血糖激素的前导序列)、Amy1(来自许旺酵母的淀粉酶的前导序列)、Gam1(来自许旺酵母的葡糖淀粉酶的前导序列)、Phy5(来自真菌肌醇六磷酸酶的前导序列)、pho1(来自巴斯德毕赤酵母酸性磷酸酶的前导序列)和CL(鸟溶菌酶C,即1,4-β-N-乙酰胞壁质酶C的前导序列)。所有构建物都在多形汉逊酵母中表达,每种得到的细胞裂解物都接受蛋白质印迹分析。这已经允许得出结论:除其中使用CL作为前导肽的构建物外,前导或信号序列或肽的去除程度非常低。可以通过Edman降解Ni-IDA纯化的物质,针对CHH-E1-H6证实这一点:虽然回收几种不同的序列,但不能检测到正确切割的产物(见表4)。
表4.在通过SDS-PAGE分离并印迹转移到PVDF膜上后,根据对不同蛋白带的N末端氨基酸测序,鉴定在多形汉逊酵母中表达的CHH-E1-H6蛋白的N末端。
分子大小 鉴定的N末端
45kD 从CHH前导序列的氨基酸27开始=仅切除前序列,仍然连接原序列
26kD -部分开始于CHH前导序列的氨基酸1=没有去除前原序列-部分开始于CHH前导序列的氨基酸9=在第二个AUG密码子开始的替代翻译的产物
24kD -部分开始于CHH前导序列的氨基酸1=没有去除前原序列-部分开始于CHH前导序列的氨基酸9=在第二个AUG密码子开始的替代翻译的产物
如已经提到的,对细胞裂解物的蛋白质印迹揭示E1特异性蛋白带的模式,这指示更高程度地正确去除CL前导肽。这是惊人的,因为该前导肽不来自酵母。通过对GuHCl溶解和Ni-IDA纯化的物质的Edman降解的氨基酸测序确实证实:84%的蛋白受到正确切割,并且所述物质基本没有降解产物。仍然存在16%未加工的物质,但由于该物质没有受到糖基化,它可以容易地从所述混合物中去除,因此允许特异性富集受到正确切割和糖基化的E1。用于富集的所述方法可以是在凝集素上进行的亲和层析,实施例19给出其它可替代的方法。或者,可以使用所述未受到糖基化的有更高疏水特性的物质选择和优化其它富集程序。进一步通过质谱证实CL前导肽从所述CL-E1-H6蛋白的正确去除,这也证实基因型1b E1s的5个糖基化位点中高达4个位点可以被占据,由此序列NNSS(氨基酸233到236;SEQ ID NO:73)被认为是单糖基化位点。
                     实施例17
 在多形汉逊酵母中从CL-E2-H6编码构建物表达的HCV E2蛋
             白的纯化和生化特征鉴定
分析从在多形汉逊酵母表达的CL-E2-VIEGR-H6(在本实施例中另外命名为“CL-E2-H6”)蛋白去除CL前导肽的效率。由于HCV E2s(氨基酸383-673)表达成为his标记蛋白,因此在用盐酸胍(GuHCl)溶解收集的细胞后,在Ni-IDA上进行所述表达蛋白的快速有效纯化。简要地说,将细胞沉淀重悬浮于30mM磷酸,6M GuHCl,pH7.2(9mL缓冲液/g细胞)。蛋白在320mM(4%w/v)亚硫酸钠和65mM(2%w/v)连四硫酸钠存在下,于室温下磺化过夜。经过一个冻融循环后,离心(10.000g,30分钟,4℃)清除裂解物。加入Empigen BB(Albright &Wilson)和咪唑分别达到1%(w/v)和20mM的终浓度。所有其它层析步骤在Akta FPLC工作站(Pharmacai)上进行。所述样品通过0.22μM孔径膜(醋酸纤维素)过滤,然后加样到Ni-IDA柱(加载Ni2+的络合Sepharose FF,Pharmacia)上,该柱在此之前用补充20mM咪唑的50mM磷酸,6M GuHCl,1%Empigen BB,pH7.2(缓冲液A)平衡。该柱顺序用分别含20mM和50mM咪唑的缓冲液A冲洗,直到280m处的吸光度达到基线水平。应用缓冲液D洗脱所述his标记的产物,所述缓冲液D含50mM磷酸,6M GuHCl,0.2% Empigen BB(pH7.2),200mM咪唑。通过SDS-PAGE和使用针对E2的特异性单克隆抗体(IGH212)的蛋白质印迹分析所述纯化物质(图41)。所述IMAC纯化的E2-H6蛋白也接受通过Edman降解的N末端测序。此后,蛋白用N-糖苷酶F(Roche)处理(0.2U/μg E2,在PBS/3% empigen BB中于37℃温育1小时)或不处理。所述糖基化和脱糖基化的E2-H6蛋白进行SDS-PAGE,然后印迹转移到PVDF膜上,进行氨基酸测序(在PROCISETM 492蛋白测序仪,Applied Biosystems上进行分析)。由于在该阶段,SDS-PAGE揭示一些降解产物,因此通过大小排阻层析进行进一步的分级分离。然后通过超滤(MWCO 10kDa,centriplus,Amicon,Millipore)浓缩所述Ni-IDA洗脱物,并加样到在PBS,1%Empigen BB中的Superdex G200(Pharmacia)上。汇集主要包含完整E2s相关产物的洗脱组分,根据在SDS-PAGE上的迁移,所述完整E2s相关产物的Mr在约30kDa和约70kDa之间,并最终将所述组分烷基化(与5mM DTT在37℃温育30分钟,然后与20mM碘乙酰胺在37℃温育30分钟)。因此,通过大小排阻层析对所述完整产物进行的进一步分级分离,能够克服IMAC纯化后可能存在降解产物的问题。观察到一个意想不到的好结果。根据N末端测序,可以估计其中去除CL前导肽的E2产物的量。根据通过Edman降解回收的峰的强度,计算蛋白产物的总量,表示为pmol蛋白。然后,针对每种特定蛋白(即对于每种“检测到的N末端”)估计占总量的摩尔百分率。在本实验中,仅检测到E2-H6的正确N末端,没有检测到缺乏E2蛋白氨基酸或包含E2蛋白中没有的N末端氨基酸的E2-H6变异体。总之,分离由多形汉逊酵母作为CL-E2-H6蛋白表达的E2-H6蛋白,所述CL-E2-H6蛋白未经任何进一步的体外加工就成为>95%正确切割的蛋白。这与多形汉逊酵母去除αMF-E2-H6蛋白的前导肽成为E2-H6蛋白的保真性形成鲜明对比,所述保真性据估计仅出现在25%的分离蛋白中(见表3)。
                    实施例18
 在多形汉逊酵母中从CL-H6-K-E1编码构建物表达的HCV E1
蛋白的纯化和生化特征鉴定,以及包含H6的蛋白的体外加工
分析从在多形汉逊酵母表达的CL-H6-K-E1蛋白去除CL前导肽的效率,以及随后体外加工以去除H6(his标记)-接头肽和Endo Lys-C加工位点的效率。由于所述HCV E1s(氨基酸192-326)作为N末端His-K标记的蛋白CL-H6-K-E1表达,因此如实施例17所述进一步快速有效的纯化。图42显示H6-K-E1(以及可能残余CL-H6-K-E1)蛋白的IMAC层析纯化的洗脱分布。在SDS-PAGE并对凝胶进行银染,然后使用针对E1的特异性单克隆抗体(IGH201)进行蛋白质印迹分析(图43)后,汇集含重组E1s产物的洗脱组分(63-69)(“IMAC汇集物”),用内切蛋白酶Lys-C(Roche)处理过夜(酶/底物比为1/50(重量比),37℃),以去除所述H6-K融合尾。通过在Ni-IDA柱上进行的阴性IMAC层析步骤除去未加工的融合产物,收集在流出组分中的Endo-Lys-C加工的蛋白。所述用内切蛋白酶Lys-C消化的蛋白样品用10mMNaH2PO4·3H2O,1%(体积比)Empigen B,pH7.2(缓冲液B)稀释10倍后,加样到Ni-IDA柱上,然后用缓冲液B冲洗直到280nm处的吸光度值达到基线水平。收集根据E1s产物的存在(图44)筛选的不同组分(1-40)中的流出物。汇集包含完整E1的组分(7-28)并最终进行烷基化(与5mM DTT在37℃温育30分钟,然后与20mM碘乙酰胺在37℃温育30分钟),其中已经从所述完整的E1中去除N末端H6-K(以及可能残余的CL-H6-K)尾,根据SDS-PAGE上的迁移以及随后进行的银染或使用针对E1的特异性单克隆抗体(IGH201)进行的蛋白质印迹分析,其Mr在约15kDa到约30kDa之间。
对该物质进行N末端测序(Edman降解)。然后蛋白样品用N-糖苷酶F(Roche)处理(0.2U/μg E1,在PBS/3%empigen BB中于37℃温育1小时)或不处理。所述糖基化和脱糖基化的E1蛋白随后通过SDS-PAGE分离,然后印迹转移到PVDF膜上,通过Edman降解进行进一步的分析(在PROCISETM 492蛋白测序仪,Applied Biosystems上进行分析)。根据N末端测序,可以估计受到正确加工的E1产物的量(加工包括正确切割H6-K序列)。根据通过Edman降解回收的峰的强度,计算蛋白产物的总量,表示为pmol蛋白。然后对于每种特定蛋白(即“检测到的N末端”),估计占总量的摩尔百分率。在本实验中,仅检测到E1的正确N末端,没有检测到H6-K-E1其它加工变异体的N末端。根据以上事实,Endo Lys-C体外加工H6-K-E1(以及可能残余的CL-H6-K-E1)蛋白成为E1蛋白估计以超过95%的保真度出现。
                      实施例19
       通过肝素特异性去除HCV E1的少量糖基化形式
为发现从酵母细胞中特异性纯化HCV包膜蛋白的步骤,评估与肝素的结合。已知肝素结合几种病毒,因此已经有人建议用肝素结合HCV包膜(Garson,J.A.等1999)。为分析这种可能的结合,生物素化肝素,并在微量滴定板中分析其与HCV E1的相互作用,所述微量滴定板或者用来自多形汉逊酵母的磺化HCV E1包被,或者用来自多形汉逊酵母的烷基化HCV E1(都如实施例16所述产生)包被,或者用来自用痘苗表达载体转染的哺乳动物细胞培养物的烷基化HCV E1包被。惊人的是,仅使用来自多形汉逊酵母的磺化HCV E1时观察到强结合,而完全没有观察到与来自哺乳动物细胞培养物的HCV E1的结合。通过蛋白质印迹,我们可以展示:该结合特异性针对HCV E1蛋白混合物的低分子量带(图45),所述低分子量带对应于受到少量糖基化的成熟HCV E1s。图45还揭示:磺化对于肝素结合不是必需的,因为所述低分子量E1去除该磺化后仍然观察到结合(道4)。或者,烷基化在实质上减少该结合,然而,这可能是由于在本实施例中使用的特异性烷基化剂(碘乙酰胺)引起的。该发现进一步证明所述CL-HCV-包膜表达盒对于酵母的工业应用性,因为我们可以特异性地富集HCV E1制备物成为受到更高程度糖基化的HCV E1蛋白的制备物(即更多的糖基化位点被占据)。
                      实施例20
             形成和分析病毒样颗粒(VLP)
基本如Depla等在WO99/67285和Bosman等在WO01/30815中所述将在多形汉逊酵母中表达的HCV E1和E2包膜蛋白(实施例16-18)转化成为VLP。简要地说,培养转化多形汉逊酵母细胞,培养期间表达所述HCV包膜蛋白,然后收获细胞,如实施例17所述在GuHCl中裂解并进行磺化。然后如实施例17所述,通过IMAC纯化His标记的蛋白并超滤浓缩。
用带有磺化Cys硫醇基团的HCV包膜蛋白形成VLP
在分离程序期间磺化的浓缩HCV包膜蛋白不接受还原处理,加样到用PBS,1%(体积比)Empigen平衡的大小排阻层析柱(SuperdexG200,Pharmacia)上。通过SDS-PAGE和蛋白质印迹分析洗脱的流分。汇集相对Mr为约29到约15kD(根据SDS-PAGE上的迁移)的流分,浓缩并加样到用PBS,3%(重量/体积)甜菜碱平衡的Superdex G200上,强迫病毒样颗粒形成(VLP)。汇集所述流分,浓缩,并对PBS,0.5%(重量/体积)甜菜碱脱盐。
用带有受到不可逆修饰的Cys-硫醇基团的HCV包膜蛋白形成VLP
浓缩的在分离程序期间受到磺化的HCV包膜蛋白接受还原处理(在PBS中5mM DTT存在下温育),将磺化Cys-硫醇基团转化成为游离Cys-硫醇基团。如下进行不可逆Cys-硫醇修饰:(1)在20mM碘乙酰胺存在下温育30分钟,或者(2)在5mM N-乙基马来酰亚胺(NEM)和15mM生物素-乙基马来酰亚胺存在下温育30分钟。然后将所述蛋白加样到大小排阻层析柱(Superdex G200,Pharmacia)上,在用碘乙酰胺封闭的情况下,该柱用PBS,1%(体积比)Empigen平衡,在用NEM和生物素-NEM封闭的情况下,该柱用PBS,0.2%CHAPS平衡。通过SDS-PAGE和蛋白质印迹分析洗脱的流分。汇集相对Mr为约29到约15kD(根据SDS-PAGE迁移)的流分,浓缩,然后加样到用PBS,3%(重量体积比)甜菜碱平衡的Superdex G200柱上,强迫病毒样颗粒形成。汇集所述组分,浓缩,在用碘乙酰胺封闭的情况下对PBS,0.5%(重量体积比)甜菜碱脱盐,在用NEM和生物素-NEM封闭的情况下对PBS,0.05%CHAPS脱盐。
用带有受到可逆修饰的Cys-硫醇基团的HCV包膜蛋白形成VLP
浓缩的在分离程序期间受到磺化的HCV包膜蛋白接受还原处理(在PBS中5mM DTT存在下温育),将磺化Cys-硫醇基团转化成为游离Cys-硫醇基团。如下进行可逆Cys-硫醇修饰:在二硫代联吡啶(DTDP)、二硫代氨基甲酸酯(DTC)或半胱氨酸存在下,温育30分钟。然后将所述蛋白加样到用PBS,1%(体积比)Empigen平衡的大小排阻层析柱(Superdex G200,Pharmacia)上。通过SDS-PAGE和蛋白质印迹分析洗脱的组分。汇集相对Mr为约29到约15kD(根据SDS-PAGE迁移)的组分,浓缩,然后加样到用PBS,3%(重量体积比)甜菜碱平衡的Superdex G200上,强迫病毒样颗粒(VLP)形成。汇集所述组分,浓缩,对PBS,0.5%(重量体积比)甜菜碱脱盐。
图46(磺化)和图47(用碘乙酰胺烷基化)显示在PBS,3%(重量体积比)甜菜碱中进行大小排阻层析以获得多形汉逊酵母表达的E2-H6的VLP的洗脱分布。
图48(磺化)和图49(用碘乙酰胺烷基化)显示在PBS,3%(重量体积比)甜菜碱中进行大小排阻层析以获得多形汉逊酵母表达的E1的VLP的洗脱分布。通过SDS-PAGE和蛋白质印迹分析得到的VLP,如图50所示。
由多形汉逊酵母表达的HCV包膜蛋白形成的VLP的大小分析
通过动态光散射确定VLP颗粒大小。对于光散射实验,使用由光子相关光谱学(PCS)软件控制的粒子大小分析仪(Zetasizer 1000 HS型,Malvern Instruments Ltd.,Malvern,Worcester UK)。光子相关光谱学或动态光散射(DLS)是测量布郎运动并将其与粒子大小相关的光学方法。光形成连续可见的激光束,通过处于悬浮状态和布郎运动中的大分子或粒子的系综。一些激光被粒子散射,光电倍增管测量这种散射光。散射光强度的波动被转化为电脉冲,输入相关器。这产生自相关函数,将该函数传递到进行合适数据分析的计算机。使用的激光是10mW单色相干He-Ne激光,固定波长为633nm。对于每个样品,进行三到六次连续测量。
这些实验的结果在表5中综述。
表5.对由多形汉逊酵母表达的HCV包膜蛋白的指定VLP组合物进行的动态光散射分析的结果。VLP颗粒大小表示为所述颗粒的平均直径。
Cys-硫醇修饰      E1-H6   E2-VIEGR-H6        E1
磺化     25-45nm     20nm     20-26nm
烷基化(碘乙酰胺)     23-56nm     20-56nm     21-25nm
得自多形汉逊酵母的磺化HCV E1仍然形成与来自汉逊酵母属的烷基化HCV E1大小范围相同的颗粒,这个观察结果是惊人的。该效果是未曾预料到的,因为磺化造成的负电荷大量(在HCV E1上多达8个Cys-硫醇基团可以受到修饰)净增加应当诱导亚单位间的离子排斥。其它测试过的可逆半胱氨酸修饰剂也允许颗粒形成,然而,已经证明用该方法产生的HCV E1比受到磺化的物质更不稳定,导致HCV E1基于二硫化物的聚集。为使用这些其它可逆封闭剂,需要进一步优化条件。
                     实施例21
汉逊酵母属产生的HCV E1-H6与痘苗病毒感染的哺乳动物细胞
           产生的HCV E1在抗原性上等值
如Depla等在WO 99/67285中所述,比较汉逊酵母属产生的HCVE1-H6与来自HCV慢性携带者的反应性以及由HCV重组痘苗病毒感染的哺乳动物细胞产生的HCV E1的反应性。两种接受测试的HCV-E1制备物都由VLP组成,其中所述HCV E1蛋白受到NEM和生物素-NEM的烷基化。通过ELISA测定两种HCV E1 VLP制备物与来自HCV慢性携带者的反应性。结果在表6综述。如可以从表6推导出来的,在HCV重组痘苗病毒感染的哺乳动物细胞表达的HCVE1和多形汉逊酵母表达的HCV E1之间没有观察到反应性的区别。
表6.在一组来自人HCV慢性携带者的血清上评价在哺乳动物细胞培养物内产生的E1或在多形汉逊酵母中产生的E1的抗原性。为此目的,生物素化E1结合于用链霉抗生物素包被的ELISA板。然后加入以1/20稀释的人血清,用过氧化物酶标记的兔抗人IgG-Fc特异性第二抗体检测与E1结合的来自血清的结合免疫球蛋白。结果表示为OD值。平均值是测试的所有血清样品的OD值的平均值。
 血清 汉逊酵母属 哺乳动物  血清 汉逊酵母属 哺乳动物
 17766   1.218   1.159  55337  1.591  1.416
 17767   1.513   1.363  55348  1.392  1.261
 17777   0.806   0.626  55340  1.202  0.959
 17784   1.592   1.527  55342  1.599  1.477
 17785   1.508   1.439  55345  1.266  1.428
 17794   1.724   1.597  55349  1.329  1.137
 17798   1.132   0.989  55350  1.486  1.422
 17801   1.636   1.504  55352  0.722  1.329
 17805   1.053   0.944  55353  1.065  1.157
 17810   1.134   0.999  55354  1.118  1.092
 17819   1.404   1.24  55355  0.754  0.677
 17820   1.308   1.4  55362  1.43  1.349
 17826   1.163   1.009  55365  1.612  1.608
 17827   1.668   1.652  55368  0.972  0.959
 17849   1.595   1.317  55369  1.506  1.377
 55333   1.217   1.168  平均  1.313  1.245
                        实施例22
 汉逊酵母属产生的HCV E1-H6与痘苗病毒感染的哺乳动物细胞
             产生的HCV E1在免疫原性上等值
如Depla等在WO99/67285中所述比较汉逊酵母属产生的HCVE1-H6的免疫原性以及HCV重组痘苗病毒感染的哺乳动物细胞产生的HCV E1的免疫原性。两种接受测试的HCV E1制备物都由VLP组成,其中用碘乙酰胺烷基化所述HCV E1蛋白。两种VLP制备物都用明矾配制,注射到Balb/c小鼠体内(3次肌内/皮下注射,每次间隔三周,每次注射125μl含0.13% Alhydrogel,Superfos,Denmark的5μg E1)。第三次免疫后十天从小鼠取血。
这些实验的结果显示于图51。在图51的上半部分,测定用哺乳动物细胞产生的E1的VLP免疫后产生的抗体。通过ELISA(见实施例21)测定抗体滴度,其中将哺乳动物细胞产生的E1(“M”)或汉逊酵母属产生的E1(“H”)直接包被到ELISA固体支持物上,然后用酪蛋白封闭所述ELISA板。在图51的下半部分,测定用汉逊酵母属产生的E1的VLP免疫后产生的抗体。通过ELISA(见实施例21)测定抗体滴度,其中将哺乳动物细胞产生的E1(“M”)或汉逊酵母属产生的E1(“H”)直接包被到ELISA固体支持物上,然后用酪蛋白封闭所述ELISA板。
测定的抗体滴度是终点滴度。测定所述终点滴度,表示为导致等于所述测定背景平均值两倍的OD(根据ELISA测定)的血清稀释度。
图51显示:没有观察到两种E1组合物的免疫原性特性之间有显著差异,并且所测定的抗体滴度不依赖于在进行所述终点滴定的ELISA中使用的抗原。
用来自酵母的HCV E1接种后诱导的保护性反应类似于用来自哺乳动物细胞培养物的烷基化HCV E1接种后获得的保护性反应。后一种反应能够在急性感染后预防HCV的慢性发展。
                     实施例23
受到磺化的汉逊酵母属产生的HCV E1-H6的抗原性和免疫原性
                       概况
如Depla等在WO99/67285中所述,比较汉逊酵母属产生的HCVE1-H6与来自HCV慢性携带者的血清的反应性以及由HCV重组痘苗病毒感染的哺乳动物细胞产生的HCV E1的反应性。两种接受测试的HCV-E1制备物都由VLP组成,其中所述汉逊酵母属产生的HCVE1蛋白受到磺化,所述由哺乳动物细胞产生的HCV E1受到烷基化。结果显示于表7。虽然总(平均)反应性是相同的,但对于各个血清观察到一些主要差异。这提示,所述受到磺化的物质至少在一些表位上与受到烷基化的HCV E1不同。
比较受到磺化的汉逊酵母属产生的HCV E1-H6的免疫原性和受到烷基化的汉逊酵母属产生的HCV E1-H6的免疫原性。两种接受测试的HCV-E1都由VLp组成。两种VLP制备物都用明矾配制,注射到Balb/c小鼠体内(3次肌内/皮下注射,每次间隔三周,每次注射125μl含0.13% Alhydrogel,Superfos,Denmark的5μg E1)。第三次免疫后十天从小鼠取血。
如实施例22所述相似地测定抗体滴度。惊人的是,用磺化物质免疫得到更高的抗体滴度,而与在评估这些滴度的ELISA中使用的抗原无关(图51;顶图:针对烷基化E1产生的抗体滴度;底图:针对磺化E1产生的抗体滴度;“A”:包被在ELISA板上的烷基化E1;“S”:包被在ELISA板上的磺化E1)。然而,在本实验中,各个滴度不同程度地依赖于分析中使用的抗体,这证实了用来自HCV患者的血清得到的观察结果。因此,其中以可逆方式修饰半胱氨酸硫醇基团的HCV E1可能更具有免疫原性,因此作为提供抗HCV(慢性感染)保护的疫苗有更高效价。此外,由不可逆封闭诱导对新表位的反应发生的可能性较小。
表7.在一组来自人HCV慢性携带者的血清(“患者血清”)和一组对照血清(“血供体血清”)上评价烷基化E1(在哺乳动物细胞培养物中产生)或磺化E1-H6(在多形汉逊酵母中产生)的抗原性。为此目的,使E1结合到ELISA板上,然后用酪蛋白饱和所述板。加入1/20稀释的人血清,用过氧化物酶标记的兔抗人IgG-Fc特异性第二抗体检测结合的免疫球蛋白。结果表示为OD值。平均值是所有测试的血清样品的OD值的平均值。
                    患者血清                                               血供体血清
 sernr  汉逊酵母属  哺乳动物
 17766177771778517794178011781917827178495533355338553405534555352553555536255369平均值  0.6460.460.741.4460.710.3121.5960.5860.690.4610.1061.4741.0080.4530.3620.240.706  0.3330.4470.4171.4870.9020.5391.5760.9640.5340.2330.0841.2580.6680.4440.7170.4520.691
 sernr  汉逊酵母属  哺乳动物
 F500F504F508F510F511F512F513F527平均值  0.0550.050.050.050.050.0510.0510.0570.052  0.0540.050.0540.0580.0510.0570.0520.0540.054
                     实施例24
汉逊酵母属产生的HCV E1-H6和痘苗病毒感染的哺乳动物细胞
产生的HCV E1与接种后黑猩猩的血清的抗原反应性相同
比较由HCV重组痘苗病毒感染的哺乳动物细胞产生的E1和汉逊酵母属产生的E1-H6(都受到烷基化)与来自接种后黑猩猩的血清和与单克隆抗体的反应性。在此,将所述E1蛋白直接包被到ELISA板上,然后用酪蛋白饱和所述板。使用黑猩猩血清和特异性鼠单克隆抗体测定与包被到所述ELISA板上的E1蛋白结合的抗体的终点滴度,所述黑猩猩血清和特异性鼠单克隆抗体都从用哺乳动物细胞产生的E1免疫后的动物获得。如实施例22所述进行终点滴度测定。使用的鼠单克隆抗体是IGH201(见实施例15)、IGH198(IGH198=Maertens等在WO96/04385中所述的23C12)、IGH203(IGH203=Maertens等在WO96/04385中所述的15G6)和IGH202(IGH202=Maertens等在WO99/50301中所述的3F3)。
如可以从图53推导出来的,当用汉逊酵母属或哺乳动物细胞产生的E1蛋白进行测试时,7只不同黑猩猩的反应性是相同的。抗HCVE1的单克隆抗体的反应性也几乎是相等的。其中两只黑猩猩(Yoran和Marti)参与预防性疫苗研究,能够在攻击时清除急性感染,而对照动物不能清除所述感染。另外五只黑猩猩(Ton、Phil、Marcel、Peggy、Femma)参与治疗性接种研究,在接受HCV E1免疫时,根据对血清中ALT的测量和/或肝活检时的组织学活性系数,显示肝损伤减少。
本实验获得的结果与Mustilli和其合作者(Mustilli,A.C.等1999)的发现明显不同,他们在酿酒酵母和乳酸克鲁维酵母中表达HCV E2蛋白。然而,纯化的酵母产生的E2与哺乳动物(CHO)细胞产生的HCVE2不同,因为使用来自用哺乳动物细胞产生的HCV E2免疫的黑猩猩的血清观察到的反应性较低,而用单克隆抗体的反应性比用所述酵母产生HCV E2的反应性更高。
                实施例25
通过荧光团辅助糖类电泳(FACE)测定HCV E1的糖分布
如Depla等在WO99/67285中所述,比较汉逊酵母属产生的HCVE1与由HCV重组痘苗病毒感染的哺乳动物细胞产生的HCV E1的糖基化分布。通过荧光团辅助糖类电泳(FACE)完成该工作。为此,用肽N-糖苷酶(PNGase F)从哺乳动物细胞或汉逊酵母属产生的E1s释放寡糖,然后用ANTS标记(在PNGase F消化前用碘乙酰胺烷基化所述E1蛋白)。在21%聚丙烯酰胺凝胶,电流15mA,4℃,运行2-3小时,通过PAGE分离ANTS标记的寡糖。从图54中,可以得出结论:在由哺乳动物细胞产生的E1上以及由汉逊酵母属产生的E1-H6上的寡糖的迁移类似于聚合度为7-11个单糖的寡聚麦芽糖的迁移。这指出:汉逊酵母属表达系统惊人地导致没有受到高度糖基化并且糖链长度类似于在哺乳动物细胞产生的E1蛋白上添加的糖链的E1蛋白。
                        实施例26
测序得自酵母属和汉逊酵母属产生的E1s和得自HCV重组痘苗
病毒感染的哺乳动物细胞产生的E1s的N-联寡糖。
用脱糖基化温育缓冲液(50mM Na2HPO4,0.75%Nonidet P-40)稀释PBS,0.5%甜菜碱中从酵母属或汉逊酵母属培养物纯化(见实施例15-16)或来自用HCV重组痘庙病毒感染的RK13细胞培养物(见Maertens等在WO96/04385中所述)纯化的E1s(225μg),直到140μg/mL的终浓度。用浓H3PO4将该溶液的pH调整到pH5.5。在该溶液中加入2U PNGase F(脑膜脓毒性黄杆菌(Flavobacteriummeningosepticum)的肽-N4-(乙酰基-β-葡糖胺基)-天冬酰胺酰胺酶;EC3.5.1.52;从Roche获得),然后将所述样品在37℃温育过夜。温育过夜后,用浓H3PO4将该溶液的pH调整到pH5.5。然后加入4倍体积的丙酮(-20℃),沉淀蛋白和寡糖,将所述混合物在-20℃温育15分钟。样品在4℃下13000rpm离心5分钟。弃去丙酮上清,加入150μl冰冷的60%甲醇后,将沉淀在-20℃温育1小时。收集包含释放出来的寡糖的甲醇上清,通过旋转蒸发干燥(SpeedVac)。
将干燥的E1s多糖和参考寡聚糖(都得自Glyko,Bicester,UK;见图55)Man-9(11个单糖单位)、Man-8(10个单糖单位)、Man-7(9个单糖单位)、Man-6(8个单糖单位)和Man-5(7个单糖单位)溶解于5μL2-氨基苯甲酰胺(2-AB)标记试剂(在30%HOAc/70%DMSO中的±0.35M 2-AB+±1M NaCNBH3),获得5-100μM的最终多糖浓度。然后所述多糖溶液在65℃温育2小时。30分钟后,旋转混合所述样品。缀合后,如下去除多余的2-AB。将所述样品稀释于16μL纯化的水(MilliQ),然后加样到已经抽干(pull dry)的Sephadex G-10柱(直径1cm,高度1.2cm,Amersham Biosciences;与VacElut system,Varian偶联)。
通过对该柱应用2×100-μL纯化水(MilliQ),洗脱所述标记的寡糖。干燥参考糖类(Man-9、Man-8、Man-7和Man-6)的洗脱液,保存在-70℃直到进行HPLC分析。将所述E1s样品的洗脱液和所述Man-9参考多糖分配到4个编号的PCR管内,然后干燥。进行如表8所概述的反应,所有反应在37℃进行过夜,只有管3的反应物在1小时后即终止。所使用的外切糖苷酶(都得自Glyco,Bicester,UK)的最终浓度是:α1-2甘露糖苷酶(斋藤曲霉(Aspergillus saitoi)):2mU/mL;α-甘露糖苷酶(刀豆):50U/mL;和β-甘露糖苷酶(Helix pomatia):4U/mL。
表8.用于测序寡糖的反应混合物的综述。
  管1   管2   管3   管4   管5
  E1s(pmol)   400   400   400   400   400
  α1-2甘露糖苷酶(μL)   -   4   -   -   -
  α甘露糖苷酶(μL)   -   -   5   5   5
  β甘露糖苷酶(μL)   -   -   -   -   4
  温育缓冲液4×(μL)   5   5   5   5   5
  MilliQ H2O(μL)   15   11   10   10   6
图56显示与几丁二糖偶联的由10个甘露糖部分组成的高级寡甘露糖。每个末端甘露糖残基通过α1-3键连接一个非末端甘露糖残基。图56的寡甘露糖完全抗外切糖苷酶α1-2甘露糖苷酶的切割。图56的寡甘露糖与外切糖苷酶α-甘露糖苷酶长期(过夜)温育将导致切割所有α键(α1-2、α1-3、α1-6),但不切割β键。得到的寡糖因此将是4’-β-甘露糖基几丁二糖。可以通过外切糖苷酶β-甘露糖苷酶的作用将所述4’-β-甘露糖基几丁二糖部分转化为甘露糖和几丁二糖。根据供应商(G1yko)的说明书,α-甘露糖苷酶将参考寡糖Man-6(见图55.D)完全转化为4’-β-甘露糖基几丁二糖,而β-甘露糖苷酶将4’-β-甘露糖基几丁二糖转化为甘露糖和几丁二糖据报道也是完全的。
图57显示与几丁二糖偶联的由9个甘露糖部分组成的高级寡甘露糖。在该寡甘露糖中,一个末端甘露糖残基通过α1-2键连接一个非末端甘露糖残基。在外切糖苷酶α1-2甘露糖苷酶的作用下,将去除所述α1-2连接的甘露糖。在α-甘露糖苷酶和β-甘露糖苷酶的随后作用下,将获得针对图56的寡甘露糖所述的反应产物。根据供应商(Glyko)的说明书,α1-2甘露糖苷酶能够以超过90%的效率转化所述参考寡糖Man-9和Man-6成为Man-5(见图55)。
图58显示与几丁二糖偶联的由9个甘露糖部分组成的参考高级寡甘露糖Man-9。在该寡甘露糖中,每个末端甘露糖残基通过α1-2键连接一个非末端甘露糖残基。在外切糖苷酶α1-2甘露糖苷酶的作用下,Man-9将会被转化为Man-5,根据供应商的说明书其效率超过90%。用α-甘露糖苷酶进行的随后消化将转化Man-5成为4’-β-甘露糖基几丁二糖。
在离心式真空蒸发器或冷冻干燥器中干燥如表8所示不同反应管内的内容物,然后保存于-70℃直到进行HPLC分析。在加样到柱子前,将每个样品(E1s和参考)溶解于25μL水,然后加样到与WatersAlliance HPLC工作站偶联的TSK gel-Amide-80(0.46×25cm,TosohBiosep)柱。
在室温下以1.0mL/分钟分离所述寡糖。溶剂A由乙腈中的0.1%乙酸组成,溶剂B由水中的0.2%乙酸-0.2%三乙胺组成。如下分离2-AB标记的寡糖:使用28%B等度洗脱5个柱体积,然后在15个柱体积内线性增加到45%B。
参考寡糖Man-6在53±1分钟洗脱出来,Man-7在59±1分钟洗脱出来,Man-8在67±2分钟洗脱出来,Man-9在70±1分钟洗脱出来;4’-β-甘露糖基几丁二糖在10±1分钟洗脱出来,几丁二糖在6±1分钟洗脱出来(未显示)。以Man-9的反应产物举例:不存在外切糖苷酶的情况下温育过夜(图63中图谱的轨迹1;仅有Man-9)、与α1-2甘露糖苷酶温育过夜后(图63中图谱的轨迹2;Man-5和Man-6的混合物)、与α-甘露糖苷酶温育1小时后或温育过夜后(分别是图63中图谱的轨迹3和4;仅有4’-β-甘露糖基几丁二糖)以及与α-和β-甘露糖苷酶温育过夜后(图63中图谱的轨迹5;仅有几丁二糖)。图63中图谱的轨迹6指示所应用的溶剂梯度。
在没有外切糖苷酶存在下,酵母属产生的E1s的寡糖(用PNGaseF处理后获得)的反应产物主要是在59±1分钟(15%)、67±1分钟(45%)、70±1分钟(25%)和75±1分钟(15%)洗脱出的四种糖类。酵母属产生的E1s中Man(8)-GlcNAc(2)和Man(9)-GlcNAc(2)的总含量是约65%。在与α1-2甘露糖苷酶的反应中,仅仅保留时间为70±1分钟的糖类消失。保留时间为75±1分钟的糖类的强度保持不变,保留时间为67±1分钟的糖类的强度增加。这意味着不是所有的末端甘露糖单位都有α(1-2)构型。与α甘露糖苷酶温育过夜后,所有的糖链都减短到4’-β-甘露糖基几丁二糖部分。这意味着该糖类富含甘露糖,并且除一个以外的所有甘露糖残基都有α构型。与β-甘露糖苷酶温育过夜后,所述4’-β-甘露糖基几丁二糖部分减短为几丁二糖是明显的。得到的图谱在图64中描述,该图谱在与图63的图谱相同的条件下获得。结果在表9中综述。
用由痘苗病毒感染的细胞产生的E1s重复同样实验,惊人地显示完全不同的图。在没有酶的反应中,存在糖类的复杂混合物(见图65和表9)。单糖(9)-GlcNAc(2)和单糖(9)-GlcNAc(2)的总含量是37%。与α1-2甘露糖苷酶反应后,保留时间为70±1和59±1分钟的糖类消失。与α甘露糖苷酶温育过夜后,除所述4’-β-甘露糖基几丁二糖产物外,保留显著量的单糖(6)-GlcNAc(2)。这指示其中一个寡糖分支抗α甘露糖苷酶降解。这可以通过在N-联寡糖的Manα(1-2)末端分支连接1或2个葡萄糖残基来解释。图62描述所述包含葡萄糖的寡糖的推定结构。表10给出包含葡萄糖的寡糖的可能反应产物。因为在α1-2甘露糖苷酶反应后没有保留与Man-7等同的寡糖(即由9个单糖组成的寡糖),因此这些葡萄糖残基最有可能连接到图62给出的寡糖结构的B分支。然而,不能排除图62中所述寡糖的A分支和B分支部分以葡萄糖终结。
与β甘露糖苷酶温育过夜后4’-β-甘露糖基几丁二糖部分减短到几丁二糖是明显的。图65描述得到的图谱,该图谱在与图63-64的图谱相同的条件下获得。
得到的结果在表9中综述。
使用汉逊酵母属产生的E1s重复同样实验,惊人地显示完全不同的图。在没有酶的反应中,主要存在保留时间为67±2分钟和70±1分钟的两种糖类,分别对应于Man-8和Man-9。在汉逊酵母属产生的E1s中Man(8)-GlcNAc(2)和Man(9)-GlcNAc(2)的总含量是约90%。与α1-2甘露糖苷酶反应后,糖类减短为主要是保留时间为45±1分钟的Man-5和保留时间为53±1分钟的Man-6。与α甘露糖苷酶温育过夜后,所有糖链都减短为4’-β-甘露糖基几丁二糖部分。这意味着所述糖类富含甘露糖,并且除一个以外的所有甘露糖残基都是α构型。与β甘露糖苷酶温育过夜后,所述4’-β-甘露糖基几丁二糖部分减短为几丁二糖是明显的。图66描述得到的图谱,该图谱使用与图63-65的图谱所述相同的条件获得。
得到的结果在表9中综述。
表9.消化得自酵母属(“Sc”)和汉逊酵母属(“Hp”)产生的E1s的寡糖以及消化得自HCV重组痘苗病毒感染的哺乳动物细胞(“Vac”)产生的E1s的寡糖得到的寡甘露糖。指示不同寡甘露糖和它们的色谱保留时间(“Rt”,用分钟表示)、给定寡甘露糖占总甘露糖含量的百分率(顶行)以及就图55-62中任一图指示的每种观察到的寡甘露糖的最可能结构。带有末端α1-3甘露糖的寡甘露糖用“°”标识。带有末端葡萄糖的寡甘露糖用“*”标识,例如“来自62*”意味着该结构可以从图62给出的结构衍生出来。“1”是没有外切糖苷酶的“反应”,“2”是与α1-2甘露糖苷酶的反应。保留时间为45±1分钟的寡甘露糖按照推测是与几丁二糖连接的包含5个甘露糖残基的寡甘露糖。保留时间为75±1分钟的寡甘露糖按照推测是与几丁二糖连接的包含10个甘露糖残基的寡甘露糖。
(Man-5)Rt:45±1  Man-6Rt:53±1  Man-7Rt:59±1  Man-8Rt:67±1  Man-9Rt:70±1 (Man-10)Rt:75±1
 Sc 1结构 /  1%55.D  14%55.C  42%59°  23%57°61°  18%56°
 Sc 2结构 17%55.E  /  8%60°  50%59°  6%57°61°  16%56°
 Vac 1结构 3%55.E  32%来自62*&表10  20%55.C  23%来自62*&表10  14%62*&表10  5%62*&表10
 Vac 1结构 74%55.E  2%来自62*&表10  /  20%来自62*&表10  4%62*&表10  /62*&表10
 Hp 1结构 /  2%55.D  7%55.C  54%55.B  36%58  /
 Hp 2结构 80%55.E  20%55.D  /  /  /  /
表10.包含葡萄糖的N-联寡糖在与α1-2甘露糖苷酶或α1-2甘露糖苷酶和α甘露糖苷酶反应后的产物。
Man-相当物  α1-2甘露糖苷酶产物(1)  α甘露糖苷酶产物((1)后)
分支A+2 Glc  Man-10  Man-8  Man-6
分支A+1 Glc  Man-9  Man-7  Man-6
分支A没有Glc  Man-8  Man-5  4’-β-甘露糖基几丁二糖
分支B+2 Glc  Man-10  Man-9  Man-6
分支B+1 Glc  Man-9  Man-8  Man-6
分支B没有Glc  Man-8  Man-5  4’-β-甘露糖基几丁二糖
                        实施例27
              重组HCV E1中N-糖基化位点的占据
根据被占据的N-糖基化位点的量,E1s在SDS-PAGE分析时显示不同的迁移行为。根据该特性,可以估计E1产物中被占据的N-糖基化位点的平均量。为此,纯化的E1产物样品进行SDS-PAGE和考马斯亮蓝染色(图67),然后通过ImageMaster 1D Prime软件包(Pharmacia)进一步分析。简要地说,扫描凝胶上的每个特定蛋白带,估计出现的百分率(特定蛋白带强度相对于不同带总强度的比,其中所有带的总强度是100%)(表11)。应当注意到,每个特定蛋白带代表有相同数目被占据N-糖基化位点的E1s分子。
获得的结果指示:汉逊酵母属产生的E1产物的主要部分(超过90%)被占据的N-糖基化位点比从痘苗表达系统获得的E1s的被占据的N-糖基化位点少一个或多个(如Maertens等在WO96/04385中所述)。假定在来自痘苗病毒的E1产物中所有N-糖基化位点都被占据(在E1位置233-236的序列“NNSS”(SEQ ID NO:73)被认为是一个糖基化位点),那么可以相当可靠地得出结论:汉逊酵母属表达的E1蛋白中被占据N-糖基化位点的平均数目不超过80%总共可利用的N-糖基化位点。
表11.通过SDS-PAGE和考马斯亮蓝染色强度分析,估计从多形汉逊酵母和痘苗病毒/vero表达系统获得的E1蛋白中被占据N-糖基化位点的平均数目。用各蛋白的分子量指示蛋白带。见图67。
烷基化E1s     出现百分率(相对强度)
多形汉逊酵母MW 29MW 25MW 21MW 18MW 14-15痘苗病毒/VeroMW 29     实验19253827未定量100     实验28274222未定量100
                    实施例28
        重组HCV E2中N-糖基化位点的占据
用PNGaseF脱糖基化两百(200)μg由汉逊酵母属产生的E2-H6蛋白。将所述脱糖基化的E2s-H6加样到微型胶(10μg/道)。用胰蛋白酶和endo Asp-N消化蛋白带。通过Maldi-MS(干燥的微滴和薄层方法)测定得到的肽的质量。
可以使用该方法测定N-糖基化的程度:在用酶PNGase F脱糖基化期间,切除完整糖链,同时天冬酰胺(N)水解成为天冬氨酸(D)。这两种氨基酸之间的质量差异是1Da,可以通过质谱测定。此外N水解成为D为Asp-N酶创造新的切割位点。
E2s内的可能糖基化位点是N417、N423、N430、N448、N478、N532、N540、N556、N576、N623和N645(见图68)。Maldi-MS分析显示:这些糖基化位点中每一个的N-糖基化都是不完全的,因为在用PNGase F脱糖基化后,发现肽在糖基化位点不是N就是D(质量差异1 Da)。D残基数目与N残基数目的比指示由汉逊酵母属表达以及在所分析样品中存在的所有E2蛋白的糖链上一个N-糖基化位点的平均占据。这些结果在表12-14中综述。
从这些结果,可以计算出每个糖基化位点约54%受到糖基化。
表12.从包含一个N-糖基化位点的胰蛋白酶肽测定的糖基化百分率。
N-糖基化位点     受到糖基化     未受到糖基化
N430     60%     40%
N448     50%     50%
N556     80%     20%
N576     90%     10%
N623     20%     80%
N645     10%     90%
表13.从包含两个N-糖基化位点的胰蛋白酶肽测定的糖基化百分率。
N-糖基化位点   两个位点都受到糖基化   两个位点之一受到糖基化     没有位点受到糖基化   根据各个N计算
N417    和N423   70%   25%     5%   85%
N532    和N540   0%   80%     20%   40%
表14.在Asp-N消化物中N478的糖基化百分率。
N-糖基化位点     受到糖基化   没有受到糖基化
N478     35%   65%
                  实施例29
血供体血清与酵母属或汉逊酵母属产生的HCV E1的反应性
如实施例15和16所述纯化由酵母属产生的E1s-H6(与α-MF前导序列表达)以及由汉逊酵母属产生的E1s-H6(与CL前导肽表达),并如实施例20所述接受烷基化和形成VLP。将两种蛋白都以0.5μg/mL(1小时,37℃)直接吸收到微量滴定板上,封闭板(PBS-0.1%酪蛋白,1小时,37℃)后,与1/20稀释的来自根据HCV筛选出的供体的血清和来自阴性血供体的血清一起温育(PBS-0.5%酪蛋白,10%(重量体积比)蔗糖,0.2%(体积比)Triton X-705,1小时,37℃)。使用1/50000稀释的偶联过氧化物酶的第二兔抗人IgG-Fc特异性抗血清(Dako,Denmark)(PBS-0.1%酪蛋白,1小时,室温),然后显色,检测最终的结合。在所有步骤之间用PBS-0.05%(重量体积比)Tween-20洗板3次。为进行比较,对于如Depla等在WO99/67285中所述产生和纯化的哺乳动物细胞产生的E1s,以相同方法进行分析。
该ELISA的截断值设为背景(即相同设置、但用链霉抗生物素吸收到孔内时,所有血清的反应性)平均值的2倍。
从表15可以判断:许多(75%)血清对于酵母属产生的E1显示超过截断值的反应性,而只有少数血清(6%)对于汉逊酵母属产生的E1显示超过截断值的某种反应性。这种反应性上的差异被归因于在酵母属产生的E1上存在与α1-2甘露糖连接的末端α1-3甘露糖,如实施例26所证明的。Young和其合作者(1998)已经指出:这种类型甘露糖引起人血清与酵母产生的甘露糖的反应性。为进一步证实酵母属产生的E1上的反应性可以归因于这种类型甘露糖残基,用血供体血清的稀释物针对酵母属产生的E1重复所述ELISA,所述血供体血清已经与添加在稀释缓冲液中的1或5mg/mL甘露聚糖(Sigma)预温育(37℃下1小时)。如根据表16判断,对于除了一个(F556)以外所有接受分析的血清,与甘露糖预温育以依赖于浓度的方式减少该E1与血供体血清的反应性到背景水平。(在没有竞争的情况下,使用5mg甘露聚糖/mL,平均OD被甘露聚糖从0.24降低到0.06)。
表15.汉逊酵母属、酵母属和哺乳动物细胞中产生的E1的反应性。黑色阴影格指示高于截断值的反应性。
   血清nr  汉逊酵母属E1  酵母属E1 哺乳动物E1  空白
    F552   0,18   0,224   0,056  0,05
    F553   0,062   0,449   0,056  0,052
    F555   0,06   0,079   0,054  0,051
    F556   0,073   0,679   0,054  0,051
    F557   0,059   0,173   0,053  0,05
    F558   0,066   0,232   0,06  0,058
    F559   0,084   0,309   0,056  0,053
    F560   0,062   0,338   0,052  0,052
    F562   0,056   0,128   0,053  0,053
    F563   0,064   0,181   0,059  0,056
    F570   0,056   0,135   0,054  0,055
    F571   0,06   0,209   0,054  0,055
    F572   0,061   0,427   0,055  0,056
    F575   0,079   0,104   0,062  0,056
    F576   0,061   0,144   0,058  0,057
    F577   0,063   0,224   0,055  0,058
    F578   0,089   0,131   0,057  0,061
    F581   0,064   0,098   0,061  0,057
    F594   0,055   0,116   0,056  0,057
    F595   0,059   0,539   0,057  0,058
    F598   0,076   0,311   0,056  0,059
    F450   0,205   0,078   0,099  0,059
    F453   0,059   0,128   0,057  0,06
    F456   0,058   0,121   0,056  0,06
    F458   0,055   0,088   0,054  0,054
    F459   0,054   0,069   0,056  0,054
    F463   0,055   0,083   0,054  0,056
    F466   0,086   0,208   0,071  0,094
    F467   0,066   0,344   0,055  0,055
    F469   0,059   0,074   0,057  0,057
    F470   0,074   0,222   0,056  0,056
    F473   0,094   0,807   0,054  0,057
    F479   0,06   0,075   0,06  0,051
    F480   0,053   0,305   0,056  0,053
    F481   0,059   0,395   0,071  0,052
    F488   0,063   0,467   0,059  0,053
   平均值   0,072   0,242   0,058 截断值  0,113
在截断值以上的血清数   2/36   27/36   0/36
在截断值以上的血清百分率   6   75
表16.如表15在酵母属细胞中产生的E1但在5mg甘露聚糖/mL存在下的反应性。黑色阴影格指示在截断值以上的反应性。
 血清nr                                           甘露聚糖浓度
    0mg/mL     1mg/mL     5mg/mL
 F552     0,207     0,128     0,103
 F553     0,487     0,098     0,050
 F555     0,066     0,044     0,041
 F556     0,769     0,540     0,372
 F557     0,158     0,094     0,088
 F558     0,250     0,076     0,046
 F559     0,300     0,077     0,066
 F560     0,356     0,088     0,044
 F562     0,122     0,106     0,089
 F563     0,164     0,091     0,049
 F570     0,110     0,043     0,040
 F571     0,212     0,057     0,042
 F572     0,464     0,087     0,043
 F575     0,095     0,081     0,062
 F576     0,138     0,042     0,043
 F577     0,216     0,042     0,041
 F578     0,125     0,100     0,093
 F581     0,083     0,064     0,042
 F594     0,102     0,044     0,041
 F595     0,520     0,088     0,044
 F598     0,340     0,054     0,042
 F450     0,053     0,060     0,053
 F453     0,116     0,049     0,044
 F456     0,112     0,050     0,043
 F458     0,086     0,051     0,042
 F459     0,054     0,044     0,042
 F463     0,078     0,043     0,041
 F466     0,172     0,111     0,085
 F467     0,420     0,117     0,049
 F469     0,053     0,043     0,041
 F470     0,220     0,070     0,061
 F473     0,924     0,183     0,063
 F479     0,059     0,049     0,043
 F480     0,281     0,155     0,054
 F481     0,355     0,042     0,046
 F488     0,474     0,090     0,046
 平均值     0,243     0,089     0,062
参考文献表
Agaphonov,M.O.,Beburov,M.Y.,Ter Avanesyan,M.D.和Smirnov,V.N.(1995)将外源基因靶向整合如多形汉逊酵母(Hansenula polymorpha)的破碎-置换方法.Yeast 11:1241-1247.
Agaphonov,M.O.,Trushkina,P.M.,Sohn,J.H.,Choi,E.S.,Rhee,S.K.和Ter Avanesyan,M.D.(1999)快速选择在酵母多形汉逊酵母DL1中有不同质粒拷贝数的整合子的载体.Yeast 15:541-551.
Alber,T.和Kawasaki,G.(1982)酿酒酵母(Saccharomyces cerevisiae)丙糖磷酸异构酶基因的核苷酸序列.J.Mol Appl.Genet 1:419-434.
Ammerer,G.(1983)使用ADCI启动子在酵母中表达基因.MethodsEnzymol.101:192-201.
Ballou,L.,Hitzeman,R.A.,Lewis,M.S.和Ballou,C.E.(1991)抗钒酸盐的酵母在蛋白糖基化上有缺陷.Proc.Natl.Acad.Sci.U.S.A 88:3209-3212.
Beekman,N.J.,Schaaper,W.M.,Tesser,G.I.,Dalsgaard,K.,Kamstrup,S.,Langeveld,J.P.,Boshuizen,R.S.和Meloen,R.H.(1997)合成肽疫苗:通过硫酯键棕榈酰化肽抗原以增加免疫原性.J.Pept.Res.50:357-364.
Burns,J.,Butler,J.和Whitesides,G.(1991)通过三(2-羧乙基)膦选择性还原二硫化物.J.Org.Chem.56:2648-2650.
Cox,H.,Mead,D.,Sudbery,P.,Eland,R.M.,Mannazzu,I.,和Evans,L.(2000)使用PMA1启动子在甲基营养酵母多形汉逊酵母中组成型表达重组蛋白.Yeast 16:1191-1203.
Cregg,J.M.(1999)在甲基营养酵母巴斯德毕赤酵母(Pichia pastoris)中的表达.在Gene expression systems:using nature for the art ofexpression,J.M.Fernandez和J.P.Hoeffler编辑(San Diego:AcademicPress),第157-191页.
Darbre,A.(1986)Practical protein chemistry:a handbook.Whiley &Sons Ltd.
Diminsky,D.,Schirmbeck,R.,Reimann,J.,和Barenholz,Y.(1997)来自哺乳动物细胞(CHO)和酵母菌细胞(多形汉逊酵母)的乙型肝炎表面抗原(HBsAg)颗粒之间的比较:组成、结构和免疫原性.Vaccine 15:637-647.
Doms,R.W.,Lamb,R.A.,Rose,J.K.和Helenius,A.(1993)病毒膜蛋白的折叠和组装.Virology 193:545-562.
Elble,R.(1992)一种转化酵母的简单有效方法.Biotechniques 13:18-20.
Fellinger,A.J.,Verbakel,J.M.,Veale,R.A.,Sudbery,P.E.,Bom,I.J.,Overbeeke,N.和Verrips,C.T.(1991)通过多形汉逊酵母从Cyamopsistetragonoloba(瓜尔豆)表达α-半乳糖苷酶.Yeast 7:463-473.
Fournillier,J.A.,Cahour,A.,Escriou,N.,Girad,M.和Wychowski,C.(1996)在哺乳动物细胞中表达的丙型肝炎病毒E1糖蛋白的加工.J.Gen Virol.77(Pt5):1055-1064.
Gailit,J.(1993)恢复合成肽中的游离巯基基团.Anal.Biochem.214:334-335.
Garson,J.A.,Lubach,D.,Passas,J.,Whitby,K.和Grant,P.R.(1999)苏拉明阻断丙型肝炎体外结合人肝细胞瘤细胞.J.Med.Virol.57:238-242.
Gatzke,R.,Weydemann,U.,Janowicz,Z.A.和Hollenberg,C.P.(1995)载体序列稳定多拷贝整合进多形汉逊酵母.Appl.Microbiol.Biotechnol.43:844-849.
Gellissen,G.(2000)在甲基营养酵母中生产异源蛋白.Appl.Microbiol.Biotechnol.54:741-750.
Grakoui,A.,Wychowski,C.,Lin,C.,Feinstone,S.M.和Rice,C.M.(1993)表达和鉴定丙型肝炎病毒多蛋白切割产物.J.Virol.67:1385-1395.
Grinna,L.S.和Tschopp,J.F.(1989)来自甲基营养酵母巴斯德毕赤酵母的N-联寡糖的大小分布和一般结构特征.Yeast 5:107-115.
Heile,J.M.,Fong,Y.L.,Rosa,D.,Berger,K.,Saletti,G.,Campagnoli,S.,Bensi,G.,Capo,S.,Coates,S.,Crawford,K.,Dong,C.,Wininger,M.,Baker,G.,Cousens,L.,Chien,D.,Ng,P.,Archangel,P.,Grandi,G.,Houghton,M.和Abrignani,S.(2000)评价用于疫苗设计的丙型肝炎病毒糖蛋白E2:一种内质网保留的重组蛋白优于分泌型重组蛋白和基因DNA的疫苗候选物.J.Virol.74:6885-6892.
Helenius,A.(1994)N-联寡糖如何影响内质网中的糖蛋白折叠.MolBiol.Cell 5:253-265.
Hermanson,G.T.(1996)Bioconjugate techniques.San Diego:Academic Press.
Herscovics,A.和Orlean,P.(1993)酵母中的糖蛋白合成.FASEB J.7:540-550.
Hijikata,M.,Kato,N.,Ootsuyama,Y.,Nakagawa,M.和Shimotohno,K.(1991)通过体外加工分析对丙型肝炎病毒基因组的推定结构区进行基因作图.Proc.Natl.Acad.Sci.U.S.A 88:5547-5551.
Hitzeman,R.A.,Clarke,L.和Carbon,J.(1980)通过免疫筛选技术分离和特征鉴定酵母3-磷酸甘油激酶基因(PGK).J.Biol.Chem.255:12073-12080.
Hollenberg,C.P.和Gellissen,G.(1997)通过甲基营养酵母生产重组蛋白.Curr.Opin.Biotechnol.8:554-560.
Holmgren,A.(1979)硫氧还蛋白通过二硫苏糖醇和二氢硫辛酰胺催化胰岛素二硫键的还原.J.Biol.Chem.254:9627-9632.
Janowicz,Z.A.,Melber,K.,Merckelbach,A.,Jacobs,E.,Harford,N.,Comberbach,M.和Hollenberg,C.P.(1991)在甲基营养酵母多形汉逊酵母中同时表达乙型肝炎S表面抗原和L表面抗原,并形成混合颗粒.Yeast 7:431-443.
Jayabaskaran,C.,Davison,P.F.和Paulus,H.(1987)携带含二硫键的可切割连接器臂的亲和基质的轻松制备和一些应用.Prep.Biochem.17:121-141.
Jenkins,N.,Parekh,R.B.和James,D.C.(1996)使糖基化正确:对生物工程产业的提示.Nat.Biotechnol.14:975-981.
Julius,D.,Brake,A.,Blair,L.,Kunisawa,R.和Thorner,J.(1984)分离加工酵母前原-α-因子所需的赖氨酸-精氨酸切割内切肽酶的推定结构基因.Cell 37:1075-1089.
Kalef,E.,Walfish,P.G.和Gitler,C.(1993)包含连位二硫醇的蛋白的基于砷的亲和层析:纯化L1210白血病胞质蛋白和重组大鼠c-erb Aβ1T3受体.Anal.Bioche m.212:325-334.
Kalidas,C.,Joshi,L.和Batt,C.(2001)特征鉴定在巴斯德毕赤酵母中表达的β-乳球蛋白的糖基化变异体.Protein Eng 14:201-207.
Kato,N.,Ootsuyama,Y.,Tanaka,T.,Nakagawa,M.,Nakazawa,T.,Muraiso,K.,Ohkoshi,S.,Hijikata,M.和Sbimotohno,K.(1992)丙型肝炎病毒推定的包膜蛋白中显著的序列多样性.Virus Res.22:107-123.
Kawasaki,G.和Fraenkel,D.G.(1982)通过互补克隆酵母糖酵解基因.Biochem.Biophys.Res.Commun.108:1107-1122.
Klebe,R.J.,Harriss,J.V.,Sharp,Z.D.和Douglas,M.G.(1983)聚乙二醇诱导的细菌和酵母基因转化的通用方法.Gene 25:333-341.
Kumar,N.,Kella,D.和Kinsella,J.E.(1985)在没有变性剂存在下控制性切割蛋白中二硫键的方法.J.Biochem.Biophys.Methods 11:251-263.
Kumar,N.,Kella,D.和Kinsella,J.E.(1986)变性剂在亚硫酸盐解蛋白二硫键时的反常效应.Int.J.Peptide Prot.Res.28:586-592.
Maertens,G.和Stuyver,L.(1997)丙型肝炎病毒的基因型和遗传变异.在The molecular medicine of viral hepatitis,T.J.Harrison和A.J.Zuckerman编辑John Wiley & Sons),第183-233页.
Major,M.E.和Feinstone,S.M.(1997)丙型肝炎的分子病毒学.
Hepatology 25:1527-1538.
Miele,R.G.,Nilsen,S.L.,Brito,T.,Bretthauer,R.K.和Castellino,F.J.(1997)巴斯德毕赤酵母表达的重组组织型纤溶酶原激活物kingle 2结构域的糖基化特征.Biotechnol.Appl.Biochem.25(Pt2):151-157.
Meunier,J.C.,Fournillier,A.,Choukhi,A.,Cahour,A.,Cocquerel,L.,Dubuisson,J.和Wychowski,C.(1999)分析丙型肝炎病毒(HCV)糖蛋白E1的糖基化位点以及E1多糖对于HCV糖蛋白复合物形成的影响.J.Gen Virol.80(Pt4):887-896.
Montesino,R.,Garcia,R.,Quintero,O.和Cremata,J.A.(1998)由甲基营养酵母巴斯德毕赤酵母分泌的异源蛋白上N-联寡糖结构的变异.Protein Expr.Purif.14:197-207.
Mustilli,A.C.,Izzo,E.,Houghton,M.和Galeotti,C.L.(1999)比较酿酒酵母和乳酸克鲁维酵母(Kluyveromyces lactis)中丙型肝炎病毒糖蛋白的分泌.Res.Microbiol.150:179-187.
Nagai,K.和Thogersen,H.C.(1984)通过序列特异性蛋白水解大肠杆菌中产生的杂种蛋白,产生β-珠蛋白.Nature 309:810-812.
Nielsen,P.E.(2001)用肽核酸靶向双链DNA.Curr Med Chem 8:545-550.
Okabayashi,K.,Nakagawa,Y.,Hayasuke,N.,Ohi,H.,Miura,M.,Ishida,Y.,Shimizu,M.,Murakami,K.,Hirabayashi,K.,Minamino,H.和.(1991)人血清白蛋白基因在酵母中的分泌型表达.J.Biochem.(Tokyo)110:103-110.
Orum,H.和Wengel,J.(2001)闭锁核酸:一种进行基因功能分析和反义药物发展的有前途的分子家族.Curr Opin.Mol.Ther.3:239-243.
Padgett,K.A.和Sorge,J.A.(1996)在PCR克隆中创造不依赖与限制位点的无缝连接.Gene 168:31-35.
Panchal,T.和Wodzinski,R.J.(1998)比较黑曲霉(Aspergillus niger,A.ficuum)NRRL 3135肌醇六磷酸酶和重组肌醇六磷酸酶的糖基化模式.Prep.Biochem.Biotechnol.28:201-217.
Pedersen,J.,Lauritzen,C.,Madsen,M.T.和Weis,D.S.(1999)使用工程化的氨肽酶从重组蛋白去除多组氨酸标记.Protein Expr.Purif.15:389-400.
Pomroy,N.C.和Deber,C.M.(1998)通过可逆的半胱氨酸PEG酰化溶解疏水肽.Biochem.Biophys.Res.Commun.245:618-621.
Raymond,C.K.(1999)巴斯德毕赤酵母中的重组蛋白表达.在Geneexpression systems:using nature for the art of expression,J.M.Fernandez和J.P.Hoeffler编辑(San Diego:Academic Press),第193-209页.
Rein,A.,Ott,D.E.,Mirro,J.,Arthur,L.O.,Rice,W.和Henderson,L.E.(1996)通过与病毒核壳蛋白中锌指蛋白反应的化合物失活鼠白血病病毒.J.Virol.70:4966-4972.
Roggenkamp,R.,Hansen,H.,Eckart,M.,Janowicz,Z.和Hollenberg,C.P.(1986)通过自主复制和整合载体转化甲基营养酵母多形汉逊酵母.Mol Gen Genet 202:302-308.
Rosa,D.,Campagnoli,S.,Moretto,C.,Guenzi,E.,Cousens,L.,Chin,M.,Dong,C.,Weiner,A.J.,Lau,J.Y.,Choo,Q.L.,Chien,D.,Pileri,P.,Houghton,M.和Abrignani,S.(1996)一种估计抗丙型肝炎病毒中和抗体的定量检测:包膜糖蛋白2结合靶细胞的细胞荧光光度术评价.Proc.Natl.Acad.Sci.U.S.A 93:1759-1763.
Rose,J.K.和Doms,R.W.(1988)从内质网转运蛋白的调节.Annu.Rev.Cell Biol.4:257-288.
Russell,D.W.,Smith,M.,Williamson,V.M.和Young,E.T.(1983)酵母乙醇脱氢酶II基因的核苷酸序列.J.Biol.Chem.258:2674-2682.Russell,P.R.(1983)酵母中mRNA转录起始机制的进化多样性.Nature 301:167-169.
Russell,P.R.(1985)粟酒裂殖酵母(Schizosaccharomyces pombe)丙糖磷酸异构酶的转录起始于与酿酒酵母中起始位置不同的位置.Gene 40:125-130.
Russell,P.R.和Hall,B.D.(1983)来自裂殖酵母粟酒裂殖酵母的乙醇脱氢酶基因的一级结构.J.Biol.Chem.258:143-149.
Sambrook,J.,Fritsch,E.F.和Maniatis,T.(1989)Molecular Cloning:A Laboratory Manual.Cold Spring Harbor Laboratory Press.
Scorer,C.A.,Clare,J.J.,McCombie,W.R.,Romanos,M.A.和Sreekrishna,K.(1994)使用巴斯德毕赤酵母的G418高拷贝数转化子快速筛选高水平外源基因表达.Biotechnology(N.Y.)12:181-184.
Singh,R.和Kats,L.(1995)用硒醇催化二硫化物的还原.Anal.Biochem.232:86-91.
Sohn,J.H.,Choi,E.S.,Kang,H.A.,Rhee,J.S.和Rhee,S.K.(1999)一个端粒相关自主复制序列家族以及它们在多形汉逊酵母靶向重组中的功能.J.Bacteriol.181:1005-1013.
Stuyver,L.,van Arnhem,W.,Wyseur,A.,Hernandez,F.,Delaporte,E.和Maertens,G.(1994)根据包膜1和非结构性5B区的系统发生分析对丙型肝炎病毒进行分类,鉴定五个其它亚型.Proc.Natl.Acad.Sci.U.S.A 91:10134-10138.
Sugrue,R.J.,Cui,T.,Xu,Q.,Fu,J.和Chan,Y.C.(1997)使用大肠杆菌和巴斯德毕赤酵母生产重组登革热病毒E蛋白.J.Virol.Methods69:159-169.
Thakur,M.L.,DeFulvio,J.,Richard,M.D.和Park,C.H.(1991)锝-99m标记的单克隆抗体:评价还原剂.Int.J.Rad.Appl.Instrum.B 18:227-233.
Trimble,R.B.,Atkinson,P.H.,Tschopp,J.F.,Townsend,R.R.和Maley,F.(1991)甲基营养酵母巴斯德毕赤酵母分泌的酵母属SUC2转化酶上的寡糖结构.J.Biol.Chem.266:22807-22817.
Vingerhoeds,M.H.,Haisma,H.J.,Belliot,S.O.,Smit.R.H.,
Crommelin,D.J.和Storm,G.(1996)免疫脂质体用作抗体靶向的酶前体药物治疗(ADEPT)的酶载体(immuno-enzymosomer):优化前体药物的活化能力.Pharm.Res.13:604-610.
Wahlestedt,C.,Salmi,P.,Good,L.,Kela,J.,Johnsson,T.,Hokfelt,T.,Broberger,C.,Forreca,F.,Lai,J.,Ren,K.,Ossipov,M.,Koshkin,A.,Jakobsen,N.,Skouv,J.,Oerum,H.,Jacobsen,M.H.和Wengel,J.(2000)包含闭锁核酸的有效无毒的反义寡核苷酸.Proc Natl Acad SciUSA97:5633-5638.
Weydemann,U.,Keup,P.,Piontek,M.,Strasser,A.W.,Schweden,J.,Gellissen,G.和Janowicz,Z.A.(1995)多形汉逊酵母高水平分泌蛭素——对三种不同前原蛭素的真实加工(authentic processing).Appl.Microbiol.Biotechnol.44:377-385.
Young,M.,Davies,M.J.,Bailey,D.,Gradwell,M.J.,Smestad-Paulsen,B.,Wold,J.K.,Barnes,R.M.R.,Hounsell,E.(1998)特征鉴定来自酿酒酵母抗原性甘露糖的寡糖.Glycoconjugate Journal 15:815-822.
Zauberman,A.,Nussbaum,O.,Ilan,E.,Eren,R.,Ben-Moshe,O.,Arazi,Y.,Berre,S.,Lubin,I.,Shouval,D.,Galun,E.,Reisner,Y.和Dagan,S.(1999)trimera小鼠系统:丙型肝炎感染以及评价治疗剂的小鼠模型.6th International Symposium on hepatitis C and related viruses.Bethesda 1999年6月6-9日.
                   序列表
<110>Innogenetics N.V.
<120>核心糖基化HCV包膜蛋白
<130>135 PCT
<160>98
<170>PatentIn version 3.1
<210>1
<211>18
<212>PRT
<213>鸟溶菌酶信号肽
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>Xaa是Arg、Lys或Val
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>Xaa是Ser、Ala、Val、Arg或Met
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>Xaa是Leu或Phe
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>Xaa是Leu或Ala
<220>
<221>MISC_FEATURE
<222>(6)..(6)
<223>Xaa是Ile、Thr、Phe或Val
<220>
<221>MISC_FEATURE
<222>(7)..(7)
<223>Xaa是Leu、Phe或Ala
<220>
<221>MISC_FEATURE
<222>(8)..(8)
<223>Xaa是Val、Ile、Ala、Leu或Cys
<220>
<221>MISC_FEATURE
<222>(9)..(9)
<223>Xaa是Leu、Phe、Ala或Ile
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>Xaa是Cys、Phe、Ser或Leu
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>Xaa是Phe、Leu、Ser或Pro
<220>
<221>MISC_FEATURE
<222>(12)..(12)
<223>Xaa是Leu、Ala或Met
<220>
<221>MISC_FEATURE
<222>(13)..(13)
<223>Xaa是Pro、Ala或Ile
<220>
<221>MISC_FEATURE
<222>(14)..(14)
<223>Xaa是Leu或Ala
<220>
<221>MISC_FEATURE
<222>(15)..(15)
<223>Xaa是Ala、Val、Ser或Met
<220>
<221>MISC_FEATURE
<222>(16)..(16)
<223>Xaa是Ala、Lys或Ser
<220>
<221>MISC_FEATURE
<222>(17)..(17)
<223>Xaa是Leu、Pro、Gln或Ile
<400>1
Met Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1               5                   10                  15
Xaa Gly
<210>2
<211>135
<212>PRT
<213>丙型肝炎病毒
<400>2
Tyr Glu Val Arg Asn Val Ser Gly Met Tyr His Val Thr Asn Asp Cys
1               5                   10                  15
Ser Asn Ser Ser Ile Val Tyr Glu Ala Ala Asp Met Ile Met His Thr
            20                  25                  30
Pro Gly Cys Val Pro Cys Val Arg Glu Asn Asn Ser Ser Arg Cys Trp
        35                  40                  45
Val Ala Leu Thr Pro Thr Leu Ala Ala Arg Asn Ala Ser Val Pro Thr
    50                  55                  60
Thr Thr Ile Arg Arg His Val Asp Leu Leu Val Gly Ala Ala Ala Phe
65                  70                  75                  80
Cys Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val
                85                  90                  95
Ser Gln Leu Phe Thr Ile Ser Pro Arg Arg His Glu Thr Val Gln Asp
            100                 105                 110
Cys Asn Cys Ser Ile Tyr Pro Gly His Ile Thr Gly His Arg Met Ala
        115                 120                 125
Trp Asp Met Met Met Asn Trp
    130                 135
<210>3
<211>290
<212>PRT
<213>丙型肝炎病毒
<400>3
His Thr Arg Val Ser Gly Gly Ala Ala Ala Ser Asp Thr Arg Gly Leu
1               5                   10                  15
Val Ser Leu Phe Ser Pro Gly Ser Ala Gln Lys Ile Gln Leu Val Asn
            20                  25                  30
Thr Asn Gly Ser Trp His Ile Asn Arg Thr Ala Leu Asn Cys Asn Asp
        35                  40                  45
Ser Leu Gln Thr Gly Phe Phe Ala Ala Leu Phe Tyr Lys His Lys Phe
    50                  55                  60
Asn Ser Ser Gly Cys Pro Glu Arg Leu Ala Ser Cys Arg Ser Ile Asp
65                  70                  75                  80
Lys Phe Ala Gln Gly Trp Gly Pro Leu Thr Tyr Thr Glu Pro Asn Ser
                85                  90                  95
Ser Asp Gln Arg Pro Tyr Cys Trp His Tyr Ala Pro Arg Pro Cys Gly
            100                 105                 110
Ile Val Pro Ala Ser Gln Val Cys Gly Pro Val Tyr Cys Phe Thr Pro
        115                 120                 125
Ser Pro Val Val Val Gly Thr Thr Asp Arg Phe Gly Val Pro Thr Tyr
    130                 135                 140
Asn Trp Gly Ala Asn Asp Ser Asp Val Leu Ile Leu Asn Asn Thr Arg
145                 150                 155                 160
Pro Pro Arg Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Gly Thr Gly
                165                 170                 175
Phe Thr Lys Thr Cys Gly Gly Pro Pro Cys Asn Ile Gly Gly Ala Gly
            180                 185                 190
Asn Asn Thr Leu Thr Cys Pro Thr Asp Cys Phe Arg Lys His Pro Glu
        195                 200                 205
Ala Thr Tyr Ala Arg Cys Gly Ser Gly Pro Trp Leu Thr Pro Arg Cys
    210                 215                 220
Met Val His Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Val Asn
225                 230                 235                 240
Phe Thr Ile Phe Lys Val Arg Met Tyr Val Gly Gly Val Glu His Arg
                245                 250                 255
Phe Glu Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu Glu
            260                 265                 270
Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Ser Thr Thr Glu
        275                 280                 285
Trp Gln
    290
<210>4
<211>141
<212>PRT
<213>丙型肝炎病毒
<400>4
Tyr Glu Val Arg Asn Val Ser Gly Met Tyr His Val Thr Asn Asp Cys
1               5                   10                  15
Ser Asn Ser Ser Ile Val Tyr Glu Ala Ala Asp Met Ile Met His Thr
            20                  25                  30
Pro Gly Cys Val Pro Cys Val Arg Glu Asn Asn Ser Ser Arg Cys Trp
        35                  40                  45
Val Ala Leu Thr Pro Thr Leu Ala Ala Arg Asn Ala Ser Val Pro Thr
    50                  55                  60
Thr Thr Ile Arg Arg His Val Asp Leu Leu Val Gly Ala Ala Ala Phe
65                  70                  75                  80
Cys Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val
                85                  90                  95
Ser Gln Leu Phe Thr Ile Ser Pro Arg Arg His Glu Thr Val Gln Asp
            100                 105                 110
Cys Asn Cys Ser Ile Tyr Pro Gly His Ile Thr Gly His Arg Met Ala
        115                 120                 125
Trp Asp Met Met Met Asn Trp His His His His His His
    130                 135                 140
<210>5
<211>301
<212>PRT
<213>丙型肝炎病毒
<400>5
His Thr Arg Val Ser Gly Gly Ala Ala Ala Ser Asp Thr Arg Gly Leu
1               5                   10                  15
Val Ser Leu Phe Ser Pro Gly Ser Ala Gln Lys Ile Gln Leu Val Asn
            20                  25                  30
Thr Asn Gly Ser Trp His Ile Asn Arg Thr Ala Leu Asn Cys Asn Asp
        35                  40                  45
Ser Leu Gln Thr Gly Phe Phe Ala Ala Leu Phe Tyr Lys His Lys Phe
    50                  55                  60
Asn Ser Ser Gly Cys Pro Glu Arg Leu Ala Ser Cys Arg Ser Ile Asp
65                  70                  75                  80
Lys Phe Ala Gln Gly Trp Gly Pro Leu Thr Tyr Thr Glu Pro Asn Ser
                85                  90                  95
Ser Asp Gln Arg Pro Tyr Cys Trp His Tyr Ala Pro Arg Pro Cys Gly
            100                 105                 110
Ile Val Pro Ala Ser Gln Val Cys Gly Pro Val Tyr Cys Phe Thr Pro
        115                 120                 125
Ser Pro Val Val Val Gly Thr Thr Asp Arg Phe Gly Val Pro Thr Tyr
    130                 135                 140
Asn Trp Gly Ala Asn Asp Ser Asp Val Leu Ile Leu Asn Asn Thr Arg
145                 150                 155                 160
Pro Pro Arg Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Gly Thr Gly
                165                 170                 175
Phe Thr Lys Thr Cys Gly Gly Pro Pro Cys Asn Ile Gly Gly Ala Gly
            180                 185                 190
Asn Asn Thr Leu Thr Cys Pro Thr Asp Cys Phe Arg Lys His Pro Glu
        195                 200                 205
Ala Thr Tyr Ala Arg Cys Gly Ser Gly Pro Trp Leu Thr Pro Arg Cys
    210                 215                 220
Met Val His Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Val Asn
225                 230                 235                 240
Phe Thr Ile Phe Lys Val Arg Met Tyr Val Gly Gly Val Glu His Arg
                245                 250                 255
Phe Glu Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu Glu
            260                 265                 270
Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Ser Thr Thr Glu
        275                 280                 285
Trp Gln Val Ile Glu Gly Arg His His His His His His
    290                 295                 300
<210>6
<211>3448
<212>DNA
<213>载体pGEMTE1sH6
<400>6
aatcactagt gcggccgcct gcaggtcgac catatgggag agctcccaac gcgttggatg     60
catagcttga gtattctata gtgtcaccta aatagcttgg cgtaatcatg gtcatagctg    120
tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata    180
aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca    240
ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc    300
gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg    360
cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta    420
tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc    480
aggaaccgta aaaaggccgc gttgctggcg tttttcgata ggctccgccc ccctgacgag    540
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac    600
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc    660
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt    720
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc    780
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga    840
cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta    900
ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta    960
tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga   1020
tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg   1080
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag   1140
tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc   1200
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact   1260
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt   1320
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta   1380
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta   1440
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc   1500
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat   1560
agtttgcgca acgttgttgg cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt   1620
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg   1680
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca   1740
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta   1800
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata ccgcgcccgg   1860
cgaccgagtt gctcttgccc ggcgtcaata cgggataata gtgtatgaca tagcagaact   1920
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg   1980
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt   2040
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga   2100
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc   2160
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa   2220
caaatagggg ttccgcgcac atttccccga aaagtgccac ctgtatgcgg tgtgaaatac   2280
cgcacagatg cgtaaggaga aaataccgca tcaggcgaaa ttgtaaacgt taatattttg   2340
ttaaaattcg cgttaaatat ttgttaaatc agctcatttt ttaaccaata ggccgaaatc   2400
ggcaaaatcc cttataaatc aaaagaatag accgagatag ggttgagtgt tgttccagtt   2460
tggaacaaga gtccactatt aaagaacgtg gactccaacg tcaaagggcg aaaaaccgtc   2520
tatcagggcg atggcccact acgtgaacca tcacccaaat caagtttttt gcggtcgagg   2580
tgccgtaaag ctctaaatcg gaaccctaaa gggagccccc gatttagagc ttgacgggga   2640
aagccggcga acgtggcgag aaaggaaggg aagaaagcga aaggagcggg cgctagggcg   2700
ctggcaagtg tagcggtcac gctgcgcgta accaccacac ccgccgcgct taatgcgccg   2760
ctacagggcg cgtccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc   2820
gggcctcttc gctattacgc cagctggcga aagggggatg tgctgcaagg cgattaagtt   2880
gggtaacgcc agggttttcc cagtcacgac gttgtaaaac gacggccagt gaattgtaat   2940
acgactcact atagggcgaa ttgggcccga cgtcgcatgc tcccggccgc catggccgcg   3000
ggattccaat gcatatgagg tgcgcaacgt gtccgggatg taccatgtca cgaacgactg   3060
ctccaactca agcattgtgt atgaggcagc ggacatgatc atgcacaccc ccgggtgcgt   3120
gccctgcgtt cgggagaaca actcttcccg ctgctgggta gcgctcaccc ccacgctcgc   3180
agctaggaac gccagcgtcc ccactacgac aatacgacgc cacgtcgatt tgctcgttgg   3240
ggcggctgct ttctgttccg ctatgtacgt gggggatctc tgcggatctg tcttcctcgt   3300
ctcccagctg ttcaccatct cgcctcgccg gcatgagacg gtgcaggact gcaattgctc   3360
aatctatccc ggccacataa caggtcaccg tatggcttgg gatatgatga tgaactggca   3420
ccaccaccat caccattaag gatccaag                                      3448
<210>7
<211>37
<212>DNA
<213>合成探针或引物
<400>7
agttactctt caaggtatga ggtgcgcaac gtgtccg                              37
<210>8
<211>47
<212>DNA
<213>合成探针或引物
<400>8
agttactctt cacagggatc ctccttaatg gtgatggtgg tggtgcc                   47
<210>9
<211>3067
<212>DNA
<213>载体pCHH-Hir
<400>9
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca     60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct    120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat    180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccaagcttgc    240
atgcctgcag gtcgacccta gatctctatt actgcaggta ttcttccggg atttcttcga    300
agtcgccgtc gttgtgagac tgcggacgcg gggtaccttc gccagtaacg cactggttac    360
gttcgccttt agagcccagg atgcatttgt tgccctggcc gcaaacgtta gagccttcgc    420
acaggcacag gttctgaccg gattcagtgc agtcagtgta aacaaccctc ttttccaacg    480
ggtgtgtagt tccattctcc accgctaggg ctgcgctggg ctccattggc gaggttttca    540
aggccgctag gatgcgatcc atgcgtccgt agccttgcgt ggagcgtgcg tgtgcgtgcg    600
ggagtgcgca taggtaggct acggtgatga ttgctagcat ggcgggaata gttttgctat    660
acatgaattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc    720
aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc    780
gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt    840
attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa    900
tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc    960
cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga   1020
gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg   1080
tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg   1140
gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa   1200
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga   1260
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc   1320
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg   1380
gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc   1440
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat   1500
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg   1560
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag   1620
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa   1680
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc   1740
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca   1800
cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc   1860
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc   1920
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg   1980
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta   2040
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag   2100
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga   2160
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc   2220
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa   2280
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa   2340
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc   2400
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt   2460
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc   2520
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac   2580
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca   2640
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg   2700
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag   2760
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt   2820
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat   2880
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc   2940
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt   3000
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag   3060
cggaaga                                                             3067
<210>10
<211>35
<212>DNA
<213>合成探针或引物
<400>10
agttactctt cacctctttt ccaacgggtg tgtag                                35
<210>11
<211>34
<212>DNA
<213>合成探针或引物
<400>11
agtcactctt cactgcaggc atgcaagctt ggcg                                 34
<210>12
<211>6973
<212>DNA
<213>载体pFPMT121
<400>12
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc     60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat    120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt    180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc    240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt    300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccagatc tgaattcccg    360
atgaagcaga gagcgcagga ggcggtattt atagtgccat tcccctctct gagagacccg    420
gatggtagtc gagtgtatcg gagacagctt gatgtagact ccgtgcctgc cggctcctct    480
tattggcgga caccagtgag acaccccgga acttgctgtt tttctgcaaa atccggggtg    540
accagtggga gcctatttgc acacacgagc gggacacccc actctggtga agagtgccaa    600
agtcattctt tttcccgttg cggggcagcc gattgcatgt tttaggaaaa tattaccttt    660
gctacaccct gtcagattta ccctccacac atatatattc cgtcacctcc agggactatt    720
attcgtcgtt gcgccgccag cggaagatat ccagaagctg ttttccgaga gactcggttg    780
gcgcctggta tatttgatgg atgtcgcgct gcctcacgtc ccggtaccca ggaacgcggt    840
gggatctcgg gcccatcgaa gactgtgctc cagactgctc gcccagcagg tgtttcttga    900
tcgccgcctc taaattgtcc gcgcatcgcc ggtaacattt ttccagctcg gagtttgcgt    960
ttagatacag tttctgcgat gccaaaggag cctgcagatt ataacctcgg atgctgtcat   1020
tcagcgcttt taatttgacc tccagatagt tgctgtattt ctgttcccat tggctgctgc   1080
gcagcttcgt ataactcgag ttattgttgc gctctgcctc ggcgtactgg ctcatgatct   1140
ggatcttgtc cgtgtcgctt ttcttcgagt gtttctcgca aacgatgtgc acggcctgca   1200
gtgtccaatc ggagtcgagc tggcgccgaa actggcggat ctgagcctcc acactgccct   1260
gtttctctat ccacggcgga accgcctcct gccgtttcag aatgttgttc aagtggtact   1320
ctgtgcggtc aatgaaggcg ttattgccgg tgaaatcttt gggaagcggt tttcctcggg   1380
gaagattacg aaattccccg cgtcgttgcg cttcctggat ctcgaggaga tcgttctccg   1440
cgtcgaggag atcgttctcc gcgtcgacac cattccttgc ggcggcggtg ctcaacggcc   1500
tcaacctact actgggctgc ttcctaatgc aggagtcgca taagggagag cgtcgacaaa   1560
cccgcgtttg agaacttgct caagcttctg gtaaacgttg tagtactctg aaacaaggcc   1620
ctagcactct gatctgtttc tcttgggtag cggtgagtgg tttattggag ttcactggtt   1680
tcagcacatc tgtcatctag acaatattgt tactaaattt ttttgaacta caattgttcg   1740
taattcatct attattatac atcctcgtca gcaatttctg gcagacggag tttactaacg   1800
tcttgagtat gaggccgaga atccagctct gtggccatac tcagtcttga cagcctgctg   1860
atgtggctgc gttcaacgca ataagcgtgt cctccgactc cgagttgtgc tcgttatcgt   1920
cgttctcatc ctcggaaaaa tcacacgaaa gaacatactc accagtaggc tttctggtcc   1980
ctggggcacg gctgtttctg acgtattccg gcgttgataa tagctcgaaa gtgaacgccg   2040
agtcgcggga gtcgaccgat gcccttgaga gccttcaacc cagtcagctc cttccggtgg   2100
gcgcggggca tgactatcgt cgccgcactt atgactgtct tctttatcat gcaactcgta   2160
ggacaggtgc cggcagcgct ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg   2220
acgatgatcg gcctgtcgct tgcggtattc ggaatcttgc acgccctcgc tcaagccttc   2280
gtcactggtc ccgccaccaa acgtttcggc gagaagcagg ccattatcgc cggcatggcg   2340
gccgacgcgc tgggctacgt cttgctggcg ttcgcgacgc gaggctggat ggccttcccc   2400
attatgattc ttctcgcttc cggcggcatc gggatgcccg cgttgcaggc catgctgtcc   2460
aggcaggtag atgacgacca tcagggacag cttcaaggat cgctcgcggc tcttaccagc   2520
ctaacttcga tcactggacc gctgatcgtc acggcgattt atgccgcctc ggcgagcaca   2580
tggaacgggt tggcatggat tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg   2640
cgtcgcggtg catggagccg ggccacctcg acctgaatgg aagccggcgg cacctcgcta   2700
acggattcac cactccaaga attggagcca atcaattctt gcggagaact gtgaatgcgc   2760
aaaccaaccc ttggcagaac atatccatcg cgtccgccat ctccagcagc cgcacgcggc   2820
gcatcggggg gggggggggg gggggggggc aaacaattca tcattttttt tttattcttt   2880
tttttgattt cggtttcttt gaaatttttt tgattcggta atctccgaac agaaggaaga   2940
acgaaggaag gagcacagac ttagattggt atatatacgc atatgtagtg ttgaagaaac   3000
atgaaattgc ccagtattct taacccaact gcacagaaca aaaacctgca ggaaacgaag   3060
ataaatcatg tcgaaagcta catataagga acgtgctgct actcatccta gtcctgttgc   3120
tgccaagcta tttaatatca tgcacgaaaa gcaaacaaac ttgtgtgctt cattggatgt   3180
tcgtaccacc aaggaattac tggagttagt tgaagcatta ggtcccaaaa tttgtttact   3240
aaaaacacat gtggatatct tgactgattt ttccatggag ggcacagtta agccgctaaa   3300
ggcattatcc gccaagtaca attttttact cttcgaagac agaaaatttg ctgacattgg   3360
taatacagtc aaattgcagt actctgcggg tgtatacaga atagcagaat gggcagacat   3420
tacgaatgca cacggtgtgg tgggcccagg tattgttagc ggtttgaagc aggcggcaga   3480
agaagtaaca aaggaaccta gaggcctttt gatgttagca gaattgtcat gcaagggctc   3540
cctatctact ggagaatata ctaagggtac tgttgacatt gcgaagagcg acaaagattt   3600
tgttatcggc tttattgctc aaagagacat gggtggaaga gatgaaggtt acgattggtt   3660
gattatgaca cccggtgtgg gtttagatga caagggagac gcattgggtc aacagtatag   3720
aaccgtggat gatgtggtct ctacaggatc tgacattatt attgttggaa gaggactatt   3780
tgcaaaggga agggatgcta aggtagaggg tgaacgttac agaaaagcag gctgggaagc   3840
atatttgaga agatgcggcc agcaaaacta aaaaactgta ttataagtaa atgcatgtat   3900
actaaactca caaattagag cttcaattta attatatcag ttattacccg ggaatctcgg   3960
tcgtaatgat ttttataatg acgaaaaaaa aaaaattgga aagaaaagcc cccccccccc   4020
cccccccccc cccccccccc ccgcagcgtt gggtcctggc cacgggtgcg catgatcgtg   4080
ctcctgtcgt tgaggacccg gctaggctgg cggggttgcc ttactggtta gcagaatgaa   4140
tcaccgatac gcgagcgaac gtgaagcgac tgctgctgca aaacgtctgc gacctgagca   4200
acaacatgaa tggtcttcgg tttccgtgtt tcgtaaagtc tggaaacgcg gaagtcagcg   4260
ccctgcacca ttatgttccg gatctgcatc gcaggatgct gctggctacc ctgtggaaca   4320
cctacatctg tattaacgaa gcgctggcat tgaccctgag tgatttttct ctggtcccgc   4380
cgcatccata ccgccagttg tttaccctca caacgttcca gtaaccgggc atgttcatca   4440
tcagtaaccc gtatcgtgag catcctctct cgtttcatcg gtatcattac ccccatgaac   4500
agaaattccc ccttacacgg aggcatcaag tgaccaaaca ggaaaaaacc gcccttaaca   4560
tggcccgctt tatcagaagc cagacattaa cgcttctgga gaaactcaac gagctggacg   4620
cggatgaaca ggcagacatc tgtgaatcgc ttcacgacca cgctgatgag ctttaccgca   4680
gctgcctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga   4740
cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag   4800
cgggtgttgg cgggtgtcgg ggcgcagcca tgacccagtc acgtagcgat agcggagtgt   4860
atactggctt aactatgcgg catcagagca gattgtactg agagtgcacc atatgcggtg   4920
tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt ccgcttcctc   4980
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa   5040
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa   5100
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct   5160
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac   5220
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc   5280
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc   5340
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg   5400
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga   5460
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag   5520
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta   5580
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag   5640
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg   5700
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac   5760
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc   5820
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag   5880
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc   5940
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac   6000
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc   6060
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg   6120
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag   6180
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca tcgtggtgtc   6240
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac   6300
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag   6360
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac   6420
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg   6480
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc   6540
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact   6600
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg   6660
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa   6720
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt   6780
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg   6840
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga   6900
cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc   6960
ctttcgtctt caa                                                      6973
<210>13
<211>7591
<212>DNA
<213>载体pFPMT-CHH-E1H6
<400>13
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc     60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat    120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt    180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc    240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt    300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttaat ggtgatggtg    360
gtggtgccag ttcatcatca tatcccaagc catacggtga cctgttatgt ggccgggata    420
gattgagcaa ttgcagtcct gcaccgtctc atgccggcga ggcgagatgg tgaacagctg    480
ggagacgagg aagacagatc cgcagagatc ccccacgtac atagcggaac agaaagcagc    540
cgccccaacc agcaaatcga cgtggcgtcg tattgtcgta gtggggacgc tggcgttcct    600
agctgcgagc gtgggggtga gcgctaccca gcagcgggaa gagttgttct cccgaacgca    660
gggcacgcac ccgggggtgt gcatgatcat gtccgctgcc tcatacacaa tgcttgagtt    720
ggagcagtcg ttcgtgacat ggtacatccc ggacacgttg cgcacctcat acctcttttc    780
caacgggtgt gtagttccat tctccaccgc tagggctgcg ctgggctcca ttggcgaggt    840
tttcaaggcc gctaggatgc gatccatgcg tccgtagcct tgcgtggagc gtgcgtgtgc    900
gtgcgggagt gcgcataggt aggctacggt gatgattgct agcatggcgg gaatagtttt    960
gctatacatg aattcccgat gaagcagaga gcgcaggagg cggtatttat agtgccattc   1020
ccctctctga gagacccgga tggtagtcga gtgtatcgga gacagcttga tgtagactcc   1080
gtgcctgccg gctcctctta ttggcggaca ccagtgagac accccggaac ttgctgtttt   1140
tctgcaaaat ccggggtgac cagtgggagc ctatttgcac acacgagcgg gacaccccac   1200
tctggtgaag agtgccaaag tcattctttt tcccgttgcg gggcagccga ttgcatgttt   1260
taggaaaata ttacctttgc tacaccctgt cagatttacc ctccacacat atatattccg   1320
tcacctccag ggactattat tcgtcgttgc gccgccagcg gaagatatcc agaagctgtt   1380
ttccgagaga ctcggttggc gcctggtata tttgatggat gtcgcgctgc ctcacgtccc   1440
ggtacccagg aacgcggtgg gatctcgggc ccatcgaaga ctgtgctcca gactgctcgc   1500
ccagcaggtg tttcttgatc gccgcctcta aattgtccgc gcatcgccgg taacattttt   1560
ccagctcgga gtttgcgttt agatacagtt tctgcgatgc caaaggagcc tgcagattat   1620
aacctcggat gctgtcattc agcgctttta atttgacctc cagatagttg ctgtatttct   1680
gttcccattg gctgctgcgc agcttcgtat aactcgagtt attgttgcgc tctgcctcgg   1740
cgtactggct catgatctgg atcttgtccg tgtcgctttt cttcgagtgt ttctcgcaaa   1800
cgatgtgcac ggcctgcagt gtccaatcgg agtcgagctg gcgccgaaac tggcggatct   1860
gagcctccac actgccctgt ttctctatcc acggcggaac cgcctcctgc cgtttcagaa   1920
tgttgttcaa gtggtactct gtgcggtcaa tgaaggcgtt attgccggtg aaatctttgg   1980
gaagcggttt tcctcgggga agattacgaa attccccgcg tcgttgcgct tcctggatct   2040
cgaggagatc gttctccgcg tcgaggagat cgttctccgc gtcgacacca ttccttgcgg   2100
cggcggtgct caacggcctc aacctactac tgggctgctt cctaatgcag gagtcgcata   2160
agggagagcg tcgacaaacc cgcgtttgag aacttgctca agcttctggt aaacgttgta   2220
gtactctgaa acaaggccct agcactctga tctgtttctc ttgggtagcg gtgagtggtt   2280
tattggagtt cactggtttc agcacatctg tcatctagac aatattgtta ctaaattttt   2340
ttgaactaca attgttcgta attcatctat tattatacat cctcgtcagc aatttctggc   2400
agacggagtt tactaacgtc ttgagtatga ggccgagaat ccagctctgt ggccatactc   2460
agtcttgaca gcctgctgat gtggctgcgt tcaacgcaat aagcgtgtcc tccgactccg   2520
agttgtgctc gttatcgtcg ttctcatcct cggaaaaatc acacgaaaga acatactcac   2580
cagtaggctt tctggtccct ggggcacggc tgtttctgac gtattccggc gttgataata   2640
gctcgaaagt gaacgccgag tcgcgggagt cgaccgatgc ccttgagagc cttcaaccca   2700
gtcagctcct tccggtgggc gcggggcatg actatcgtcg ccgcacttat gactgtcttc   2760
tttatcatgc aactcgtagg acaggtgccg gcagcgctct gggtcatttt cggcgaggac   2820
cgctttcgct ggagcgcgac gatgatcggc ctgtcgcttg cggtattcgg aatcttgcac   2880
gccctcgctc aagccttcgt cactggtccc gccaccaaac gtttcggcga gaagcaggcc   2940
attatcgccg gcatggcggc cgacgcgctg ggctacgtct tgctggcgtt cgcgacgcga   3000
ggctggatgg ccttccccat tatgattctt ctcgcttccg gcggcatcgg gatgcccgcg   3060
ttgcaggcca tgctgtccag gcaggtagat gacgaccatc agggacagct tcaaggatcg   3120
ctcgcggctc ttaccagcct aacttcgatc actggaccgc tgatcgtcac ggcgatttat   3180
gccgcctcgg cgagcacatg gaacgggttg gcatggattg taggcgccgc cctatacctt   3240
gtctgcctcc ccgcgttgcg tcgcggtgca tggagccggg ccacctcgac ctgaatggaa   3300
gccggcggca cctcgctaac ggattcacca ctccaagaat tggagccaat caattcttgc   3360
ggagaactgt gaatgcgcaa accaaccctt ggcagaacat atccatcgcg tccgccatct   3420
ccagcagccg cacgcggcgc atcggggggg gggggggggg gggggggcaa acaattcatc   3480
attttttttt tattcttttt tttgatttcg gtttctttga aatttttttg attcggtaat   3540
ctccgaacag aaggaagaac gaaggaagga gcacagactt agattggtat atatacgcat   3600
atgtagtgtt gaagaaacat gaaattgccc agtattctta acccaactgc acagaacaaa   3660
aacctgcagg aaacgaagat aaatcatgtc gaaagctaca tataaggaac gtgctgctac   3720
tcatcctagt cctgttgctg ccaagctatt taatatcatg cacgaaaagc aaacaaactt   3780
gtgtgcttca ttggatgttc gtaccaccaa ggaattactg gagttagttg aagcattagg   3840
tcccaaaatt tgtttactaa aaacacatgt ggatatcttg actgattttt ccatggaggg   3900
cacagttaag ccgctaaagg cattatccgc caagtacaat tttttactct tcgaagacag   3960
aaaatttgct gacattggta atacagtcaa attgcagtac tctgcgggtg tatacagaat   4020
agcagaatgg gcagacatta cgaatgcaca cggtgtggtg ggcccaggta ttgttagcgg   4080
tttgaagcag gcggcagaag aagtaacaaa ggaacctaga ggccttttga tgttagcaga   4140
attgtcatgc aagggctccc tatctactgg agaatatact aagggtactg ttgacattgc   4200
gaagagcgac aaagattttg ttatcggctt tattgctcaa agagacatgg gtggaagaga   4260
tgaaggttac gattggttga ttatgacacc cggtgtgggt ttagatgaca agggagacgc   4320
attgggtcaa cagtatagaa ccgtggatga tgtggtctct acaggatctg acattattat   4380
tgttggaaga ggactatttg caaagggaag ggatgctaag gtagagggtg aacgttacag   4440
aaaagcaggc tgggaagcat atttgagaag atgcggccag caaaactaaa aaactgtatt   4500
ataagtaaat gcatgtatac taaactcaca aattagagct tcaatttaat tatatcagtt   4560
attacccggg aatctcggtc gtaatgattt ttataatgac gaaaaaaaaa aaattggaaa   4620
gaaaagcccc cccccccccc cccccccccc cccccccccc gcagcgttgg gtcctggcca   4680
cgggtgcgca tgatcgtgct cctgtcgttg aggacccggc taggctggcg gggttgcctt   4740
actggttagc agaatgaatc accgatacgc gagcgaacgt gaagcgactg ctgctgcaaa   4800
acgtctgcga cctgagcaac aacatgaatg gtcttcggtt tccgtgtttc gtaaagtctg   4860
gaaacgcgga agtcagcgcc ctgcaccatt atgttccgga tctgcatcgc aggatgctgc   4920
tggctaccct gtggaacacc tacatctgta ttaacgaagc gctggcattg accctgagtg   4980
atttttctct ggtcccgccg catccatacc gccagttgtt taccctcaca acgttccagt   5040
aaccgggcat gttcatcatc agtaacccgt atcgtgagca tcctctctcg tttcatcggt   5100
atcattaccc ccatgaacag aaattccccc ttacacggag gcatcaagtg accaaacagg   5160
aaaaaaccgc ccttaacatg gcccgcttta tcagaagcca gacattaacg cttctggaga   5220
aactcaacga gctggacgcg gatgaacagg cagacatctg tgaatcgctt cacgaccacg   5280
ctgatgagct ttaccgcagc tgcctcgcgc gtttcggtga tgacggtgaa aacctctgac   5340
acatgcagct cccggagacg gtcacagctt gtctgtaagc ggatgccggg agcagacaag   5400
cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg cgcagccatg acccagtcac   5460
gtagcgatag cggagtgtat actggcttaa ctatgcggca tcagagcaga ttgtactgag   5520
agtgcaccat atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag   5580
gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc   5640
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg   5700
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct   5760
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca   5820
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct   5880
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc   5940
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt   6000
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc   6060
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc   6120
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg   6180
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc   6240
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag   6300
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga   6360
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat   6420
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag   6480
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat   6540
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc   6600
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat   6660
accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag   6720
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg   6780
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc   6840
tgcaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca   6900
acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg   6960
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc   7020
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta   7080
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc   7140
aacacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg   7200
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc   7260
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc   7320
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat   7380
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag   7440
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc   7500
ccgaaaagtg ccacctgacg tctaagaaac cattattatc atgacattaa cctataaaaa   7560
taggcgtatc acgaggccct ttcgtcttca a                                  7591
<210>14
<211>50
<212>DNA
<213>合成探针或引物
<400>14
aggggtaagc ttggataaaa ggtatgaggt gcgcaacgtg tccgggatgt                50
<210>15
<211>42
<212>DNA
<213>合成探针或引物
<400>15
agttacggat ccttaatggt gatggtggtg gtgccagttc at                        42
<210>16
<211>7648
<212>DNA
<213>载体pFPMT-Mfa1fa-E1-H6
<400>16
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc     60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat    120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt    180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc    240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt    300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttaat ggtgatggtg    360
gtggtgccag ttcatcatca tatcccaagc catacggtga cctgttatgt ggccgggata    420
gattgagcaa ttgcagtcct gcaccgtctc atgccggcga ggcgagatgg tgaacagctg    480
ggagacgagg aagacagatc cgcagagatc ccccacgtac atagcggaac agaaagcagc    540
cgccccaacg agcaaatcga cgtggcgtcg tattgtcgta gtggggacgc tggcgttcct    600
agctgcgagc gtgggggtga gcgctaccca gcagcgggaa gagttgttct cccgaacgca    660
gggcacgcac ccgggggtgt gcatgatcat gtccgctgcc tcatacacaa tgcttgagtt    720
ggagcagtcg ttcgtgacat ggtacatccc ggacacgttg cgcacctcat accttttatc    780
caagcttacc ccttcttctt tagcagcaat gctggcaata gtagtattta taaacaataa    840
cccgttattt gtgctgttgg aaaatggcaa aacagcaaca tcgaaatccc cttctaaatc    900
tgagtaaccg atgacagctt cagccggaat ttgtgccgtt tcatcttctg ttgtagtgtt    960
gactggagca gctaatgcgg aggatgctgc gaataaaact gcagtaaaaa ttgaaggaaa   1020
tctcatgaat tcccgatgaa gcagagagcg caggaggcgg tatttatagt gccattcccc   1080
tctctgagag acccggatgg tagtcgagtg tatcggagac agcttgatgt agactccgtg   1140
cctgccggct cctcttattg gcggacacca gtgagacacc ccggaacttg ctgtttttct   1200
gcaaaatccg gggtgaccag tgggagccta tttgcacaca cgagcgggac accccactct   1260
ggtgaagagt gccaaagtca ttctttttcc cgttgcgggg cagccgattg catgttttag   1320
gaaaatatta cctttgctac accctgtcag atttaccctc cacacatata tattccgtca   1380
cctccaggga ctattattcg tcgttgcgcc gccagcggaa gatatccaga agctgttttc   1440
cgagagactc ggttggcgcc tggtatattt gatggatgtc gcgctgcctc acgtcccggt   1500
acccaggaac gcggtgggat ctcgggccca tcgaagactg tgctccagac tgctcgccca   1560
gcaggtgttt cttgatcgcc gcctctaaat tgtccgcgca tcgccggtaa catttttcca   1620
gctcggagtt tgcgtttaga tacagtttct gcgatgccaa aggagcctgc agattataac   1680
ctcggatgct gtcattcagc gcttttaatt tgacctccag atagttgctg tatttctgtt   1740
cccattggct gctgcgcagc ttcgtataac tcgagttatt gttgcgctct gcctcggcgt   1800
actggctcat gatctggatc ttgtccgtgt cgcttttctt cgagtgtttc tcgcaaacga   1860
tgtgcacggc ctgcagtgtc caatcggagt cgagctggcg ccgaaactgg cggatctgag   1920
cctccacact gccctgtttc tctatccacg gcggaaccgc ctcctgccgt ttcagaatgt   1980
tgttcaagtg gtactctgtg cggtcaatga aggcgttatt gccggtgaaa tctttgggaa   2040
gcggttttcc tcggggaaga ttacgaaatt ccccgcgtcg ttgcgcttcc tggatctcga   2100
ggagatcgtt ctccgcgtcg aggagatcgt tctccgcgtc gacaccattc cttgcggcgg   2160
cggtgctcaa cggcctcaac ctactactgg gctgcttcct aatgcaggag tcgcataagg   2220
gagagcgtcg acaaacccgc gtttgagaac ttgctcaagc ttctggtaaa cgttgtagta   2280
ctctgaaaca aggccctagc actctgatct gtttctcttg ggtagcggtg agtggtttat   2340
tggagttcac tggtttcagc acatctgtca tctagacaat attgttacta aatttttttg   2400
aactacaatt gttcgtaatt catctattat tatacatcct cgtcagcaat ttctggcaga   2460
cggagtttac taacgtcttg agtatgaggc cgagaatcca gctctgtggc catactcagt   2520
cttgacagcc tgctgatgtg gctgcgttca acgcaataag cgtgtcctcc gactccgagt   2580
tgtgctcgtt atcgtcgttc tcatcctcgg aaaaatcaca cgaaagaaca tactcaccag   2640
taggctttct ggtccctggg gcacggctgt ttctgacgta ttccggcgtt gataatagct   2700
cgaaagtgaa cgccgagtcg cgggagtcga ccgatgccct tgagagcctt caacccagtc   2760
agctccttcc ggtgggcgcg gggcatgact atcgtcgccg cacttatgac tgtcttcttt   2820
atcatgcaac tcgtaggaca ggtgccggca gcgctctggg tcattttcgg cgaggaccgc   2880
tttcgctgga gcgcgacgat gatcggcctg tcgcttgcgg tattcggaat cttgcacgcc   2940
ctcgctcaag ccttcgtcac tggtcccgcc accaaacgtt tcggcgagaa gcaggccatt   3000
atcgccggca tggcggccga cgcgctgggc tacgtcttgc tggcgttcgc gacgcgaggc   3060
tggatggcct tccccattat gattcttctc gcttccggcg gcatcgggat gcccgcgttg   3120
caggccatgc tgtccaggca ggtagatgac gaccatcagg gacagcttca aggatcgctc   3180
gcggctctta ccagcctaac ttcgatcact ggaccgctga tcgtcacggc gatttatgcc   3240
gcctcggcga gcacatggaa cgggttggca tggattgtag gcgccgccct ataccttgtc   3300
tgcctccccg cgttgcgtcg cggtgcatgg agccgggcca cctcgacctg aatggaagcc   3360
ggcggcacct cgctaacgga ttcaccactc caagaattgg agccaatcaa ttcttgcgga   3420
gaactgtgaa tgcgcaaacc aacccttggc agaacatatc catcgcgtcc gccatctcca   3480
gcagccgcac gcggcgcatc gggggggggg gggggggggg ggggcaaaca attcatcatt   3540
ttttttttat tctttttttt gatttcggtt tctttgaaat ttttttgatt cggtaatctc   3600
cgaacagaag gaagaacgaa ggaaggagca cagacttaga ttggtatata tacgcatatg   3660
tagtgttgaa gaaacatgaa attgcccagt attcttaacc caactgcaca gaacaaaaac   3720
ctgcaggaaa cgaagataaa tcatgtcgaa agctacatat aaggaacgtg ctgctactca   3780
tcctagtcct gttgctgcca agctatttaa tatcatgcac gaaaagcaaa caaacttgtg   3840
tgcttcattg gatgttcgta ccaccaagga attactggag ttagttgaag cattaggtcc   3900
caaaatttgt ttactaaaaa cacatgtgga tatcttgact gatttttcca tggagggcac   3960
agttaagccg ctaaaggcat tatccgccaa gtacaatttt ttactcttcg aagacagaaa   4020
atttgctgac attggtaata cagtcaaatt gcagtactct gcgggtgtat acagaatagc   4080
agaatgggca gacattacga atgcacacgg tgtggtgggc ccaggtattg ttagcggttt   4140
gaagcaggcg gcagaagaag taacaaagga acctagaggc cttttgatgt tagcagaatt   4200
gtcatgcaag ggctccctat ctactggaga atatactaag ggtactgttg acattgcgaa   4260
gagcgacaaa gattttgtta tcggctttat tgctcaaaga gacatgggtg gaagagatga   4320
aggttacgat tggttgatta tgacacccgg tgtgggttta gatgacaagg gagacgcatt   4380
gggtcaacag tatagaaccg tggatgatgt ggtctctaca ggatctgaca ttattattgt   4440
tggaagagga ctatttgcaa agggaaggga tgctaaggta gagggtgaac gttacagaaa   4500
agcaggctgg gaagcatatt tgagaagatg cggccagcaa aactaaaaaa ctgtattata   4560
agtaaatgca tgtatactaa actcacaaat tagagcttca atttaattat atcagttatt   4620
acccgggaat ctcggtcgta atgattttta taatgacgaa aaaaaaaaaa ttggaaagaa   4680
aagccccccc cccccccccc cccccccccc cccccccgca gcgttgggtc ctggccacgg   4740
gtgcgcatga tcgtgctcct gtcgttgagg acccggctag gctggcgggg ttgccttact   4800
ggttagcaga atgaatcacc gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg   4860
tctgcgacct gagcaacaac atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa   4920
acgcggaagt cagcgccctg caccattatg ttccggatct gcatcgcagg atgctgctgg   4980
ctaccctgtg gaacacctac atctgtatta acgaagcgct ggcattgacc ctgagtgatt   5040
tttctctggt cccgccgcat ccataccgcc agttgtttac cctcacaacg ttccagtaac   5100
cgggcatgtt catcatcagt aacccgtatc gtgagcatcc tctctcgttt catcggtatc   5160
attaccccca tgaacagaaa ttccccctta cacggaggca tcaagtgacc aaacaggaaa   5220
aaaccgccct taacatggcc cgctttatca gaagccagac attaacgctt ctggagaaac   5280
tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcac gaccacgctg   5340
atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca   5400
tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc   5460
gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc cagtcacgta   5520
gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg tactgagagt   5580
gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg   5640
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt   5700
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa   5760
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc   5820
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag   5880
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt   5940
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg   6000
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg   6060
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg   6120
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac   6180
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg   6240
gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt   6300
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg   6360
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc   6420
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt   6480
ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt   6540
taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag   6600
tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt   6660
cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc   6720
gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc   6780
cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg   6840
ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctgc   6900
aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg   6960
atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc   7020
tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact   7080
gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc   7140
aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaac   7200
acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc   7260
ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac   7320
tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa   7380
aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact   7440
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg   7500
atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg   7560
aaaagtgcca cctgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag   7620
gcgtatcacg aggccctttc gtcttcaa                                      7648
<210>17
<211>4453
<212>DNA
<213>载体pUC18-FMD-MFa1fa-E1-H6
<220>
<221>misc_feature
<222>(1207)..(1208)
<223>N是任何核苷酸
<220>
<221>misc_feature
<222>(1386)..(1387)
<223>N是任何核苷酸
<400>17
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca     60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct    120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat    180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg aattcgagct    240
cggtacccgg ggatccttaa tggtgatggt ggtggtgcca gttcatcatc atatcccaag    300
ccatacggtg acctgttatg tggccgggat agattgagca attgcagtcc tgcaccgtct    360
catgccggcg aggcgagatg gtgaacagct gggagacgag gaagacagat ccgcagagat    420
cccccacgta catagcggaa cagaaagcag ccgccccaac gagcaaatcg acgtggcgtc    480
gtattgtcgt agtggggacg ctggcgttcc tagctgcgag cgtgggggtg agcgctaccc    540
agcagcggga agagttgttc tcccgaacgc agggcacgca cccgggggtg tgcatgatca    600
tgtccgctgc ctcatacaca atgcttgagt tggagcagtc gttcgtgaca tggtacatcc    660
cggacacgtt gcgcacctca taccttttat ccaagcttac cccttcttct ttagcagcaa    720
tgctggcaat agtagtattt ataaacaata acccgttatt tgtgctgttg gaaaatggca    780
aaacagcaac atcgaaatcc ccttctaaat ctgagtaacc gatgacagct tcagccggaa    840
tttgtgccgt ttcatcttct gttgtagtgt tgactggagc agctaatgcg gaggatgctg    900
cgaataaaac tgcagtaaaa attgaaggaa atctcatgaa ttcccgatga aggcagagag    960
cgcaaggagg cggtatttat agtgccattc ccctctctga gagacccgga tggtagtcga   1020
gtgttatcgg agacagcttg atgtagactc cgtgcctgcc ggtcctctta ttggcggaca   1080
ccagtgagac accccggaac ttgctgtttt tctgcaaaat ccggggtgac cagtgggagc   1140
ctatttgcac acacgagcgg gacaccccac tctggtgaag agtgccaaag tcattctttt   1200
tcccgtnncg gggcagccga ttgcatgttt taggaaaata ttacctttgc tacaccctgt   1260
cagatttacc ctccacacat atatattccg tcacctccag ggactattct tggctcgttg   1320
cgccgccgcg gaagatatcc agaagctgtg ttttccgaga gactcggttg gcgcctggta   1380
tatttnnagg atgtcgcgct gcctcacgtc ccggtaccca ggaacgcggt gggatctcgg   1440
gcccatcgaa gactgtgctc cagactgctc gcccagcagg tgtttcttga ttgccgcctc   1500
taaatagtcc gcgcatcgcc ggtaacattt ttccagctcg gagtttgcgt ttagatacat   1560
ttctgcgatg ccaaaggagc ctgcagatta taacctcgga tgctgtcatt cagcgctttt   1620
aatttgacct ccagatagtt gctgtatttc tgttccattg gctgctggac gttcgtataa   1680
ctcgagttat tgttgcgctc tgcctcggcg tactggctca tgactgactg cggtcgcttc   1740
tcgagtgttc tcgcaacagg acgcctgcag gtcatcgagt cgagctggcg ccgaaactgg   1800
cggatctgac ctccacactg ccctgtatct ctatccaccg ggaaccgcct cctgccgttc   1860
cagaatgttg ttcaagtggt agctctgtgc ggtcaatgaa ggcgttattg ccggtgaaat   1920
ctttgggaag cggtttatcc tcggggaaga ttacgaaatt cccgcgcgtc gttgcgcttc   1980
ctggatctcg aggaagatcg ttctccgcgt cgaggagatc gttctccgcg tcgacctgca   2040
ggcatgcaag cttggcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg   2100
ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag   2160
aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga   2220
tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca   2280
gtacaatctg ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg   2340
acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct   2400
ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg   2460
gcctcgtgat acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt   2520
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac   2580
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa   2640
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat   2700
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc   2760
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga   2820
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg   2880
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc   2940
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag   3000
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc   3060
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg   3120
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg   3180
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac   3240
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac   3300
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg   3360
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg   3420
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg   3480
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac   3540
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg   3600
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg   3660
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc   3720
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc   3780
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt   3840
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc   3900
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact   3960
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac   4020
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag   4080
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg   4140
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg   4200
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga   4260
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt   4320
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct   4380
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg   4440
aggaagcgga aga                                                      4453
<210>18
<211>51
<212>DNA
<213>合成探针或引物
<400>18
tgcttcctac cactagcagc actaggatat gaggtgcgca acgtgtccgg g              51
<210>19
<211>52
<212>DNA
<213>合成探针或引物
<400>19
tagtactagt attagtaggc ttcgcatgaa ttcccgatga aggcagagag cg             52
<210>20
<211>4252
<212>DNA
<213>载体pUC18-FMD-CL-E1-H6
<220>
<221>misc_feature
<222>(1006)..(1007)
<223>N是任何核苷酸
<220>
<221>misc_feature
<222>(1185)..(1186)
<223>N是任何核苷酸
<400>20
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca     60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct    120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat    180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg aattcgagct    240
cggtacccgg ggatccttaa tggtgatggt ggtggtgcca gttcatcatc atatcccaag    300
ccatacggtg acctgttatg tggccgggat agattgagca attgcagtcc tgcaccgtct    360
catgccggcg aggcgagatg gtgaacagct gggagacgag gaagacagat ccgcagagat    420
cccccacgta catagcggaa cagaaagcag ccgccccaac gagcaaatcg acgtggcgtc    480
gtattgtcgt agtggggacg ctggcgttcc tagctgcgag cgtgggggtg agcgctaccc    540
agcagcggga agagttgttc tcccgaacgc agggcacgca cccgggggtg tgcatgatca    600
tgtccgctgc ctcatacaca atgcttgagt tggagcagtc gttcgtgaca tggtacatcc    660
cggacacgtt gcgcacctca tatcctagtg ctgctagtgg taggaagcat agtactagta    720
ttagtaggct tcgcatgaat tcccgatgaa ggcagagagc gcaaggaggc ggtatttata    780
gtgccattcc cctctctgag agacccggat ggtagtcgag tgttatcgga gacagcttga    840
tgtagactcc gtgcctgccg gtcctcttat tggcggacac cagtgagaca ccccggaact    900
tgctgttttt ctgcaaaatc cggggtgacc agtgggagcc tatttgcaca cacgagcggg    960
acaccccact ctggtgaaga gtgccaaagt cattcttttt cccgtnncgg ggcagccgat   1020
tgcatgtttt aggaaaatat tacctttgct acaccctgtc agatttaccc tccacacata   1080
tatattccgt cacctccagg gactattctt ggctcgttgc gccgccgcgg aagatatcca   1140
gaagctgtgt tttccgagag actcggttgg cgcctggtat atttnnagga tgtcgcgctg   1200
cctcacgtcc cggtacccag gaacgcggtg ggatctcggg cccatcgaag actgtgctcc   1260
agactgctcg cccagcaggt gtttcttgat tgccgcctct aaatagtccg cgcatcgccg   1320
gtaacatttt tccagctcgg agtttgcgtt tagatacatt tctgcgatgc caaaggagcc   1380
tgcagattat aacctcggat gctgtcattc agcgctttta atttgacctc cagatagttg   1440
ctgtatttct gttccattgg ctgctggacg ttcgtataac tcgagttatt gttgcgctct   1500
gcctcggcgt actggctcat gactgactgc ggtcgcttct cgagtgttct cgcaacagga   1560
cgcctgcagg tcatcgagtc gagctggcgc cgaaactggc ggatctgacc tccacactgc   1620
cctgtatctc tatccaccgg gaaccgcctc ctgccgttcc agaatgttgt tcaagtggta   1680
gctctgtgcg gtcaatgaag gcgttattgc cggtgaaatc tttgggaagc ggtttatcct   1740
cggggaagat tacgaaattc ccgcgcgtcg ttgcgcttcc tggatctcga ggaagatcgt   1800
tctccgcgtc gaggagatcg ttctccgcgt cgacctgcag gcatgcaagc ttggcactgg   1860
ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg   1920
cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt   1980
cccaacagtt gcgcagcctg aatggcgaat ggcgcctgat gcggtatttt ctccttacgc   2040
atctgtgcgg tatttcacac cgcatatggt gcactctcag tacaatctgc tctgatgccg   2100
catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc   2160
tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga   2220
ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt   2280
tataggttaa tgtcatgata ataatggttt cttagacgtc aggtggcact tttcggggaa   2340
atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca   2400
tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc   2460
aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc   2520
acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt   2580
acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt   2640
ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg   2700
ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact   2760
caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg   2820
ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga   2880
aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg   2940
aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa   3000
tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac   3060
aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc   3120
cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca   3180
ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga   3240
gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta   3300
agcattggta actgtcagac caagtttact catatatact ttagattgat ttaaaacttc   3360
atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc   3420
cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt   3480
cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac   3540
cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct   3600
tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact   3660
tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg   3720
ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata   3780
aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga   3840
cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag   3900
ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg   3960
agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac   4020
ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca   4080
acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg   4140
cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc   4200
gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa ga           4252
<210>21
<211>7447
<212>DNA
<213>载体pFPMT-CL-E1-H6
<400>21
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc     60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat    120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt    180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc    240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt    300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttaat ggtgatggtg    360
gtggtgccag ttcatcatca tatcccaagc catacggtga cctgttatgt ggccgggata    420
gattgagcaa ttgcagtcct gcaccgtctc atgccggcga ggcgagatgg tgaacagctg    480
ggagacgagg aagacagatc cgcagagatc ccccacgtac atagcggaac agaaagcagc    540
cgccccaacg agcaaatcga cgtggcgtcg tattgtcgta gtggggacgc tggcgttcct    600
agctgcgagc gtgggggtga gcgctaccca gcagcgggaa gagttgttct cccgaacgca    660
gggcacgcac ccgggggtgt gcatgatcat gtccgctgcc tcatacacaa tgcttgagtt    720
ggagcagtcg ttcgtgacat ggtacatccc ggacacgttg cgcacctcat atcctagtgc    780
tgctagtggt aggaagcata gtactagtat tagtaggctt cgcatgaatt cccgatgaag    840
cagagagcgc aggaggcggt atttatagtg ccattcccct ctctgagaga cccggatggt    900
agtcgagtgt atcggagaca gcttgatgta gactccgtgc ctgccggctc ctcttattgg    960
cggacaccag tgagacaccc cggaacttgc tgtttttctg caaaatccgg ggtgaccagt   1020
gggagcctat ttgcacacac gagcgggaca ccccactctg gtgaagagtg ccaaagtcat   1080
tctttttccc gttgcggggc agccgattgc atgttttagg aaaatattac ctttgctaca   1140
ccctgtcaga tttaccctcc acacatatat attccgtcac ctccagggac tattattcgt   1200
cgttgcgccg ccagcggaag atatccagaa gctgttttcc gagagactcg gttggcgcct   1260
ggtatatttg atggatgtcg cgctgcctca cgtcccggta cccaggaacg cggtgggatc   1320
tcgggcccat cgaagactgt gctccagact gctcgcccag caggtgtttc ttgatcgccg   1380
cctctaaatt gtccgcgcat cgccggtaac atttttccag ctcggagttt gcgtttagat   1440
acagtttctg cgatgccaaa ggagcctgca gattataacc tcggatgctg tcattcagcg   1500
cttttaattt gacctccaga tagttgctgt atttctgttc ccattggctg ctgcgcagct   1560
tcgtataact cgagttattg ttgcgctctg cctcggcgta ctggctcatg atctggatct   1620
tgtccgtgtc gcttttcttc gagtgtttct cgcaaacgat gtgcacggcc tgcagtgtcc   1680
aatcggagtc gagctggcgc cgaaactggc ggatctgagc ctccacactg ccctgtttct   1740
ctatccacgg cggaaccgcc tcctgccgtt tcagaatgtt gttcaagtgg tactctgtgc   1800
ggtcaatgaa ggcgttattg ccggtgaaat ctttgggaag cggttttcct cggggaagat   1860
tacgaaattc cccgcgtcgt tgcgcttcct ggatctcgag gagatcgttc tccgcgtcga   1920
ggagatcgtt ctccgcgtcg acaccattcc ttgcggcggc ggtgctcaac ggcctcaacc   1980
tactactggg ctgcttccta atgcaggagt cgcataaggg agagcgtcga caaacccgcg   2040
tttgagaact tgctcaagct tctggtaaac gttgtagtac tctgaaacaa ggccctagca   2100
ctctgatctg tttctcttgg gtagcggtga gtggtttatt ggagttcact ggtttcagca   2160
catctgtcat ctagacaata ttgttactaa atttttttga actacaattg ttcgtaattc   2220
atctattatt atacatcctc gtcagcaatt tctggcagac ggagtttact aacgtcttga   2280
gtatgaggcc gagaatccag ctctgtggcc atactcagtc ttgacagcct gctgatgtgg   2340
ctgcgttcaa cgcaataagc gtgtcctccg actccgagtt gtgctcgtta tcgtcgttct   2400
catcctcgga aaaatcacac gaaagaacat actcaccagt aggctttctg gtccctgggg   2460
cacggctgtt tctgacgtat tccggcgttg ataatagctc gaaagtgaac gccgagtcgc   2520
gggagtcgac cgatgccctt gagagccttc aacccagtca gctccttccg gtgggcgcgg   2580
ggcatgacta tcgtcgccgc acttatgact gtcttcttta tcatgcaact cgtaggacag   2640
gtgccggcag cgctctgggt cattttcggc gaggaccgct ttcgctggag cgcgacgatg   2700
atcggcctgt cgcttgcggt attcggaatc ttgcacgccc tcgctcaagc cttcgtcact   2760
ggtcccgcca ccaaacgttt cggcgagaag caggccatta tcgccggcat ggcggccgac   2820
gcgctgggct acgtcttgct ggcgttcgcg acgcgaggct ggatggcctt ccccattatg   2880
attcttctcg cttccggcgg catcgggatg cccgcgttgc aggccatgct gtccaggcag   2940
gtagatgacg accatcaggg acagcttcaa ggatcgctcg cggctcttac cagcctaact   3000
tcgatcactg gaccgctgat cgtcacggcg atttatgccg cctcggcgag cacatggaac   3060
gggttggcat ggattgtagg cgccgcccta taccttgtct gcctccccgc gttgcgtcgc   3120
ggtgcatgga gccgggccac ctcgacctga atggaagccg gcggcacctc gctaacggat   3180
tcaccactcc aagaattgga gccaatcaat tcttgcggag aactgtgaat gcgcaaacca   3240
acccttggca gaacatatcc atcgcgtccg ccatctccag cagccgcacg cggcgcatcg   3300
gggggggggg gggggggggg gggcaaacaa ttcatcattt tttttttatt cttttttttg   3360
atttcggttt ctttgaaatt tttttgattc ggtaatctcc gaacagaagg aagaacgaag   3420
gaaggagcac agacttagat tggtatatat acgcatatgt agtgttgaag aaacatgaaa   3480
ttgcccagta ttcttaaccc aactgcacag aacaaaaacc tgcaggaaac gaagataaat   3540
catgtcgaaa gctacatata aggaacgtgc tgctactcat cctagtcctg ttgctgccaa   3600
gctatttaat atcatgcacg aaaagcaaac aaacttgtgt gcttcattgg atgttcgtac   3660
caccaaggaa ttactggagt tagttgaagc attaggtccc aaaatttgtt tactaaaaac   3720
acatgtggat atcttgactg atttttccat ggagggcaca gttaagccgc taaaggcatt   3780
atccgccaag tacaattttt tactcttcga agacagaaaa tttgctgaca ttggtaatac   3840
agtcaaattg cagtactctg cgggtgtata cagaatagca gaatgggcag acattacgaa   3900
tgcacacggt gtggtgggcc caggtattgt tagcggtttg aagcaggcgg cagaagaagt   3960
aacaaaggaa cctagaggcc ttttgatgtt agcagaattg tcatgcaagg gctccctatc   4020
tactggagaa tatactaagg gtactgttga cattgcgaag agcgacaaag attttgttat   4080
cggctttatt gctcaaagag acatgggtgg aagagatgaa ggttacgatt ggttgattat   4140
gacacccggt gtgggtttag atgacaaggg agacgcattg ggtcaacagt atagaaccgt   4200
ggatgatgtg gtctctacag gatctgacat tattattgtt ggaagaggac tatttgcaaa   4260
gggaagggat gctaaggtag agggtgaacg ttacagaaaa gcaggctggg aagcatattt   4320
gagaagatgc ggccagcaaa actaaaaaac tgtattataa gtaaatgcat gtatactaaa   4380
ctcacaaatt agagcttcaa tttaattata tcagttatta cccgggaatc tcggtcgtaa   4440
tgatttttat aatgacgaaa aaaaaaaaat tggaaagaaa agcccccccc cccccccccc   4500
cccccccccc ccccccgcag cgttgggtcc tggccacggg tgcgcatgat cgtgctcctg   4560
tcgttgagga cccggctagg ctggcggggt tgccttactg gttagcagaa tgaatcaccg   4620
atacgcgagc gaacgtgaag cgactgctgc tgcaaaacgt ctgcgacctg agcaacaaca   4680
tgaatggtct tcggtttccg tgtttcgtaa agtctggaaa cgcggaagtc agcgccctgc   4740
accattatgt tccggatctg catcgcagga tgctgctggc taccctgtgg aacacctaca   4800
tctgtattaa cgaagcgctg gcattgaccc tgagtgattt ttctctggtc ccgccgcatc   4860
cataccgcca gttgtttacc ctcacaacgt tccagtaacc gggcatgttc atcatcagta   4920
acccgtatcg tgagcatcct ctctcgtttc atcggtatca ttacccccat gaacagaaat   4980
tcccccttac acggaggcat caagtgacca aacaggaaaa aaccgccctt aacatggccc   5040
gctttatcag aagccagaca ttaacgcttc tggagaaact caacgagctg gacgcggatg   5100
aacaggcaga catctgtgaa tcgcttcacg accacgctga tgagctttac cgcagctgcc   5160
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca   5220
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg   5280
ttggcgggtg tcggggcgca gccatgaccc agtcacgtag cgatagcgga gtgtatactg   5340
gcttaactat gcggcatcag agcagattgt actgagagtg caccatatgc ggtgtgaaat   5400
accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt cctcgctcac   5460
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt   5520
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca   5580
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc   5640
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact   5700
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct   5760
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag   5820
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca   5880
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa   5940
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc   6000
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag   6060
aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg   6120
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca   6180
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc   6240
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag   6300
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata   6360
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat   6420
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg   6480
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc   6540
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc   6600
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc   6660
gccagttaat agtttgcgca acgttgttgc cattgctgca ggcatcgtgg tgtcacgctc   6720
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc   6780
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa   6840
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat   6900
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata   6960
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaaca cgggataata ccgcgccaca   7020
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag   7080
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc   7140
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc   7200
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata   7260
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta   7320
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta   7380
agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg   7440
tcttcaa                                                             7447
<210>22
<211>3730
<212>DNA
<213>载体pSP72E2H6
<400>22
gaactcgagc agctgaagct tgaattcatg agatttcctt caatttttac tgcagtttta     60
ttcgcagcat cctccgcatt agctgctcca gtcaacacta caacagaaga tgaaacggca    120
caaattccgg ctgaagctgt catcggttac tcagatttag aaggggattt cgatgttgct    180
gttttgccat tttccaacag cacaaataac gggttattgt ttataaatac tactattgcc    240
agcattgctg ctaaagaaga aggggtatct ctagataaaa ggcatacccg cgtgtcagga    300
ggggcagcag cctccgatac caggggcctt gtgtccctct ttagccccgg gtcggctcag    360
aaaatccagc tcgtaaacac caacggcagt tggcacatca acaggactgc cctgaactgc    420
aacgactccc tccaaacagg gttctttgcc gcactattct acaaacacaa attcaactcg    480
tctggatgcc cagagcgctt ggccagctgt cgctccatcg acaagttcgc tcaggggtgg    540
ggtcccctca cttacactga gcctaacagc tcggaccaga ggccctactg ctggcactac    600
gcgcctcgac cgtgtggtat tgtacccgcg tctcaggtgt gcggtccagt gtattgcttc    660
accccgagcc ctgttgtggt ggggacgacc gatcggtttg gtgtccccac gtataactgg    720
ggggcgaacg actcggatgt gctgattctc aacaacacgc ggccgccgcg aggcaactgg    780
ttcggctgta catggatgaa tggcactggg ttcaccaaga cgtgtggggg ccccccgtgc    840
aacatcgggg gggccggcaa caacaccttg acctgcccca ctgactgttt tcggaagcac    900
cccgaggcca cttacgccag atgcggttct gggccctggc tgacacctag gtgtatggtt    960
cattacccat ataggctctg gcactacccc tgcactgtca acttcaccat cttcaaggtt   1020
aggatgtacg tggggggcgt ggagcacagg ttcgaagccg catgcaattg gactcgagga   1080
gagcgttgtg acttggagga cagggataga tcagagctta gctcgctgct gctgtctaca   1140
acagagtggc aggtgatcga gggcagacac catcaccacc atcactaata gttaattaac   1200
gatctcgact tggttgaaca cgttgccaag gcttaagtga atttacttta aagtcttgca   1260
tttaaataaa ttttcttttt atagctttat gacttagttt caatttatat actattttaa   1320
tgacattttc gattcattga ttgaaagcta tcagatctgc cggtctccct atagtgagtc   1380
gtattaattt cgataagcca ggttaacctg cattaatgaa tcggccaacg cgcggggaga   1440
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc   1500
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa   1560
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt   1620
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa   1680
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt   1740
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg   1800
tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc   1860
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc   1920
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta   1980
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct   2040
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc   2100
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa   2160
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa   2220
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa   2280
aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt   2340
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac   2400
agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc   2460
atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc   2520
cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata   2580
aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc   2640
cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc   2700
aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca   2760
ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa   2820
gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca   2880
ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt   2940
tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt   3000
tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg   3060
ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga   3120
tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc   3180
agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg   3240
acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag   3300
ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg   3360
gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg   3420
acattaacct ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat   3480
gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg tctgtaagcg   3540
gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc   3600
tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat ggacatattg   3660
tcgttagaac gcggctacaa ttaatacata accttatgta tcatacacat acgatttagg   3720
tgacactata                                                          3730
<210>23
<211>7370
<212>DNA
<213>载体pMPT121
<220>
<221>misc_feature
<222>(778)..(778)
<223>N是任何核苷酸
<400>23
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc     60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat    120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt    180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc    240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt    300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccagatc tgaattcgtt    360
tttgtacttt agattgatgt caccaccgtg cactggcagc agtatttata gatggaccgt    420
gtggggacgg ttgggtacac ttagcggcag cgctgacccc atctgtgatc aagtagggca    480
aaaactgggg atgtcggagt cgctgcacgg tagcataaga atttactttc tggccggttc    540
acccgcattt gcactgtgga gaaacagcct gtccgacacc ccaccagttg ccacatcggc    600
cctctgctgc tctggtgatt ttctggtagc aggcacagac agcagtgggt agcgccgtcc    660
ggttaggcaa ggtcacgttg taggctaccc cagcaaacag agcctcacat gacaccatcc    720
agctgcgtcc tcgaagcgaa aagttcggtt gcggctgcag aaccccctca gttgccanat    780
tcacaagttt tacgcgacgg ctaaagcgag tgggttttaa aaacttgcgg tgcaaggatg    840
catgcggcaa caattaattg gtgcatccag cacagcaagc ccagtctcga gatgtccagt    900
cgctacagag tggagtacgc actcaaggaa caccgtcgag atggcctcat agaatggatc    960
aagggcctgc tggccacgcc gttcgtcctg tacgcggtga agagcaacgg catctctgca   1020
gtggacgacc tcatggtaaa ctctgaggca aaacgccgct acgcggaaat cttccacgac   1080
ctcgaactcc tcatcgacga caacattgaa atgaccaaag ccggcacccc cgaattgtct   1140
cggctcgtgc agctggttcc gagcgttggc agcttcttca cgagactgcc tctggaaaag   1200
gccttctaca tcgaggacga gcgccgcgcc atcagcaaac gccggcttgt ggccccctcg   1260
ttcaacgacg tccggctcat tctcaacacg gcccagctgt tggagatgtc gcggttcttc   1320
cattccaaaa ccatccgaga tcgcaagctg cagctcatta cattcgatgg tgacatcaca   1380
ctgtacgacg acggcaaaaa tttcgatgcc gagtcgccca tcctgcccca cctcatcaaa   1440
ctaatggcca aggacctcta tgtgggtatc gtcaccgcgg ccggctacag cgacggaaca   1500
agtactacga gcgcctcaag ggcctcatcg acgccgtcca gacgtccccg ctgctcacag   1560
gccaccagaa agagaacctg ttcattatgg gcggcgaggc aaactacctc ttccggtaca   1620
gtaacgagga gcagagatta cgcttctact ccaaagacag atggctgctc gagaacatgc   1680
tgaattggtc cgaggaggac attcatctga cactggactt tgcgcaggac gttctaaacg   1740
acctcgttca caaactgggc tcgccagcca ccgtggtccg caaggagcgt cgcgtcggcc   1800
tggttccatt accgggccac aagctgatcc gcgagcagct cgaggagatc gttctccgcg   1860
tcgacaccat tccttgcggc ggcggtgctc aacggcctca acctactact gggctgcttc   1920
ctaatgcagg agtcgcataa gggagagcgt cgactcccgc gactcggcgt tcactttcga   1980
gctattatca acgccggaat acgtcagaaa cagccgtgcc ccagggacca gaaagcctac   2040
tggtgagtat gttctttcgt gtgatttttc cgaggatgag aacgacgata acgagcacaa   2100
ctcggagtcg gaggacacgc ttattgcgtt gaacgcagcc acatcagcag gctgtcaaga   2160
ctgagtatgg ccacagagct ggattctcgg cctcatactc aagacgttag taaactccgt   2220
ctgccagaaa ttgctgacga ggatgtataa taatagatga attacgaaca attgtagttc   2280
aaaaaaattt agtaacaata ttgtctagat gacagatgtg ctgaaaccag tgaactccaa   2340
taaaccactc accgctaccc aagagaaaca gatcagagtg ctagggcctt gtttcagagt   2400
actacaacgt ttaccagaag cttgagcaag ttctcaaacg cgggtttgtc gaccgatgcc   2460
cttgagagcc ttcaacccag tcagctcctt ccggtgggcg cggggcatga ctatcgtcgc   2520
cgcacttatg actgtcttct ttatcatgca actcgtagga caggtgccgg cagcgctctg   2580
ggtcattttc ggcgaggacc gctttcgctg gagcgcgacg atgatcggcc tgtcgcttgc   2640
ggtattcgga atcttgcacg ccctcgctca agccttcgtc actggtcccg ccaccaaacg   2700
tttcggcgag aagcaggcca ttatcgccgg catggcggcc gacgcgctgg gctacgtctt   2760
gctggcgttc gcgacgcgag gctggatggc cttccccatt atgattcttc tcgcttccgg   2820
cggcatcggg atgcccgcgt tgcaggccat gctgtccagg caggtagatg acgaccatca   2880
gggacagctt caaggatcgc tcgcggctct taccagccta acttcgatca ctggaccgct   2940
gatcgtcacg gcgatttatg ccgcctcggc gagcacatgg aacgggttgg catggattgt   3000
aggcgccgcc ctataccttg tctgcctccc cgcgttgcgt cgcggtgcat ggagccgggc   3060
cacctcgacc tgaatggaag ccggcggcac ctcgctaacg gattcaccac tccaagaatt   3120
ggagccaatc aattcttgcg gagaactgtg aatgcgcaaa ccaacccttg gcagaacata   3180
tccatcgcgt ccgccatctc cagcagccgc acgcggcgca tcgggggggg gggggggggg   3240
ggggggcaaa caattcatca tttttttttt attctttttt ttgatttcgg tttctttgaa   3300
atttttttga ttcggtaatc tccgaacaga aggaagaacg aaggaaggag cacagactta   3360
gattggtata tatacgcata tgtagtgttg aagaaacatg aaattgccca gtattcttaa   3420
cccaactgca cagaacaaaa acctgcagga aacgaagata aatcatgtcg aaagctacat   3480
ataaggaacg tgctgctact catcctagtc ctgttgctgc caagctattt aatatcatgc   3540
acgaaaagca aacaaacttg tgtgcttcat tggatgttcg taccaccaag gaattactgg   3600
agttagttga agcattaggt cccaaaattt gtttactaaa aacacatgtg gatatcttga   3660
ctgatttttc catggagggc acagttaagc cgctaaaggc attatccgcc aagtacaatt   3720
ttttactctt cgaagacaga aaatttgctg acattggtaa tacagtcaaa ttgcagtact   3780
ctgcgggtgt atacagaata gcagaatggg cagacattac gaatgcacac ggtgtggtgg   3840
gcccaggtat tgttagcggt ttgaagcagg cggcagaaga agtaacaaag gaacctagag   3900
gccttttgat gttagcagaa ttgtcatgca agggctccct atctactgga gaatatacta   3960
agggtactgt tgacattgcg aagagcgaca aagattttgt tatcggcttt attgctcaaa   4020
gagacatggg tggaagagat gaaggttacg attggttgat tatgacaccc ggtgtgggtt   4080
tagatgacaa gggagacgca ttgggtcaac agtatagaac cgtggatgat gtggtctcta   4140
caggatctga cattattatt gttggaagag gactatttgc aaagggaagg gatgctaagg   4200
tagagggtga acgttacaga aaagcaggct gggaagcata tttgagaaga tgcggccagc   4260
aaaactaaaa aactgtatta taagtaaatg catgtatact aaactcacaa attagagctt   4320
caatttaatt atatcagtta ttacccggga atctcggtcg taatgatttt tataatgacg   4380
aaaaaaaaaa aattggaaag aaaagccccc cccccccccc cccccccccc cccccccccg   4440
cagcgttggg tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct   4500
aggctggcgg ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg   4560
aagcgactgc tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt   4620
ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgccc tgcaccatta tgttccggat   4680
ctgcatcgca ggatgctgct ggctaccctg tggaacacct acatctgtat taacgaagcg   4740
ctggcattga ccctgagtga tttttctctg gtcccgccgc atccataccg ccagttgttt   4800
accctcacaa cgttccagta accgggcatg ttcatcatca gtaacccgta tcgtgagcat   4860
cctctctcgt ttcatcggta tcattacccc catgaacaga aattccccct tacacggagg   4920
catcaagtga ccaaacagga aaaaaccgcc cttaacatgg cccgctttat cagaagccag   4980
acattaacgc ttctggagaa actcaacgag ctggacgcgg atgaacaggc agacatctgt   5040
gaatcgcttc acgaccacgc tgatgagctt taccgcagct gcctcgcgcg tttcggtgat   5100
gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg tctgtaagcg   5160
gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc   5220
gcagccatga cccagtcacg tagcgatagc ggagtgtata ctggcttaac tatgcggcat   5280
cagagcagat tgtactgaga gtgcaccata tgcggtgtga aataccgcac agatgcgtaa   5340
ggagaaaata ccgcatcagg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg   5400
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag   5460
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc   5520
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca   5580
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt   5640
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc   5700
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc   5760
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc   5820
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact   5880
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg   5940
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta   6000
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca   6060
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa   6120
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg   6180
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc   6240
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg   6300
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat   6360
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg   6420
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa   6480
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca   6540
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc   6600
gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt   6660
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa   6720
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat   6780
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct   6840
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga   6900
gttgctcttg cccggcgtca acacgggata ataccgcgcc acatagcaga actttaaaag   6960
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga   7020
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca   7080
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg   7140
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc   7200
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag   7260
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca   7320
tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtcttcaa              7370
<210>24
<211>8298
<212>DNA
<213>载体pFMPT-MFa1fa-E2-H6
<400>24
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc     60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat    120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt    180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc    240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt    300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccagatc tgatagcttt    360
caatcaatga atcgaaaatg tcattaaaat agtatataaa ttgaaactaa gtcataaagc    420
tataaaaaga aaatttattt aaatgcaaga ctttaaagta aattcactta agccttggca    480
acgtgttcaa ccaagtcgag atcgttaatt aactattagt gatggtggtg atggtgtctg    540
ccctcgatca cctgccactc tgttgtagac agcagcagcg agctaagctc tgatctatcc    600
ctgtcctcca agtcacaacg ctctcctcga gtccaattgc atgcggcttc gaacctgtgc    660
tccacgcccc ccacgtacat cctaaccttg aagatggtga agttgacagt gcaggggtag    720
tgccagagcc tatatgggta atgaaccata cacctaggtg tcagccaggg cccagaaccg    780
catctggcgt aagtggcctc ggggtgcttc cgaaaacagt cagtggggca ggtcaaggtg    840
ttgttgccgg cccccccgat gttgcacggg gggcccccac acgtcttggt gaacccagtg    900
ccattcatcc atgtacagcc gaaccagttg cctcgcggcg gccgcgtgtt gttgagaatc    960
agcacatccg agtcgttcgc cccccagtta tacgtgggga caccaaaccg atcggtcgtc   1020
cccaccacaa cagggctcgg ggtgaagcaa tacactggac cgcacacctg agacgcgggt   1080
acaataccac acggtcgagg cgcgtagtgc cagcagtagg gcctctggtc cgagctgtta   1140
ggctcagtgt aagtgagggg accccacccc tgagcgaact tgtcgatgga gcgacagctg   1200
gccaagcgct ctgggcatcc agacgagttg aatttgtgtt tgtagaatag tgcggcaaag   1260
aaccctgttt ggagggagtc gttgcagttc agggcagtcc tgttgatgtg ccaactgccg   1320
ttggtgttta cgagctggat tttctgagcc gacccggggc taaagaggga cacaaggccc   1380
ctggtatcgg aggctgctgc ccctcctgac acgcgggtat gccttttatc tagagatacc   1440
ccttcttctt tagcagcaat gctggcaata gtagtattta taaacaataa cccgttattt   1500
gtgctgttgg aaaatggcaa aacagcaaca tcgaaatccc cttctaaatc tgagtaaccg   1560
atgacagctt cagccggaat ttgtgccgtt tcatcttctg ttgtagtgtt gactggagca   1620
gctaatgcgg aggatgctgc gaataaaact gcagtaaaaa ttgaaggaaa tctcatgaat   1680
tcccgatgaa gcagagagcg caggaggcgg tatttatagt gccattcccc tctctgagag   1740
acccggatgg tagtcgagtg tatcggagac agcttgatgt agactccgtg cctgccggct   1800
cctcttattg gcggacacca gtgagacacc ccggaacttg ctgtttttct gcaaaatccg   1860
gggtgaccag tgggagccta tttgcacaca cgagcgggac accccactct ggtgaagagt   1920
gccaaagtca ttctttttcc cgttgcgggg cagccgattg catgttttag gaaaatatta   1980
cctttgctac accctgtcag atttaccctc cacacatata tattccgtca cctccaggga   2040
ctattattcg tcgttgcgcc gccagcggaa gatatccaga agctgttttc cgagagactc   2100
ggttggcgcc tggtatattt gatggatgtc gcgctgcctc acgtcccggt acccaggaac   2160
gcggtgggat ctcgggccca tcgaagactg tgctccagac tgctcgccca gcaggtgttt   2220
cttgatcgcc gcctctaaat tgtccgcgca tcgccggtaa catttttcca gctcggagtt   2280
tgcgtttaga tacagtttct gcgatgccaa aggagcctgc agattataac ctcggatgct   2340
gtcattcagc gcttttaatt tgacctccag atagttgctg tatttctgtt cccattggct   2400
gctgcgcagc ttcgtataac tcgagttatt gttgcgctct gcctcggcgt actggctcat   2460
gatctggatc ttgtccgtgt cgcttttctt cgagtgtttc tcgcaaacga tgtgcacggc   2520
ctgcagtgtc caatcggagt cgagctggcg ccgaaactgg cggatctgag cctccacact   2580
gccctgtttc tctatccacg gcggaaccgc ctcctgccgt ttcagaatgt tgttcaagtg   2640
gtactctgtg cggtcaatga aggcgttatt gccggtgaaa tctttgggaa gcggttttcc   2700
tcggggaaga ttacgaaatt ccccgcgtcg ttgcgcttcc tggatctcga ggagatcgtt   2760
ctccgcgtcg aggagatcgt tctccgcgtc gacaccattc cttgcggcgg cggtgctcaa   2820
cggcctcaac ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg   2880
acaaacccgc gtttgagaac ttgctcaagc ttctggtaaa cgttgtagta ctctgaaaca   2940
aggccctagc actctgatct gtttctcttg ggtagcggtg agtggtttat tggagttcac   3000
tggtttcagc acatctgtca tctagacaat attgttacta aatttttttg aactacaatt   3060
gttcgtaatt catctattat tatacatcct cgtcagcaat ttctggcaga cggagtttac   3120
taacgtcttg agtatgaggc cgagaatcca gctctgtggc catactcagt cttgacagcc   3180
tgctgatgtg gctgcgttca acgcaataag cgtgtcctcc gactccgagt tgtgctcgtt   3240
atcgtcgttc tcatcctcgg aaaaatcaca cgaaagaaca tactcaccag taggctttct   3300
ggtccctggg gcacggctgt ttctgacgta ttccggcgtt gataatagct cgaaagtgaa   3360
cgccgagtcg cgggagtcga ccgatgccct tgagagcctt caacccagtc agctccttcc   3420
ggtgggcgcg gggcatgact atcgtcgccg cacttatgac tgtcttcttt atcatgcaac   3480
tcgtaggaca ggtgccggca gcgctctggg tcattttcgg cgaggaccgc tttcgctgga   3540
gcgcgacgat gatcggcctg tcgcttgcgg tattcggaat cttgcacgcc ctcgctcaag   3600
ccttcgtcac tggtcccgcc accaaacgtt tcggcgagaa gcaggccatt atcgccggca   3660
tggcggccga cgcgctgggc tacgtcttgc tggcgttcgc gacgcgaggc tggatggcct   3720
tccccattat gattcttctc gcttccggcg gcatcgggat gcccgcgttg caggccatgc   3780
tgtccaggca ggtagatgac gaccatcagg gacagcttca aggatcgctc gcggctctta   3840
ccagcctaac ttcgatcact ggaccgctga tcgtcacggc gatttatgcc gcctcggcga   3900
gcacatggaa cgggttggca tggattgtag gcgccgccct ataccttgtc tgcctccccg   3960
cgttgcgtcg cggtgcatgg agccgggcca cctcgacctg aatggaagcc ggcggcacct   4020
cgctaacgga ttcaccactc caagaattgg agccaatcaa ttcttgcgga gaactgtgaa   4080
tgcgcaaacc aacccttggc agaacatatc catcgcgtcc gccatctcca gcagccgcac   4140
gcggcgcatc gggggggggg gggggggggg ggggcaaaca attcatcatt ttttttttat   4200
tctttttttt gatttcggtt tctttgaaat ttttttgatt cggtaatctc cgaacagaag   4260
gaagaacgaa ggaaggagca cagacttaga ttggtatata tacgcatatg tagtgttgaa   4320
gaaacatgaa attgcccagt attcttaacc caactgcaca gaacaaaaac ctgcaggaaa   4380
cgaagataaa tcatgtcgaa agctacatat aaggaacgtg ctgctactca tcctagtcct   4440
gttgctgcca agctatttaa tatcatgcac gaaaagcaaa caaacttgtg tgcttcattg   4500
gatgttcgta ccaccaagga attactggag ttagttgaag cattaggtcc caaaatttgt   4560
ttactaaaaa cacatgtgga tatcttgact gatttttcca tggagggcac agttaagccg   4620
ctaaaggcat tatccgccaa gtacaatttt ttactcttcg aagacagaaa atttgctgac   4680
attggtaata cagtcaaatt gcagtactct gcgggtgtat acagaatagc agaatgggca   4740
gacattacga atgcacacgg tgtggtgggc ccaggtattg ttagcggttt gaagcaggcg   4800
gcagaagaag taacaaagga acctagaggc cttttgatgt tagcagaatt gtcatgcaag   4860
ggctccctat ctactggaga atatactaag ggtactgttg acattgcgaa gagcgacaaa   4920
gattttgtta tcggctttat tgctcaaaga gacatgggtg gaagagatga aggttacgat   4980
tggttgatta tgacacccgg tgtgggttta gatgacaagg gagacgcatt gggtcaacag   5040
tatagaaccg tggatgatgt ggtctctaca ggatctgaca ttattattgt tggaagagga   5100
ctatttgcaa agggaaggga tgctaaggta gagggtgaac gttacagaaa agcaggctgg   5160
gaagcatatt tgagaagatg cggccagcaa aactaaaaaa ctgtattata agtaaatgca   5220
tgtatactaa actcacaaat tagagcttca atttaattat atcagttatt acccgggaat   5280
ctcggtcgta atgattttta taatgacgaa aaaaaaaaaa ttggaaagaa aagccccccc   5340
cccccccccc cccccccccc cccccccgca gcgttgggtc ctggccacgg gtgcgcatga   5400
tcgtgctcct gtcgttgagg acccggctag gctggcgggg ttgccttact ggttagcaga   5460
atgaatcacc gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg tctgcgacct   5520
gagcaacaac atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa acgcggaagt   5580
cagcgccctg caccattatg ttccggatct gcatcgcagg atgctgctgg ctaccctgtg   5640
gaacacctac atctgtatta acgaagcgct ggcattgacc ctgagtgatt tttctctggt   5700
cccgccgcat ccataccgcc agttgtttac cctcacaacg ttccagtaac cgggcatgtt   5760
catcatcagt aacccgtatc gtgagcatcc tctctcgttt catcggtatc attaccccca   5820
tgaacagaaa ttccccctta cacggaggca tcaagtgacc aaacaggaaa aaaccgccct   5880
taacatggcc cgctttatca gaagccagac attaacgctt ctggagaaac tcaacgagct   5940
ggacgcggat gaacaggcag acatctgtga atcgcttcac gaccacgctg atgagcttta   6000
ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc   6060
ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc   6120
gtcagcgggt gttggcgggt gtcggggcgc agccatgacc cagtcacgta gcgatagcgg   6180
agtgtatact ggcttaacta tgcggcatca gagcagattg tactgagagt gcaccatatg   6240
cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct   6300
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac   6360
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga   6420
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat   6480
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac   6540
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct   6600
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg   6660
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg   6720
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt   6780
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg   6840
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac   6900
ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga   6960
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt   7020
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt   7080
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga   7140
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc   7200
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct   7260
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata   7320
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca   7380
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga   7440
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga   7500
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctgc aggcatcgtg   7560
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga   7620
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt   7680
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct   7740
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca   7800
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaac acgggataat   7860
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga   7920
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc   7980
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg   8040
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc   8100
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt   8160
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca   8220
cctgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg   8280
aggccctttc gtcttcaa                                                 8298
<210>25
<211>8695
<212>DNA
<213>载体pMPT-Mfa1fa-E2-H6
<220>
<221>misc_feature
<222>(2103)..(2103)
<223>N是任何核苷酸
<400>25
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc     60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat    120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt    180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc    240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt    300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccagatc tgatagcttt    360
caatcaatga atcgaaaatg tcattaaaat agtatataaa ttgaaactaa gtcataaagc    420
tataaaaaga aaatttattt aaatgcaaga ctttaaagta aattcactta agccttggca    480
acgtgttcaa ccaagtcgag atcgttaatt aactattagt gatggtggtg atggtgtctg    540
ccctcgatca cctgccactc tgttgtagac agcagcagcg agctaagctc tgatctatcc    600
ctgtcctcca agtcacaacg ctctcctcga gtccaattgc atgcggcttc gaacctgtgc    660
tccacgcccc ccacgtacat cctaaccttg aagatggtga agttgacagt gcaggggtag    720
tgccagagcc tatatgggta atgaaccata cacctaggtg tcagccaggg cccagaaccg    780
catctggcgt aagtggcctc ggggtgcttc cgaaaacagt cagtggggca ggtcaaggtg    840
ttgttgccgg cccccccgat gttgcacggg gggcccccac acgtcttggt gaacccagtg    900
ccattcatcc atgtacagcc gaaccagttg cctcgcggcg gccgcgtgtt gttgagaatc    960
agcacatccg agtcgttcgc cccccagtta tacgtgggga caccaaaccg atcggtcgtc   1020
cccaccacaa cagggctcgg ggtgaagcaa tacactggac cgcacacctg agacgcgggt   1080
acaataccac acggtcgagg cgcgtagtgc cagcagtagg gcctctggtc cgagctgtta   1140
ggctcagtgt aagtgagggg accccacccc tgagcgaact tgtcgatgga gcgacagctg   1200
gccaagcgct ctgggcatcc agacgagttg aatttgtgtt tgtagaatag tgcggcaaag   1260
aaccctgttt ggagggagtc gttgcagttc agggcagtcc tgttgatgtg ccaactgccg   1320
ttggtgttta cgagctggat tttctgagcc gacccggggc taaagaggga cacaaggccc   1380
ctggtatcgg aggctgctgc ccctcctgac acgcgggtat gccttttatc tagagatacc   1440
ccttcttctt tagcagcaat gctggcaata gtagtattta taaacaataa cccgttattt   1500
gtgctgttgg aaaatggcaa aacagcaaca tcgaaatccc cttctaaatc tgagtaaccg   1560
atgacagctt cagccggaat ttgtgccgtt tcatcttctg ttgtagtgtt gactggagca   1620
gctaatgcgg aggatgctgc gaataaaact gcagtaaaaa ttgaaggaaa tctcatgaat   1680
tcgtttttgt actttagatt gatgtcacca ccgtgcactg gcagcagtat ttatagatgg   1740
accgtgtggg gacggttggg tacacttagc ggcagcgctg accccatctg tgatcaagta   1800
gggcaaaaac tggggatgtc ggagtcgctg cacggtagca taagaattta ctttctggcc   1860
ggttcacccg catttgcact gtggagaaac agcctgtccg acaccccacc agttgccaca   1920
tcggccctct gctgctctgg tgattttctg gtagcaggca cagacagcag tgggtagcgc   1980
cgtccggtta ggcaaggtca cgttgtaggc taccccagca aacagagcct cacatgacac   2040
catccagctg cgtcctcgaa gcgaaaagtt cggttgcggc tgcagaaccc cctcagttgc   2100
canattcaca agttttacgc gacggctaaa gcgagtgggt tttaaaaact tgcggtgcaa   2160
ggatgcatgc ggcaacaatt aattggtgca tccagcacag caagcccagt ctcgagatgt   2220
ccagtcgcta cagagtggag tacgcactca aggaacaccg tcgagatggc ctcatagaat   2280
ggatcaaggg cctgctggcc acgccgttcg tcctgtacgc ggtgaagagc aacggcatct   2340
ctgcagtgga cgacctcatg gtaaactctg aggcaaaacg ccgctacgcg gaaatcttcc   2400
acgacctcga actcctcatc gacgacaaca ttgaaatgac caaagccggc acccccgaat   2460
tgtctcggct cgtgcagctg gttccgagcg ttggcagctt cttcacgaga ctgcctctgg   2520
aaaaggcctt ctacatcgag gacgagcgcc gcgccatcag caaacgccgg cttgtggccc   2580
cctcgttcaa cgacgtccgg ctcattctca acacggccca gctgttggag atgtcgcggt   2640
tcttccattc caaaaccatc cgagatcgca agctgcagct cattacattc gatggtgaca   2700
tcacactgta cgacgacggc aaaaatttcg atgccgagtc gcccatcctg ccccacctca   2760
tcaaactaat ggccaaggac ctctatgtgg gtatcgtcac cgcggccggc tacagcgacg   2820
gaacaagtac tacgagcgcc tcaagggcct catcgacgcc gtccagacgt ccccgctgct   2880
cacaggccac cagaaagaga acctgttcat tatgggcggc gaggcaaact acctcttccg   2940
gtacagtaac gaggagcaga gattacgctt ctactccaaa gacagatggc tgctcgagaa   3000
catgctgaat tggtccgagg aggacattca tctgacactg gactttgcgc aggacgttct   3060
aaacgacctc gttcacaaac tgggctcgcc agccaccgtg gtccgcaagg agcgtcgcgt   3120
cggcctggtt ccattaccgg gccacaagct gatccgcgag cagctcgagg agatcgttct   3180
ccgcgtcgac accattcctt gcggcggcgg tgctcaacgg cctcaaccta ctactgggct   3240
gcttcctaat gcaggagtcg cataagggag agcgtcgact cccgcgactc ggcgttcact   3300
ttcgagctat tatcaacgcc ggaatacgtc agaaacagcc gtgccccagg gaccagaaag   3360
cctactggtg agtatgttct ttcgtgtgat ttttccgagg atgagaacga cgataacgag   3420
cacaactcgg agtcggagga cacgcttatt gcgttgaacg cagccacatc agcaggctgt   3480
caagactgag tatggccaca gagctggatt ctcggcctca tactcaagac gttagtaaac   3540
tccgtctgcc agaaattgct gacgaggatg tataataata gatgaattac gaacaattgt   3600
agttcaaaaa aatttagtaa caatattgtc tagatgacag atgtgctgaa accagtgaac   3660
tccaataaac cactcaccgc tacccaagag aaacagatca gagtgctagg gccttgtttc   3720
agagtactac aacgtttacc agaagcttga gcaagttctc aaacgcgggt ttgtcgaccg   3780
atgcccttga gagccttcaa cccagtcagc tccttccggt gggcgcgggg catgactatc   3840
gtcgccgcac ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg   3900
ctctgggtca ttttcggcga ggaccgcttt cgctggagcg cgacgatgat cggcctgtcg   3960
cttgcggtat tcggaatctt gcacgccctc gctcaagcct tcgtcactgg tcccgccacc   4020
aaacgtttcg gcgagaagca ggccattatc gccggcatgg cggccgacgc gctgggctac   4080
gtcttgctgg cgttcgcgac gcgaggctgg atggccttcc ccattatgat tcttctcgct   4140
tccggcggca tcgggatgcc cgcgttgcag gccatgctgt ccaggcaggt agatgacgac   4200
catcagggac agcttcaagg atcgctcgcg gctcttacca gcctaacttc gatcactgga   4260
ccgctgatcg tcacggcgat ttatgccgcc tcggcgagca catggaacgg gttggcatgg   4320
attgtaggcg ccgccctata ccttgtctgc ctccccgcgt tgcgtcgcgg tgcatggagc   4380
cgggccacct cgacctgaat ggaagccggc ggcacctcgc taacggattc accactccaa   4440
gaattggagc caatcaattc ttgcggagaa ctgtgaatgc gcaaaccaac ccttggcaga   4500
acatatccat cgcgtccgcc atctccagca gccgcacgcg gcgcatcggg gggggggggg   4560
gggggggggg gcaaacaatt catcattttt tttttattct tttttttgat ttcggtttct   4620
ttgaaatttt tttgattcgg taatctccga acagaaggaa gaacgaagga aggagcacag   4680
acttagattg gtatatatac gcatatgtag tgttgaagaa acatgaaatt gcccagtatt   4740
cttaacccaa ctgcacagaa caaaaacctg caggaaacga agataaatca tgtcgaaagc   4800
tacatataag gaacgtgctg ctactcatcc tagtcctgtt gctgccaagc tatttaatat   4860
catgcacgaa aagcaaacaa acttgtgtgc ttcattggat gttcgtacca ccaaggaatt   4920
actggagtta gttgaagcat taggtcccaa aatttgttta ctaaaaacac atgtggatat   4980
cttgactgat ttttccatgg agggcacagt taagccgcta aaggcattat ccgccaagta   5040
caatttttta ctcttcgaag acagaaaatt tgctgacatt ggtaatacag tcaaattgca   5100
gtactctgcg ggtgtataca gaatagcaga atgggcagac attacgaatg cacacggtgt   5160
ggtgggccca ggtattgtta gcggtttgaa gcaggcggca gaagaagtaa caaaggaacc   5220
tagaggcctt ttgatgttag cagaattgtc atgcaagggc tccctatcta ctggagaata   5280
tactaagggt actgttgaca ttgcgaagag cgacaaagat tttgttatcg gctttattgc   5340
tcaaagagac atgggtggaa gagatgaagg ttacgattgg ttgattatga cacccggtgt   5400
gggtttagat gacaagggag acgcattggg tcaacagtat agaaccgtgg atgatgtggt   5460
ctctacagga tctgacatta ttattgttgg aagaggacta tttgcaaagg gaagggatgc   5520
taaggtagag ggtgaacgtt acagaaaagc aggctgggaa gcatatttga gaagatgcgg   5580
ccagcaaaac taaaaaactg tattataagt aaatgcatgt atactaaact cacaaattag   5640
agcttcaatt taattatatc agttattacc cgggaatctc ggtcgtaatg atttttataa   5700
tgacgaaaaa aaaaaaattg gaaagaaaag cccccccccc cccccccccc cccccccccc   5760
ccccgcagcg ttgggtcctg gccacgggtg cgcatgatcg tgctcctgtc gttgaggacc   5820
cggctaggct ggcggggttg ccttactggt tagcagaatg aatcaccgat acgcgagcga   5880
acgtgaagcg actgctgctg caaaacgtct gcgacctgag caacaacatg aatggtcttc   5940
ggtttccgtg tttcgtaaag tctggaaacg cggaagtcag cgccctgcac cattatgttc   6000
cggatctgca tcgcaggatg ctgctggcta ccctgtggaa cacctacatc tgtattaacg   6060
aagcgctggc attgaccctg agtgattttt ctctggtccc gccgcatcca taccgccagt   6120
tgtttaccct cacaacgttc cagtaaccgg gcatgttcat catcagtaac ccgtatcgtg   6180
agcatcctct ctcgtttcat cggtatcatt acccccatga acagaaattc ccccttacac   6240
ggaggcatca agtgaccaaa caggaaaaaa ccgcccttaa catggcccgc tttatcagaa   6300
gccagacatt aacgcttctg gagaaactca acgagctgga cgcggatgaa caggcagaca   6360
tctgtgaatc gcttcacgac cacgctgatg agctttaccg cagctgcctc gcgcgtttcg   6420
gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt   6480
aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc   6540
ggggcgcagc catgacccag tcacgtagcg atagcggagt gtatactggc ttaactatgc   6600
ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg   6660
cgtaaggaga aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg   6720
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc   6780
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag   6840
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca   6900
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca   6960
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg   7020
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag   7080
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt   7140
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca   7200
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg   7260
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt   7320
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc   7380
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg   7440
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg   7500
gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta   7560
gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg   7620
gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg   7680
ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc   7740
atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc   7800
agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc   7860
ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag   7920
tttgcgcaac gttgttgcca ttgctgcagg catcgtggtg tcacgctcgt cgtttggtat   7980
ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg   8040
caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt   8100
gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag   8160
atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg   8220
accgagttgc tcttgcccgg cgtcaacacg ggataatacc gcgccacata gcagaacttt   8280
aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct   8340
gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac   8400
tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat   8460
aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat   8520
ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca   8580
aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat   8640
tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc ttcaa        8695
<210>26
<211>36
<212>DNA
<213>合成探针或引物
<400>26
agtcactctt caaggcatac ccgcgtgtca ggaggg                               36
<210>27
<211>39
<212>DNA
<213>合成探针或引物
<400>27
agtcactctt cacagggatc cttagtgatg gtggtgatg                            39
<210>28
<211>4190
<212>DNA
<213>载体pMF30
<400>28
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca     60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct    120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat    180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccaagcttgc    240
atgcctgcag ttgattgcag atgccagatc ccgaaagaac agaggacgga gcgtaaactt    300
gtggcattcc accagaaatt gatacagata agcttccgga gtcaccagct aaaacggaat    360
tgcaagaaat aatatcgata actttatcac cactagaata gccggtgttg ctgacagtaa    420
tatcctgtga cccgtttgaa cctaaattat taaaaatgga aatcaattga ttagcatcgc    480
tacccttcct agtggctata tagtggtctg aagaagaaac aactgaggat ttgtaagttg    540
aataggcaga atccttctta atagcttgat ttcttatttg atttagttta ctgattagct    600
cgtagtattc tgaatcggta ttatatccac ttaaccataa agcttctcta ttggcaggat    660
cggaaccacc attgagacct tgttcttggc cataataaat aattgggata ccatcaccca    720
aaattataaa agccatgtca ttcttaatca aggatgtgtc tgaggtaact gatggaaatc    780
taacttggtc atggttttca ataaagtttc ccaacaaaga gacgtccgaa caagatgact    840
gtaacgtgga gatcattgaa gttaactcac tggaagtcgc cgaagtatca ctgaagaatc    900
tatatactgg atagtataat ggatagttgg taactccttt catataattc tgatatggac    960
aagtataagt tggatctcct tgataaactt cacctaagtt ataaacacca gaagcgtcct   1020
caaacttcgt taatgaagcg gtatctacgt gctttgcact atcaattctt aaaccatcga   1080
ttgaatagtt ttgaacaaaa tctgacaccc aagtttgaaa tactcctata acttcattat   1140
cctcggtact taaatctgga agggagactt cagtatcacc ttcccaacaa tcttcaacat   1200
tggtttgatc attataattt gtaatcaaac aataatcgtg gaagtaagat tgttgattga   1260
atggagtgaa actagaataa tctacgcttg aaccatctcc gttccaagca taatggttgt   1320
aaacaacgtc gaccatcaat aacatgcttc tggaatgcaa ttcgctagct aattgtttca   1380
attcatcagc ggtaccaaaa ttagtgttca attcatcaat atttttcatc caataaccat   1440
ggtaagcata accataagca gtattgtcag gaatttgctc aacaactggg gagatccaga   1500
tcgcagtgaa acccatacct tgaatataat ccaacttgtc gataatccct ttataagatc   1560
caccacagta cttgcgatca ctcactaaac agtcagctgt ggtcgagcca tcagatctgg   1620
caaacctatc agtaacgatt tgataaatcg attggtcttt ccatttatca gctgacgagc   1680
taacatccct cttgtcaaaa ataatcggtt gagcagatac caatcttgag aatgctaaaa   1740
ttgctgcaac aactttactt gtaaatcctt cagttgaaaa tctcattgaa ttcactggcc   1800
gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca   1860
gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc   1920
caacagttgc gcagcctgaa tggcgaatgg cgcctgatgc ggtattttct ccttacgcat   1980
ctgtgcggta tttcacaccg catatggtgc actctcagta caatctgctc tgatgccgca   2040
tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg   2100
ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg   2160
ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta   2220
taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat   2280
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg   2340
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa   2400
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac   2460
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac   2520
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt   2580
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc   2640
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca   2700
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc   2760
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag   2820
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa   2880
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg   2940
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa   3000
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg   3060
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt   3120
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt   3180
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag   3240
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat   3300
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct   3360
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct   3420
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca   3480
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc   3540
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc   3600
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct   3660
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag   3720
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc   3780
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg   3840
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag   3900
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt   3960
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac   4020
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg   4080
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc   4140
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga              4190
<210>29
<211>38
<212>DNA
<213>合成探针或引物
<400>29
agtcactctt cacctcttgt caaaaataat cggttgag                             38
<210>30
<211>52
<212>DNA
<213>合成探针或引物
<400>30
tgcttcctac cactagcagc actaggacat acccgcgtgt caggaggggc ag             52
<210>31
<211>57
<212>DNA
<213>合成探针或引物
<400>31
tagtactagt attagtaggc ttcgcatgga attcactggc cgtcgtttta caacgtc        57
<210>32
<211>7927
<212>DNA
<213>载体pFMPT-CL-E2-H6
<400>32
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc     60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat    120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt    180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc    240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt    300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttagt gatggtggtg    360
atggtgtctg ccctcgatca cctgccactc tgttgtagac agcagcagcg agctaagctc    420
tgatctatcc ctgtcctcca agtcacaacg ctctcctcga gtccaattgc atgcggcttc    480
gaacctgtgc tccacgcccc ccacgtacat cctaaccttg aagatggtga agttgacagt    540
gcaggggtag tgccagagcc tatatgggta atgaaccata cacctaggtg tcagccaggg    600
cccagaaccg catctggcgt aagtggcctc ggggtgcttc cgaaaacagt cagtggggca    660
ggtcaaggtg ttgttgccgg cccccccgat gttgcacggg gggcccccac acgtcttggt    720
gaacccagtg ccattcatcc atgtacagcc gaaccagttg cctcgcggcg gccgcgtgtt    780
gttgagaatc agcacatccg agtcgttcgc cccccagtta tacgtgggga caccaaaccg    840
atcggtcgtc cccaccacaa cagggctcgg ggtgaagcaa tacactggac cgcacacctg    900
agacgcgggt acaataccac acggtcgagg cgcgtagtgc cagcagtagg gcctctggtc    960
cgagctgtta ggctcagtgt aagtgagggg accccacccc tgagcgaact tgtcgatgga   1020
gcgacagctg gccaagcgct ctgggcatcc agacgagttg aatttgtgtt tgtagaatag   1080
tgcggcaaag aaccctgttt ggagggagtc gttgcagttc agggcagtcc tgttgatgtg   1140
ccaactgccg ttggtgttta cgagctggat tttctgagcc gacccggggc taaagaggga   1200
cacaaggccc ctggtatcgg aggctgctgc ccctcctgac acgcgggtat gtcctagtgc   1260
tgctagtggt aggaagcata gtactagtat tagtaggctg cgcatgaatt cccgatgaag   1320
cagagagcgc aggaggcggt atttatagtg ccattcccct ctctgagaga cccggatggt   1380
agtcgagtgt atcggagaca gcttgatgta gactccgtgc ctgccggctc ctcttattgg   1440
cggacaccag tgagacaccc cggaacttgc tgtttttctg caaaatccgg ggtgaccagt   1500
gggagcctat ttgcacacac gagcgggaca ccccactctg gtgaagagtg ccaaagtcat   1560
tctttttccc gttgcggggc agccgattgc atgttttagg aaaatattac ctttgctaca   1620
ccctgtcaga tttaccctcc acacatatat attccgtcac ctccagggac tattattcgt   1680
cgttgcgccg ccagcggaag atatccagaa gctgttttcc gagagactcg gttggcgcct   1740
ggtatatttg atggatgtcg cgctgcctca cgtcccggta cccaggaacg cggtgggatc   1800
tcgggcccat cgaagactgt gctccagact gctcgcccag caggtgtttc ttgatcgccg   1860
cctctaaatt gtccgcgcat cgccggtaac atttttccag ctcggagttt gcgtttagat   1920
acagtttctg cgatgccaaa ggagcctgca gattataacc tcggatgctg tcattcagcg   1980
cttttaattt gacctccaga tagttgctgt atttctgttc ccattggctg ctgcgcagct   2040
tcgtataact cgagttattg ttgcgctctg cctcggcgta ctggctcatg atctggatct   2100
tgtccgtgtc gcttttcttc gagtgtttct cgcaaacgat gtgcacggcc tgcagtgtcc   2160
aatcggagtc gagctggcgc cgaaactggc ggatctgagc ctccacactg ccctgtttct   2220
ctatccacgg cggaaccgcc tcctgccgtt tcagaatgtt gttcaagtgg tactctgtgc   2280
ggtcaatgaa ggcgttattg ccggtgaaat ctttgggaag cggttttcct cggggaagat   2340
tacgaaattc cccgcgtcgt tgcgcttcct ggatctcgag gagatcgttc tccgcgtcga   2400
ggagatcgtt ctccgcgtcg acaccattcc ttgcggcggc ggtgctcaac ggcctcaacc   2460
tactactggg ctgcttccta atgcaggagt cgcataaggg agagcgtcga caaacccgcg   2520
tttgagaact tgctcaagct tctggtaaac gttgtagtac tctgaaacaa ggccctagca   2580
ctctgatctg tttctcttgg gtagcggtga gtggtttatt ggagttcact ggtttcagca   2640
catctgtcat ctagacaata ttgttactaa atttttttga actacaattg ttcgtaattc   2700
atctattatt atacatcctc gtcagcaatt tctggcagac ggagtttact aacgtcttga   2760
gtatgaggcc gagaatccag ctctgtggcc atactcagtc ttgacagcct gctgatgtgg   2820
ctgcgttcaa cgcaataagc gtgtcctccg actccgagtt gtgctcgtta tcgtcgttct   2880
catcctcgga aaaatcacac gaaagaacat actcaccagt aggctttctg gtccctgggg   2940
cacggctgtt tctgacgtat tccggcgttg ataatagctc gaaagtgaac gccgagtcgc   3000
gggagtcgac cgatgccctt gagagccttc aacccagtca gctccttccg gtgggcgcgg   3060
ggcatgacta tcgtcgccgc acttatgact gtcttcttta tcatgcaact cgtaggacag   3120
gtgccggcag cgctctgggt cattttcggc gaggaccgct ttcgctggag cgcgacgatg   3180
atcggcctgt cgcttgcggt attcggaatc ttgcacgccc tcgctcaagc cttcgtcact   3240
ggtcccgcca ccaaacgttt cggcgagaag caggccatta tcgccggcat ggcggccgac   3300
gcgctgggct acgtcttgct ggcgttcgcg acgcgaggct ggatggcctt ccccattatg   3360
attcttctcg cttccggcgg catcgggatg cccgcgttgc aggccatgct gtccaggcag   3420
gtagatgacg accatcaggg acagcttcaa ggatcgctcg cggctcttac cagcctaact   3480
tcgatcactg gaccgctgat cgtcacggcg atttatgccg cctcggcgag cacatggaac   3540
gggttggcat ggattgtagg cgccgcccta taccttgtct gcctccccgc gttgcgtcgc   3600
ggtgcatgga gccgggccac ctcgacctga atggaagccg gcggcacctc gctaacggat   3660
tcaccactcc aagaattgga gccaatcaat tcttgcggag aactgtgaat gcgcaaacca   3720
acccttggca gaacatatcc atcgcgtccg ccatctccag cagccgcacg cggcgcatcg   3780
gggggggggg gggggggggg gggcaaacaa ttcatcattt tttttttatt cttttttttg   3840
atttcggttt ctttgaaatt tttttgattc ggtaatctcc gaacagaagg aagaacgaag   3900
gaaggagcac agacttagat tggtatatat acgcatatgt agtgttgaag aaacatgaaa   3960
ttgcccagta ttcttaaccc aactgcacag aacaaaaacc tgcaggaaac gaagataaat   4020
catgtcgaaa gctacatata aggaacgtgc tgctactcat cctagtcctg ttgctgccaa   4080
gctatttaat atcatgcacg aaaagcaaac aaacttgtgt gcttcattgg atgttcgtac   4140
caccaaggaa ttactggagt tagttgaagc attaggtccc aaaatttgtt tactaaaaac   4200
acatgtggat atcttgactg atttttccat ggagggcaca gttaagccgc taaaggcatt   4260
atccgccaag tacaattttt tactcttcga agacagaaaa tttgctgaca ttggtaatac   4320
agtcaaattg cagtactctg cgggtgtata cagaatagca gaatgggcag acattacgaa   4380
tgcacacggt gtggtgggcc caggtattgt tagcggtttg aagcaggcgg cagaagaagt   4440
aacaaaggaa cctagaggcc ttttgatgtt agcagaattg tcatgcaagg gctccctatc   4500
tactggagaa tatactaagg gtactgttga cattgcgaag agcgacaaag attttgttat   4560
cggctttatt gctcaaagag acatgggtgg aagagatgaa ggttacgatt ggttgattat   4620
gacacccggt gtgggtttag atgacaaggg agacgcattg ggtcaacagt atagaaccgt   4680
ggatgatgtg gtctctacag gatctgacat tattattgtt ggaagaggac tatttgcaaa   4740
gggaagggat gctaaggtag agggtgaacg ttacagaaaa gcaggctggg aagcatattt   4800
gagaagatgc ggccagcaaa actaaaaaac tgtattataa gtaaatgcat gtatactaaa   4860
ctcacaaatt agagcttcaa tttaattata tcagttatta cccgggaatc tcggtcgtaa   4920
tgatttttat aatgacgaaa aaaaaaaaat tggaaagaaa agcccccccc cccccccccc   4980
cccccccccc ccccccgcag cgttgggtcc tggccacggg tgcgcatgat cgtgctcctg   5040
tcgttgagga cccggctagg ctggcggggt tgccttactg gttagcagaa tgaatcaccg   5100
atacgcgagc gaacgtgaag cgactgctgc tgcaaaacgt ctgcgacctg agcaacaaca   5160
tgaatggtct tcggtttccg tgtttcgtaa agtctggaaa cgcggaagtc agcgccctgc   5220
accattatgt tccggatctg catcgcagga tgctgctggc taccctgtgg aacacctaca   5280
tctgtattaa cgaagcgctg gcattgaccc tgagtgattt ttctctggtc ccgccgcatc   5340
cataccgcca gttgtttacc ctcacaacgt tccagtaacc gggcatgttc atcatcagta   5400
acccgtatcg tgagcatcct ctctcgtttc atcggtatca ttacccccat gaacagaaat   5460
tcccccttac acggaggcat caagtgacca aacaggaaaa aaccgccctt aacatggccc   5520
gctttatcag aagccagaca ttaacgcttc tggagaaact caacgagctg gacgcggatg   5580
aacaggcaga catctgtgaa tcgcttcacg accacgctga tgagctttac cgcagctgcc   5640
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca   5700
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg   5760
ttggcgggtg tcggggcgca gccatgaccc agtcacgtag cgatagcgga gtgtatactg   5820
gcttaactat gcggcatcag agcagattgt actgagagtg caccatatgc ggtgtgaaat   5880
accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt cctcgctcac   5940
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt   6000
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca   6060
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc   6120
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact   6180
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct   6240
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag   6300
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca   6360
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa   6420
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc   6480
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag   6540
aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg   6600
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca   6660
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc   6720
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag   6780
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata   6840
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat   6900
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg   6960
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc   7020
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc   7080
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc   7140
gccagttaat agtttgcgca acgttgttgc cattgctgca ggcatcgtgg tgtcacgctc   7200
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc   7260
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa   7320
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat   7380
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata   7440
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaaca cgggataata ccgcgccaca   7500
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag   7560
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc   7620
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc   7680
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata   7740
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta   7800
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta   7860
agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg   7920
tcttcaa                                                             7927
<210>33
<211>24
<212>DNA
<213>合成探针或引物
<400>33
taaggatccc cgggtaccga gctc                                            24
<210>34
<211>25
<212>DNA
<213>合成探针或引物
<400>34
ccagttcatc atcatatccc aagcc                                           25
<210>35
<211>4234
<212>DNA
<213>载体pUC18-FMD-CL-E1
<220>
<221>misc_feature
<222>(988)..(989)
<223>N是任何核苷酸
<220>
<221>misc_feature
<222>(1167)..(1168)
<223>N是任何核苷酸
<400>35
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca     60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct    120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat    180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg aattcgagct    240
cggtacccgg ggatccttac cagttcatca tcatatccca agccatacgg tgacctgtta    300
tgtggccggg atagattgag caattgcagt cctgcaccgt ctcatgccgg cgaggcgaga    360
tggtgaacag ctgggagacg aggaagacag atccgcagag atcccccacg tacatagcgg    420
aacagaaagc agccgcccca acgagcaaat cgacgtggcg tcgtattgtc gtagtgggga    480
cgctggcgtt cctagctgcg agcgtggggg tgagcgctac ccagcagcgg gaagagttgt    540
tctcccgaac gcagggcacg cacccggggg tgtgcatgat catgtccgct gcctcataca    600
caatgcttga gttggagcag tcgttcgtga catggtacat cccggacacg ttgcgcacct    660
catatcctag tgctgctagt ggtaggaagc atagtactag tattagtagg cttcgcatga    720
attcccgatg aaggcagaga gcgcaaggag gcggtattta tagtgccatt cccctctctg    780
agagacccgg atggtagtcg agtgttatcg gagacagctt gatgtagact ccgtgcctgc    840
cggtcctctt attggcggac accagtgaga caccccggaa cttgctgttt ttctgcaaaa    900
tccggggtga ccagtgggag cctatttgca cacacgagcg ggacacccca ctctggtgaa    960
gagtgccaaa gtcattcttt ttcccgtnnc ggggcagccg attgcatgtt ttaggaaaat   1020
attacctttg ctacaccctg tcagatttac cctccacaca tatatattcc gtcacctcca   1080
gggactattc ttggctcgtt gcgccgccgc ggaagatatc cagaagctgt gttttccgag   1140
agactcggtt ggcgcctggt atatttnnag gatgtcgcgc tgcctcacgt cccggtaccc   1200
aggaacgcgg tgggatctcg ggcccatcga agactgtgct ccagactgct cgcccagcag   1260
gtgtttcttg attgccgcct ctaaatagtc cgcgcatcgc cggtaacatt tttccagctc   1320
ggagtttgcg tttagataca tttctgcgat gccaaaggag cctgcagatt ataacctcgg   1380
atgctgtcat tcagcgcttt taatttgacc tccagatagt tgctgtattt ctgttccatt   1440
ggctgctgga cgttcgtata actcgagtta ttgttgcgct ctgcctcggc gtactggctc   1500
atgactgact gcggtcgctt ctcgagtgtt ctcgcaacag gacgcctgca ggtcatcgag   1560
tcgagctggc gccgaaactg gcggatctga cctccacact gccctgtatc tctatccacc   1620
gggaaccgcc tcctgccgtt ccagaatgtt gttcaagtgg tagctctgtg cggtcaatga   1680
aggcgttatt gccggtgaaa tctttgggaa gcggtttatc ctcggggaag attacgaaat   1740
tcccgcgcgt cgttgcgctt cctggatctc gaggaagatc gttctccgcg tcgaggagat   1800
cgttctccgc gtcgacctgc aggcatgcaa gcttggcact ggccgtcgtt ttacaacgtc   1860
gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg   1920
ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc   1980
tgaatggcga atggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac   2040
accgcatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc   2100
gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt   2160
acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac   2220
cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga   2280
taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta   2340
tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat   2400
aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc   2460
ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga   2520
aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca   2580
acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt   2640
ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg   2700
gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc   2760
atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata   2820
acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt   2880
tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag   2940
ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca   3000
aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg   3060
aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg   3120
ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag   3180
atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg   3240
aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag   3300
accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga   3360
tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt   3420
tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc   3480
tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc   3540
cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac   3600
caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac   3660
cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt   3720
cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct   3780
gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat   3840
acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt   3900
atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg   3960
cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt   4020
gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt   4080
tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg   4140
tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg   4200
agcgcagcga gtcagtgagc gaggaagcgg aaga                               4234
<210>36
<211>7429
<212>DNA
<213>载体pFPMT-CL-E1
<400>36
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc     60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat    120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt    180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc    240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt    300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttacc agttcatcat    360
catatcccaa gccatacggt gacctgttat gtggccggga tagattgagc aattgcagtc    420
ctgcaccgtc tcatgccggc gaggcgagat ggtgaacagc tgggagacga ggaagacaga    480
tccgcagaga tcccccacgt acatagcgga acagaaagca gccgccccaa cgagcaaatc    540
gacgtggcgt cgtattgtcg tagtggggac gctggcgttc ctagctgcga gcgtgggggt    600
gagcgctacc cagcagcggg aagagttgtt ctcccgaacg cagggcacgc acccgggggt    660
gtgcatgatc atgtccgctg cctcatacac aatgcttgag ttggagcagt cgttcgtgac    720
atggtacatc ccggacacgt tgcgcacctc atatcctagt gctgctagtg gtaggaagca    780
tagtactagt attagtaggc ttcgcatgaa ttcccgatga agcagagagc gcaggaggcg    840
gtatttatag tgccattccc ctctctgaga gacccggatg gtagtcgagt gtatcggaga    900
cagcttgatg tagactccgt gcctgccggc tcctcttatt ggcggacacc agtgagacac    960
cccggaactt gctgtttttc tgcaaaatcc ggggtgacca gtgggagcct atttgcacac   1020
acgagcggga caccccactc tggtgaagag tgccaaagtc attctttttc ccgttgcggg   1080
gcagccgatt gcatgtttta ggaaaatatt acctttgcta caccctgtca gatttaccct   1140
ccacacatat atattccgtc acctccaggg actattattc gtcgttgcgc cgccagcgga   1200
agatatccag aagctgtttt ccgagagact cggttggcgc ctggtatatt tgatggatgt   1260
cgcgctgcct cacgtcccgg tacccaggaa cgcggtggga tctcgggccc atcgaagact   1320
gtgctccaga ctgctcgccc agcaggtgtt tcttgatcgc cgcctctaaa ttgtccgcgc   1380
atcgccggta acatttttcc agctcggagt ttgcgtttag atacagtttc tgcgatgcca   1440
aaggagcctg cagattataa cctcggatgc tgtcattcag cgcttttaat ttgacctcca   1500
gatagttgct gtatttctgt tcccattggc tgctgcgcag cttcgtataa ctcgagttat   1560
tgttgcgctc tgcctcggcg tactggctca tgatctggat cttgtccgtg tcgcttttct   1620
tcgagtgttt ctcgcaaacg atgtgcacgg cctgcagtgt ccaatcggag tcgagctggc   1680
gccgaaactg gcggatctga gcctccacac tgccctgttt ctctatccac ggcggaaccg   1740
cctcctgccg tttcagaatg ttgttcaagt ggtactctgt gcggtcaatg aaggcgttat   1800
tgccggtgaa atctttggga agcggttttc ctcggggaag attacgaaat tccccgcgtc   1860
gttgcgcttc ctggatctcg aggagatcgt tctccgcgtc gaggagatcg ttctccgcgt   1920
cgacaccatt ccttgcggcg gcggtgctca acggcctcaa cctactactg ggctgcttcc   1980
taatgcagga gtcgcataag ggagagcgtc gacaaacccg cgtttgagaa cttgctcaag   2040
cttctggtaa acgttgtagt actctgaaac aaggccctag cactctgatc tgtttctctt   2100
gggtagcggt gagtggttta ttggagttca ctggtttcag cacatctgtc atctagacaa   2160
tattgttact aaattttttt gaactacaat tgttcgtaat tcatctatta ttatacatcc   2220
tcgtcagcaa tttctggcag acggagttta ctaacgtctt gagtatgagg ccgagaatcc   2280
agctctgtgg ccatactcag tcttgacagc ctgctgatgt ggctgcgttc aacgcaataa   2340
gcgtgtcctc cgactccgag ttgtgctcgt tatcgtcgtt ctcatcctcg gaaaaatcac   2400
acgaaagaac atactcacca gtaggctttc tggtccctgg ggcacggctg tttctgacgt   2460
attccggcgt tgataatagc tcgaaagtga acgccgagtc gcgggagtcg accgatgccc   2520
ttgagagcct tcaacccagt cagctccttc cggtgggcgc ggggcatgac tatcgtcgcc   2580
gcacttatga ctgtcttctt tatcatgcaa ctcgtaggac aggtgccggc agcgctctgg   2640
gtcattttcg gcgaggaccg ctttcgctgg agcgcgacga tgatcggcct gtcgcttgcg   2700
gtattcggaa tcttgcacgc cctcgctcaa gccttcgtca ctggtcccgc caccaaacgt   2760
ttcggcgaga agcaggccat tatcgccggc atggcggccg acgcgctggg ctacgtcttg   2820
ctggcgttcg cgacgcgagg ctggatggcc ttccccatta tgattcttct cgcttccggc   2880
ggcatcggga tgcccgcgtt gcaggccatg ctgtccaggc aggtagatga cgaccatcag   2940
ggacagcttc aaggatcgct cgcggctctt accagcctaa cttcgatcac tggaccgctg   3000
atcgtcacgg cgatttatgc cgcctcggcg agcacatgga acgggttggc atggattgta   3060
ggcgccgccc tataccttgt ctgcctcccc gcgttgcgtc gcggtgcatg gagccgggcc   3120
acctcgacct gaatggaagc cggcggcacc tcgctaacgg attcaccact ccaagaattg   3180
gagccaatca attcttgcgg agaactgtga atgcgcaaac caacccttgg cagaacatat   3240
ccatcgcgtc cgccatctcc agcagccgca cgcggcgcat cggggggggg gggggggggg   3300
gggggcaaac aattcatcat ttttttttta ttcttttttt tgatttcggt ttctttgaaa   3360
tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc acagacttag   3420
attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag tattcttaac   3480
ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga aagctacata   3540
taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta atatcatgca   3600
cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg aattactgga   3660
gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg atatcttgac   3720
tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca agtacaattt   3780
tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat tgcagtactc   3840
tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg gtgtggtggg   3900
cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg aacctagagg   3960
ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag aatatactaa   4020
gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta ttgctcaaag   4080
agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg gtgtgggttt   4140
agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg tggtctctac   4200
aggatctgac attattattg ttggaagagg actatttgca aagggaaggg atgctaaggt   4260
agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat gcggccagca   4320
aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa ttagagcttc   4380
aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt ataatgacga   4440
aaaaaaaaaa attggaaaga aaagcccccc cccccccccc cccccccccc ccccccccgc   4500
agcgttgggt cctggccacg ggtgcgcatg atcgtgctcc tgtcgttgag gacccggcta   4560
ggctggcggg gttgccttac tggttagcag aatgaatcac cgatacgcga gcgaacgtga   4620
agcgactgct gctgcaaaac gtctgcgacc tgagcaacaa catgaatggt cttcggtttc   4680
cgtgtttcgt aaagtctgga aacgcggaag tcagcgccct gcaccattat gttccggatc   4740
tgcatcgcag gatgctgctg gctaccctgt ggaacaccta catctgtatt aacgaagcgc   4800
tggcattgac cctgagtgat ttttctctgg tcccgccgca tccataccgc cagttgttta   4860
ccctcacaac gttccagtaa ccgggcatgt tcatcatcag taacccgtat cgtgagcatc   4920
ctctctcgtt tcatcggtat cattaccccc atgaacagaa attccccctt acacggaggc   4980
atcaagtgac caaacaggaa aaaaccgccc ttaacatggc ccgctttatc agaagccaga   5040
cattaacgct tctggagaaa ctcaacgagc tggacgcgga tgaacaggca gacatctgtg   5100
aatcgcttca cgaccacgct gatgagcttt accgcagctg cctcgcgcgt ttcggtgatg   5160
acggtgaaaa cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg   5220
atgccgggag cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggcg   5280
cagccatgac ccagtcacgt agcgatagcg gagtgtatac tggcttaact atgcggcatc   5340
agagcagatt gtactgagag tgcaccatat gcggtgtgaa ataccgcaca gatgcgtaag   5400
gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt   5460
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga   5520
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg   5580
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa   5640
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt   5700
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct   5760
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct   5820
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc   5880
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt   5940
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc   6000
tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat   6060
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa   6120
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa   6180
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga   6240
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct   6300
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga   6360
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc   6420
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg   6480
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat   6540
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat   6600
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg   6660
caacgttgtt gccattgctg caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc   6720
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa   6780
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc   6840
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt   6900
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag   6960
ttgctcttgc ccggcgtcaa cacgggataa taccgcgcca catagcagaa ctttaaaagt   7020
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag   7080
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac   7140
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc   7200
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca   7260
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg   7320
ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat   7380
gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtcttcaa               7429
<210>37
<211>39
<212>DNA
<213>合成探针或引物
<400>37
catcacaaat atgaggtgcg caacgtgtcc gggatgtac                           39
<210>38
<211>42
<212>DNA
<213>合成探针或引物
<400>38
gtgatggtgg tgtcctagtg ctgctagtgg taggaagcat ag                       42
<210>39
<211>4273
<212>DNA
<213>载体pUC18-FMD-CL-E1-H-K6
<220>
<221>misc_feature
<222>(1027)..(1028)
<223>N是任何核苷酸
<220>
<221>misc_feature
<222>(1206)..(1207)
<223>N是任何核苷酸
<400>39
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca    60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct    120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat    180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg aattcgagct    240
cggtacccgg ggatccttaa tggtgatggt ggtggtgcca gttcatcatc atatcccaag    300
ccatacggtg acctgttatg tggccgggat agattgagca attgcagtcc tgcaccgtct    360
catgccggcg aggcgagatg gtgaacagct gggagacgag gaagacagat ccgcagagat    420
cccccacgta catagcggaa cagaaagcag ccgccccaac gagcaaatcg acgtggcgtc    480
gtattgtcgt agtggggacg ctggcgttcc tagctgcgag cgtgggggtg agcgctaccc    540
agcagcggga agagttgttc tcccgaacgc agggcacgca cccgggggtg tgcatgatca    600
tgtccgctgc ctcatacaca atgcttgagt tggagcagtc gttcgtgaca tggtacatcc    660
cggacacgtt gcgcacctca tatttgtgat ggtgatggtg gtgtcctagt gctgctagtg    720
gtaggaagca tagtactagt attagtaggc ttcgcatgaa ttcccgatga aggcagagag    780
cgcaaggagg cggtatttat agtgccattc ccctctctga gagacccgga tggtagtcga    840
gtgttatcgg agacagcttg atgtagactc cgtgcctgcc ggtcctctta ttggcggaca    900
ccagtgagac accccggaac ttgctgtttt tctgcaaaat ccggggtgac cagtgggagc    960
ctatttgcac acacgagcgg gacaccccac tctggtgaag agtgccaaag tcattctttt   1020
tcccgtnncg gggcagccga ttgcatgttt taggaaaata ttacctttgc tacaccctgt   1080
cagatttacc ctccacacat atatattccg tcacctccag ggactattct tggctcgttg   1140
cgccgccgcg gaagatatcc agaagctgtg ttttccgaga gactcggttg gcgcctggta   1200
tatttnnagg atgtcgcgct gcctcacgtc ccggtaccca ggaacgcggt gggatctcgg   1260
gcccatcgaa gactgtgctc cagactgctc gcccagcagg tgtttcttga ttgccgcctc   1320
taaatagtcc gcgcatcgcc ggtaacattt ttccagctcg gagtttgcgt ttagatacat   1380
ttctgcgatg ccaaaggagc ctgcagatta taacctcgga tgctgtcatt cagcgctttt   1440
aatttgacct ccagatagtt gctgtatttc tgttccattg gctgctggac gttcgtataa   1500
ctcgagttat tgttgcgctc tgcctcggcg tactggctca tgactgactg cggtcgcttc   1560
tcgagtgttc tcgcaacagg acgcctgcag gtcatcgagt cgagctggcg ccgaaactgg   1620
cggatctgac ctccacactg ccctgtatct ctatccaccg ggaaccgcct cctgccgttc   1680
cagaatgttg ttcaagtggt agctctgtgc ggtcaatgaa ggcgttattg ccggtgaaat   1740
ctttgggaag cggtttatcc tcggggaaga ttacgaaatt cccgcgcgtc gttgcgcttc   1800
ctggatctcg aggaagatcg ttctccgcgt cgaggagatc gttctccgcg tcgacctgca   1860
ggcatgcaag cttggcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg   1920
ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag   1980
aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga   2040
tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca   2100
gtacaatctg ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg   2160
acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct   2220
ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg   2280
gcctcgtgat acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt   2340
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac   2400
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa   2460
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat   2520
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc   2580
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga   2640
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg   2700
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc   2760
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag   2820
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc   2880
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg   2940
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg   3000
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac   3060
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac   3120
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg   3180
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg   3240
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg   3300
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac   3360
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg   3420
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg   3480
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc   3540
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc   3600
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt   3660
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc   3720
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact   3780
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac   3840
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag   3900
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg   3960
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg   4020
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga   4080
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt   4140
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct   4200
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg   4260
aggaagcgga aga                                                      4273
<210>40
<211>7330
<212>DNA
<213>载体pFPMT-CL-H6-K-E1
<220>
<221>misc_feature
<222>(1098)..(1099)
<223>N是任何核苷酸
<220>
<221>misc_feature
<222>(1277)..(1278)
<223>N是任何核苷酸
<400>40
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc     60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat    120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt    180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc    240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt    300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttacc agttcatcat    360
catatcccaa gccatacggt gacctgttat gtggccggga tagattgagc aattgcagtc    420
ctgcaccgtc tcatgccggc gaggcgagat ggtgaacagc tgggagacga ggaagacaga    480
tccgcagaga tcccccacgt acatagcgga acagaaagca gccgccccaa cgagcaaatc    540
gacgtggcgt cgtattgtcg tagtggggac gctggcgttc ctagctgcga gcgtgggggt    600
gagcgctacc cagcagcggg aagagttgtt ctcccgaacg cagggcacgc acccgggggt    660
gtgcatgatc atgtccgctg cctcatacac aatgcttgag ttggagcagt cgttcgtgac    720
atggtacatc ccggacacgt tgcgcacctc atatttgtga tggtgatggt ggtgtcctag    780
tgctgctagt ggtaggaagc atagtactag tattagtagg cttcgcatga attcccgatg    840
aaggcagaga gcgcaaggag gcggtattta tagtgccatt cccctctctg agagacccgg    900
atggtagtcg agtgttatcg gagacagctt gatgtagact ccgtgcctgc cggtcctctt    960
attggcggac accagtgaga caccccggaa cttgctgttt ttctgcaaaa tccggggtga   1020
ccagtgggag cctatttgca cacacgagcg ggacacccca ctctggtgaa gagtgccaaa   1080
gtcattcttt ttcccgtnnc ggggcagccg attgcatgtt ttaggaaaat attacctttg   1140
ctacaccctg tcagatttac cctccacaca tatatattcc gtcacctcca gggactattc   1200
ttggctcgtt gcgccgccgc ggaagatatc cagaagctgt gttttccgag agactcggtt   1260
ggcgcctggt atatttnnag gatgtcgcgc tgcctcacgt cccggtaccc aggaacgcgg   1320
tgggatctcg ggcccatcga agactgtgct ccagactgct cgcccagcag gtgtttcttg   1380
attgccgcct ctaaatagtc cgcgcatcgc cggtaacatt tttccagctc ggagtttgcg   1440
tttagataca tttctgcgat gccaaaggag cctgcagatt ataacctcgg atgctgtcat   1500
tcagcgcttt taatttgacc tccagatagt tgctgtattt ctgttccatt ggctgctgga   1560
cgttcgtata actcgagtta ttgttgcgct ctgcctcggc gtactggctc atgactgact   1620
gcggtcgctt ctcgagtgtt ctcgcaacag gacgcctgca ggtcatcgag tcgagctggc   1680
gccgaaactg gcggatctga cctccacact gccctgtatc tctatccacc gggaaccgcc   1740
tcctgccgtt ccagaatgtt gttcaagtgg tagctctgtg cggtcaatga aggcgttatt   1800
gccggtgaaa tctttgggaa gcggtttatc ctcggggaag attacgaaat tcccgcgcgt   1860
cgttgcgctt cctggatctc gaggaagatc gttctccgcg tcgaggagat cgttctccgc   1920
gtcgacctgc aggcatgcaa gcttctggta aacgttgtag tactctgaaa caaggcccta   1980
gcactctgat ctgtttctct tgggtagcgg tgagtggttt attggagttc actggtttca   2040
gcacatctgt catctagaca atattgttac taaatttttt tgaactacaa ttgttcgtaa   2100
ttcatctatt attatacatc ctcgtcagca atttctggca gacggagttt actaacgtct   2160
tgagtatgag gccgagaatc cagctctgtg gccatactca gtcttgacag cctgctgatg   2220
tggctgcgtt caacgcaata agcgtgtcct ccgactccga gttgtgctcg ttatcgtcgt   2280
tctcatcctc ggaaaaatca cacgaaagaa catactcacc agtaggcttt ctggtccctg   2340
gggcacggct gtttctgacg tattccggcg ttgataatag ctcgaaagtg aacgccgagt   2400
cgcgggagtc gaccgatgcc cttgagagcc ttcaacccag tcagctcctt ccggtgggcg   2460
cggggcatga ctatcgtcgc cgcacttatg actgtcttct ttatcatgca actcgtagga   2520
caggtgccgg cagcgctctg ggtcattttc ggcgaggacc gctttcgctg gagcgcgacg   2580
atgatcggcc tgtcgcttgc ggtattcgga atcttgcacg ccctcgctca agccttcgtc   2640
actggtcccg ccaccaaacg tttcggcgag aagcaggcca ttatcgccgg catggcggcc   2700
gacgcgctgg gctacgtctt gctggcgttc gcgacgcgag gctggatggc cttccccatt   2760
atgattcttc tcgcttccgg cggcatcggg atgcccgcgt tgcaggccat gctgtccagg   2820
caggtagatg acgaccatca gggacagctt caaggatcgc tcgcggctct taccagccta   2880
acttcgatca ctggaccgct gatcgtcacg gcgatttatg ccgcctcggc gagcacatgg   2940
aacgggttgg catggattgt aggcgccgcc ctataccttg tctgcctccc cgcgttgcgt   3000
cgcggtgcat ggagccgggc cacctcgacc tgaatggaag ccggcggcac ctcgctaacg   3060
gattcaccac tccaagaatt ggagccaatc aattcttgcg gagaactgtg aatgcgcaaa   3120
ccaacccttg gcagaacata tccatcgcgt ccgccatctc cagcagccgc acgcggcgca   3180
tcgggggggg gggggggggg ggggggcaaa caattcatca tttttttttt attctttttt   3240
ttgatttcgg tttctttgaa atttttttga ttcggtaatc tccgaacaga aggaagaacg   3300
aaggaaggag cacagactta gattggtata tatacgcata tgtagtgttg aagaaacatg   3360
aaattgccca gtattcttaa cccaactgca cagaacaaaa acctgcagga aacgaagata   3420
aatcatgtcg aaagctacat ataaggaacg tgctgctact catcctagtc ctgttgctgc   3480
caagctattt aatatcatgc acgaaaagca aacaaacttg tgtgcttcat tggatgttcg   3540
taccaccaag gaattactgg agttagttga agcattaggt cccaaaattt gtttactaaa   3600
aacacatgtg gatatcttga ctgatttttc catggagggc acagttaagc cgctaaaggc   3660
attatccgcc aagtacaatt ttttactctt cgaagacaga aaatttgctg acattggtaa   3720
tacagtcaaa ttgcagtact ctgcgggtgt atacagaata gcagaatggg cagacattac   3780
gaatgcacac ggtgtggtgg gcccaggtat tgttagcggt ttgaagcagg cggcagaaga   3840
agtaacaaag gaacctagag gccttttgat gttagcagaa ttgtcatgca agggctccct   3900
atctactgga gaatatacta agggtactgt tgacattgcg aagagcgaca aagattttgt   3960
tatcggcttt attgctcaaa gagacatggg tggaagagat gaaggttacg attggttgat   4020
tatgacaccc ggtgtgggtt tagatgacaa gggagacgca ttgggtcaac agtatagaac   4080
cgtggatgat gtggtctcta caggatctga cattattatt gttggaagag gactatttgc   4140
aaagggaagg gatgctaagg tagagggtga acgttacaga aaagcaggct gggaagcata   4200
tttgagaaga tgcggccagc aaaactaaaa aactgtatta taagtaaatg catgtatact   4260
aaactcacaa attagagctt caatttaatt atatcagtta ttacccggga atctcggtcg   4320
taatgatttt tataatgacg aaaaaaaaaa aattggaaag aaaagccccc cccccccccc   4380
cccccccccc cccccccccg cagcgttggg tcctggccac gggtgcgcat gatcgtgctc   4440
ctgtcgttga ggacccggct aggctggcgg ggttgcctta ctggttagca gaatgaatca   4500
ccgatacgcg agcgaacgtg aagcgactgc tgctgcaaaa cgtctgcgac ctgagcaaca   4560
acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgccc   4620
tgcaccatta tgttccggat ctgcatcgca ggatgctgct ggctaccctg tggaacacct   4680
acatctgtat taacgaagcg ctggcattga ccctgagtga tttttctctg gtcccgccgc   4740
atccataccg ccagttgttt accctcacaa cgttccagta accgggcatg ttcatcatca   4800
gtaacccgta tcgtgagcat cctctctcgt ttcatcggta tcattacccc catgaacaga   4860
aattccccct tacacggagg catcaagtga ccaaacagga aaaaaccgcc cttaacatgg   4920
cccgctttat cagaagccag acattaacgc ttctggagaa actcaacgag ctggacgcgg   4980
atgaacaggc agacatctgt gaatcgcttc acgaccacgc tgatgagctt taccgcagct   5040
gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg   5100
tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg   5160
gtgttggcgg gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata   5220
ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga   5280
aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct   5340
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc   5400
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg   5460
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg   5520
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg   5580
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac   5640
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca   5700
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt   5760
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc   5820
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag   5880
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac   5940
tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt   6000
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa   6060
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg   6120
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa   6180
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat   6240
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc   6300
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat   6360
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc   6420
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc   6480
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag   6540
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg   6600
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg   6660
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag   6720
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt   6780
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga   6840
atagtgtatg cggcgaccga gttgctcttg cccggcgtca acacgggata ataccgcgcc   6900
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc   6960
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc   7020
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc   7080
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca   7140
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat   7200
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt   7260
ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt   7320
tcgtcttcaa                                                          7330
<210>41
<211>5202
<212>DNA
<213>载体pYIG5
<400>41
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc     60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc    120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa    180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gaatttaata    240
cgactcacta tagggaattc gaggatcctt caatatgcgc acatacgctg ttatgttcaa    300
ggtcccttcg tttaagaacg aaagcggtct tccttttgag ggatgtttca agttgttcaa    360
atctatcaaa tttgcaaatc cccagtctgt atctagagcg ttgaatcggt gatgcgattt    420
gttaattaaa ttgatggtgt caccattacc aggtctagat ataccaatgg caaactgagc    480
acaacaatac cagtccggat caactggcac catctctccc gtagtctcat ctaatttttc    540
ttccggatga ggttccagat ataccgcaac acctttatta tggtttccct gagggaataa    600
tagaatgtcc cattcgaaat caccaattct aaacctgggc gaattgtatt tcgggtttgt    660
taactcgttc cagtcaggaa tgttccacgt gaagctatct tccagcaaag tctccacttc    720
ttcatcaaat tgtggagaat actcccaatg ctcttatcta tgggacttcc gggaaacaca    780
gtaccgatac ttcccaattc gtcttcagag ctcattgttt gtttgaagag actaatcaaa    840
gaatcgtttt ctcaaaaaaa ttaatatctt aactgatagt ttgatcaaag gggcaaaacg    900
taggggcaaa caaacggaaa aatcgtttct caaattttct gatgccaaga actctaacca    960
gtcttatcta aaaattgcct tatgatccgt ctctccggtt acagcctgtg taactgatta   1020
atcctgcctt tctaatcacc attctaatgt tttaattaag ggattttgtc ttcattaacg   1080
gctttcgctc ataaaaatgt tatgacgttt tgcccgcagg cgggaaacca tccacttcac   1140
gagactgatc tcctctgccg gaacaccggg catctccaac ttataagttg gagaaataag   1200
agaatttcag attgagagaa tgaaaaaaaa aaaccctgaa aaaaaaggtt gaaaccagtt   1260
ccctgaaatt attcccctac ttgactaata agtatataaa gacggtaggt attgattgta   1320
attctgtaaa tctatttctt aaacttctta aattctactt ttatagttag tctttttttt   1380
agttttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac accatgagat   1440
ttccttcaat ttttactgca gttttattcg cagcatcctc cgcattagct gctccagtca   1500
acactacaac agaagatgaa acggcacaaa ttccggctga agctgtcatc ggttactcag   1560
atttagaagg ggatttcgat gttgctgttt tgccattttc caacagcaca aataacgggt   1620
tattgtttat aaatactact attgccagca ttgctgctaa agaagaaggg gtatctctag   1680
ataaaaggcc tgtcgacggt accagatctc gacttggttg aacacgttgc caaggcttaa   1740
gtgaatttac tttaaagtct tgcatttaaa taaattttct ttttatagct ttatgactta   1800
gtttcaattt atatactatt ttaatgacat tttcgattca ttgattgaaa gctttgtgtt   1860
ttttcttgat gcgctattgc attgttcttg tctttttcgc cacatgtaat atctgtagta   1920
gatacctgat acattgtgga tgctgagtga aattttagtt aataatggag gcgctcttaa   1980
taattttggg gatattggct ttttttttta aagtttacaa atgaattttt tccgccagga   2040
taacgattct gaagttactc ttagcgttcc tatcggtaca gccatcaaat catgcctata   2100
aatcatgcct atatttgcgt gcagtcagta tcatctacat gaaaaaaact cccgcaattt   2160
cttatagaat acgttgaaaa ttaaatgtac gcgccaagat aagataacat atatctagct   2220
agatgcagta atatacacag attcccgcgg acgtgggaag gaaaaaatta gataacaaaa   2280
tctgagtgat atggaaattc cgctgtatag ctcatatctt tcccttcaac accagaaatg   2340
taaaaatctt gttacgaagg atctttttgc taatgtttct cgctcaatcc tcatttcttc   2400
cctacgaaga gtcaaatcta cttgttttct gccggtatca agatccatat cttctagttt   2460
caccatcaaa gtccaatttc tagtatacag tttatgtccc aacgtaacag acaatcaaaa   2520
ttggaaagga taagtatcct tcaaagaatg attctgcgct ggctcctgaa ccgcctaatg   2580
ggaacagaga agtccaaaac gatgctataa gaaccagaaa taaaacgata aaaccatacc   2640
aggatccaag cttggcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg   2700
ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag   2760
aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tgggaaattg   2820
taaacgttaa tattttgtta aaattcgcgt taaatttttg ttaaatcagc tcatttttta   2880
accaataggc cgaaatcggc aaaatccctt ataaatcaaa agaatagacc gagatagggt   2940
tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca   3000
aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca ccctaatcaa   3060
gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat   3120
ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag   3180
gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg   3240
ccgcgcttaa tgcgccgcta cagggcgcgt caggtggcac ttttcgggga aatgtgcgcg   3300
gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat   3360
aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc   3420
gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa   3480
cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac   3540
tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga   3600
tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag   3660
agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca   3720
cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca   3780
tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa   3840
ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc   3900
tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa   3960
cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag   4020
actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct   4080
ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac   4140
tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa   4200
ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt   4260
aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat   4320
ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg   4380
agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc   4440
ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg   4500
tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag   4560
cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact   4620
ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg   4680
gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc   4740
ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg   4800
aactgagata cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg   4860
cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag   4920
ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc   4980
gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct   5040
ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc   5100
ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc   5160
gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga ag                      5202
<210>42
<211>5613
<212>DNA
<213>载体pYIG5E1H6
<400>42
ggatccttca atatgcgcac atacgctgtt atgttcaagg tcccttcgtt taagaacgaa     60
agcggtcttc cttttgaggg atgtttcaag ttgttcaaat ctatcaaatt tgcaaatccc    120
cagtctgtat ctagagcgtt gaatcggtga tgcgatttgt taattaaatt gatggtgtca    180
ccattaccag gtctagatat accaatggca aactgagcac aacaatacca gtccggatca    240
actggcacca tctctcccgt agtctcatct aatttttctt ccggatgagg ttccagatat    300
accgcaacac ctttattatg gtttccctga gggaataata gaatgtccca ttcgaaatca    360
ccaattctaa acctgggcga attgtatttc gggtttgtta actcgttcca gtcaggaatg    420
ttccacgtga agctatcttc cagcaaagtc tccacttctt catcaaattg tggagaatac    480
tcccaatgct cttatctatg ggacttccgg gaaacacagt accgatactt cccaattcgt    540
cttcagagct cattgtttgt ttgaagagac taatcaaaga atcgttttct caaaaaaatt    600
aatatcttaa ctgatagttt gatcaaaggg gcaaaacgta ggggcaaaca aacggaaaaa    660
tcgtttctca aattttctga tgccaagaac tctaaccagt cttatctaaa aattgcctta    720
tgatccgtct ctccggttac agcctgtgta actgattaat cctgcctttc taatcaccat    780
tctaatgttt taattaaggg attttgtctt cattaacggc tttcgctcat aaaaatgtta    840
tgacgttttg cccgcaggcg ggaaaccatc cacttcacga gactgatctc ctctgccgga    900
acaccgggca tctccaactt ataagttgga gaaataagag aatttcagat tgagagaatg    960
aaaaaaaaaa accctgaaaa aaaaggttga aaccagttcc ctgaaattat tcccctactt   1020
gactaataag tatataaaga cggtaggtat tgattgtaat tctgtaaatc tatttcttaa   1080
acttcttaaa ttctactttt atagttagtc ttttttttag ttttaaaaca ccaagaactt   1140
agtttcgaat aaacacacat aaacaaacac catgagattt ccttcaattt ttactgcagt   1200
tttattcgca gcatcctccg cattagctgc tccagtcaac actacaacag aagatgaaac   1260
ggcacaaatt ccggctgaag ctgtcatcgg ttacttagat ttagaagggg atttcgatgt   1320
tgctgttttg ccattttcca acagcacaaa taacgggtta ttgtttataa atactactat   1380
tgccagcatt gctgctaaag aagaaggggt atctctagat aaaaggtatg aggtgcgcaa   1440
cgtgtccggg atgtaccatg tcacgaacga ctgctccaac tcaagcattg tgtatgaggc   1500
agcggacatg atcatgcaca cccccgggtg cgtgccctgc gttcgggaga acaactcttc   1560
ccgctgctgg gtagcgctca cccccacgct cgcagctagg aacgccagcg tccccactac   1620
gacaatacga cgccacgtcg atttgctcgt tggggcggct gctttctgtt ccgctatgta   1680
cgtgggggat ctctgcggat ctgtcttcct cgtctcccag ctgttcacca tctcgcctcg   1740
ccggcatgag acggtgcagg actgcaattg ctcaatctat cccggccaca taacaggtca   1800
ccgtatggct tgggatatga tgatgaactg gcaccaccac catcaccatt aaagatctcg   1860
acttggttga acacgttgcc aaggcttaag tgaatttact ttaaagtctt gcatttaaat   1920
aaattttctt tttatagctt tatgacttag tttcaattta tatactattt taatgacatt   1980
ttcgattcat tgattgaaag ctttgtgttt tttcttgatg cgctattgca ttgttcttgt   2040
ctttttcgcc acatgtaata tctgtagtag atacctgata cattgtggat gctgagtgaa   2100
attttagtta ataatggagg cgctcttaat aattttgggg atattggctt ttttttttaa   2160
agtttacaaa tgaatttttt ccgccaggat aacgattctg aagttactct tagcgttcct   2220
atcggtacag ccatcaaatc atgcctataa atcatgccta tatttgcgtg cagtcagtat   2280
catctacatg aaaaaaactc ccgcaatttc ttatagaata cgttgaaaat taaatgtacg   2340
cgccaagata agataacata tatctagcta gatgcagtaa tatacacaga ttcccgcgga   2400
cgtgggaagg aaaaaattag ataacaaaat ctgagtgata tggaaattcc gctgtatagc   2460
tcatatcttt cccttcaaca ccagaaatgt aaaaatcttg ttacgaagga tctttttgct   2520
aatgtttctc gctcaatcct catttcttcc ctacgaagag tcaaatctac ttgttttctg   2580
ccggtatcaa gatccatatc ttctagtttc accatcaaag tccaatttct agtatacagt   2640
ttatgtccca acgtaacaga caatcaaaat tggaaaggat aagtatcctt caaagaatga   2700
ttctgcgctg gctcctgaac cgcctaatgg gaacagagaa gtccaaaacg atgctataag   2760
aaccagaaat aaaacgataa aaccatacca ggatccaagc ttggcactgg ccgtcgtttt   2820
acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc   2880
ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt   2940
gcgcagcctg aatggcgaat gggaaattgt aaacgttaat attttgttaa aattcgcgtt   3000
aaatttttgt taaatcagct cattttttaa ccaataggcc gaaatcggca aaatccctta   3060
taaatcaaaa gaatagaccg agatagggtt gagtgttgtt ccagtttgga acaagagtcc   3120
actattaaag aacgtggact ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg   3180
cccactacgt gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact   3240
aaatcggaac cctaaaggga gcccccgatt tagagcttga cggggaaagc cggcgaacgt   3300
ggcgagaaag gaagggaaga aagcgaaagg agcgggcgct agggcgctgg caagtgtagc   3360
ggtcacgctg cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc   3420
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca   3480
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa   3540
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt   3600
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca   3660
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag   3720
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc   3780
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca   3840
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt   3900
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct   3960
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt   4020
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga   4080
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact   4140
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc   4200
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga   4260
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt   4320
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga   4380
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact   4440
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga   4500
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt   4560
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca   4620
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct   4680
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta   4740
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct   4800
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc   4860
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca   4920
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga   4980
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg   5040
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt   5100
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag   5160
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt   5220
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt   5280
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga   5340
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta   5400
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa   5460
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat   5520
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta   5580
cgaatttaat acgactcact atagggaatt cga                                5613
<210>43
<211>13020
<212>DNA
<213>载体pSY1
<400>43
atcgataagc ttttcaattc aattcatcat ttttttttta ttcttttttt tgatttcggt     60
ttctttgaaa tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc    120
acagacttag attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag    180
tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga    240
aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta    300
atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg    360
aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg    420
atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca    480
agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat    540
tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg    600
gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg    660
aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag    720
aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta    780
ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg    840
gtgtgggttt agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg    900
tggtctctac aggatctgac attattattg ttggaagagg actatttgca aagggaaggg    960
atgctaaggt agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat   1020
gcggccagca aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa   1080
ttagagcttc aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt   1140
ataatgacga aaaaaaaaaa attggaaaga aaaagcttta atgcggtagt ttatcacagt   1200
taaattgcta acgcagtcag gcaccgtgta tgaaatctaa caatgcgctc atcgtcatcc   1260
tcggcaccgt caccctggat gctgtaggca taggcttggt tatgccggta ctgccgggcc   1320
tcttgcggga tatcgtccat tccgacagca tcgccagtca ctatggcgtg ctgctagcgc   1380
tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgctttg   1440
gccgccgccc agtcctgctc gcttcgctac ttggagccac tatcgactac gcgatcatgg   1500
cgaccacacc cgtcctgtgg atcctctacg ccggacgcat cgtggccggc atcaccggcg   1560
ccacaggtgc ggttgctggc ccctatatcg ccgacatcac cgatggggaa gatcgggctc   1620
gccacttcgg gctcatgagc gcttgtttcg gcgtgggtat ggtggcaggc cccgtggccg   1680
ggggactgtt gggcgccatc tccttgcatg caccattcct tgcggcggcg gtgctcaacg   1740
gcctcaacct actactgggc tgcttcctaa tgcaggagtc gcataaggga gagcgtcgac   1800
cgatgccctt gagagccttc aacccagtca gctccttccg gtgggcgcgg ggcatgacta   1860
tcgtcgccgc acttatgact gtcttcttta tcatgcaact cgtaggacag gtgccggcag   1920
cgctctgggt cattttcggc gaggaccgct ttcgctggag cgcgacgatg atcggcctgt   1980
cgcttgcggt attcggaatc ttgcacgccc tcgctcaagc cttcgtcact ggtcccgcca   2040
ccaaacgttt cggcgagaag caggccatta tcgccggcat ggcggccgac gcgctgggct   2100
acgtcttgct ggcgttcgcg acgcgaggct ggatggcctt ccccattatg attcttctcg   2160
cttccggcgg catcgggatg cccgcgttgc aggccatgct gtccaggcag gtagatgacg   2220
accatcaggg acagcttcaa ggatcgctcg cggctcttac cagcctaact tcgatcactg   2280
gaccgctgat cgtcacggcg atttatgccg cctcggcgag cacatggaac gggttggcat   2340
ggattgtagg cgccgcccta taccttgtct gcctccccgc gttgcgtcgc ggtgcatgga   2400
gccgggccac ctcgacctga atggaagccg gcggcacctc gctaacggat tcaccactcc   2460
aagaattgga gccaatcaat tcttgcggag aactgtgaat gcgcaaacca acccttggca   2520
gaacatatcc atcgcgtccg ccatctccag cagccgcacg cggcgcatct cgggcagcgt   2580
tgggtcctgg ccacgggtgc gcatgatcgt gctcctgtcg ttgaggaccc ggctaggctg   2640
gcggggttgc cttactggtt agcagaatga atcaccgata cgcgagcgaa cgtgaagcga   2700
ctgctgctgc aaaacgtctg cgacctgagc aacaacatga atggtcttcg gtttccgtgt   2760
ttcgtaaagt ctggaaacgc ggaagtcagc gccctgcacc attatgttcc ggatctgcat   2820
cgcaggatgc tgctggctac cctgtggaac acctacatct gtattaacga agcgctggca   2880
ttgaccctga gtgatttttc tctggtcccg ccgcatccat accgccagtt gtttaccctc   2940
acaacgttcc agtaaccggg catgttcatc atcagtaacc cgtatcgtga gcatcctctc   3000
tcgtttcatc ggtatcatta cccccatgaa cagaaattcc cccttacacg gaggcatcaa   3060
gtgaccaaac aggaaaaaac cgcccttaac atggcccgct ttatcagaag ccagacatta   3120
acgcttctgg agaaactcaa cgagctggac gcggatgaac aggcagacat ctgtgaatcg   3180
cttcacgacc acgctgatga gctttaccgc agctgcctcg cgcgtttcgg tgatgacggt   3240
gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta agcggtgccg   3300
ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggcgcagcca   3360
tgacccagtc acgtagcgat agcggagtgt atactggctt aactatgcgg catcagagca   3420
gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa   3480
ataccgcatc aggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg   3540
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg   3600
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa   3660
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg   3720
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc   3780
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc   3840
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc   3900
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg   3960
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc   4020
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga   4080
gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc   4140
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac   4200
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg   4260
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc   4320
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa   4380
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta   4440
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt   4500
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag   4560
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca   4620
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc   4680
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt   4740
tgttgccatt gctgcaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag   4800
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt   4860
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat   4920
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt   4980
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc   5040
ttgcccggcg tcaacacggg ataataccgc gccacatagc agaactttaa aagtgctcat   5100
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag   5160
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt   5220
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg   5280
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta   5340
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc   5400
gcgcacattt ccccgaaaag tgccacctga cgtctaagaa accattatta tcatgacatt   5460
aacctataaa aaataggcgt atcacgaggc cctttcgtct tcaagaattc tcatgtttga   5520
cagcttatca tcgatccact tgtatatttg gatgaatttt tgaggaattc tgaaccagtc   5580
ctaaaacgag taaataggac cggcaattct tcaagcaata aacaggaata ccaattatta   5640
aaagataact tagtcagatc gtacaataaa gctttgaaga aaaatgcgcc ttattcaatc   5700
tttgcataaa aaaatggccc aaaatctcac attggaagac atttgatgac ctcatttctt   5760
tcaatgaagg gcctaacgga gttgactaat gttgtgggaa attggaccga taagcgtgct   5820
tctgccgtgg ccaggacaac gtatactcat cagataacag caatacctga tcactacttc   5880
gcactagttt ctcggtacta tgcatatgat ccaatatcaa aggaaatgat agcattgaag   5940
gatgagacta atccaattga ggagtggcag catatagaac agctaaaggg tagtgctgaa   6000
ggaagcatac gataccccgc atggaatggg ataatatcac aggaggtact agactacctt   6060
tcatcctaca taaatagacg catataagta cgcatttaag cataaacacg cactatgccg   6120
ttcttctcat gtatatatat atacaggcaa cacgcagata taggtgcgac gtgaacagtg   6180
agctgtatgt gcgcagctcg cgttgcattt tcggaagcgc tcgttttcgg aaacgctttg   6240
aagttcctat tccgaagttc ctattctcta gaaagtatag gaacttcaga gcgcttttga   6300
aaaccaaaag cgctctgaag acgcactttc aaaaaaccaa aaacgcaccg gactgtaacg   6360
agctactaaa atattgcgaa taccgcttcc acaaacattg ctcaaaagta tctctttgct   6420
atatatctct gtgctatatc cctatataac catcccatcc acctttcgct ccttgaactt   6480
gcatctaaac tcgacctcta cattttttat gtttatctct agtattacct cttagacaaa   6540
aaaattgtag taagaactat tcatagagtt aatcgaaaac aatacgaaaa tgtaaacatt   6600
tcctatacgt agtatataga gacaaaatag aagaaaccgt tcataatttt ctgaccaatg   6660
aagaatcatc aacgctatca ctttctgttc acaaagtatg cgcaatccac atcggtatag   6720
aatataatcg gggatgcctt tatcttgaaa aaatgcaccc gcagcttcgc tagtaatcag   6780
taaacgcggg aagtggagtc aggctttttt tatggaagag aaaatagaca ccaaagtagc   6840
cttcttctaa ccttaacgga cctacagtgc aaaaagttat caagagactg cattatagag   6900
cgcacaaagg agaaaaaaag taatctaaga tgctttgtta gaaaaatagc gctctcggga   6960
tgcatttttg tagaacaaaa aagaagtata gattcttgtt ggtaaaatag cgctctcgcg   7020
ttgcatttct gttctgtaaa aatgcagctc agattctttg tttgaaaaat tagcgctctc   7080
gcgttgcatt tttgttttac aaaaatgaag cacagattct tcgttggtaa aatagcgctt   7140
tcgcgttgca tttctgttct gtaaaaatgc agctcagatt ctttgtttga aaaattagcg   7200
ctctcgcgtt gcatttttgt tctacaaaat gaagcacaga tgcttcgtta acaaagatat   7260
gctattgaag tgcaagatgg aaacgcagaa aatgaaccgg ggatgcgacg tgcaagatta   7320
cctatgcaat agatgcaata gtttctccag gaaccgaaat acatacattg tcttccgtaa   7380
agcgctagac tatatattat tatacaggtt caaatatact atctgtttca gggaaaactc   7440
ccaggttcgg atgttcaaaa ttcaatgatg ggtaacaagt acgatcgtaa atctgtaaaa   7500
cagtttgtcg gatattaggc tgtatctcct caaagcgtat tcgaatatca ttgagaagct   7560
gcattttttt tttttttttt tttttttttt tttttatata tatttcaagg atataccatt   7620
gtaatgtctg cccctaagaa gatcgtcgtt ttgccaggtg accacgttgg tcaagaaatc   7680
acagccgaag ccattaaggt tcttaaagct atttctgatg ttcgttccaa tgtcaagttc   7740
gatttcgaaa atcatttaat tggtggtgct gctatcgatg ctacaggtgt cccacttcca   7800
gatgaggcgc tggaagcctc caagaaggtt gatgccgttt tgttaggtgc tgtgggtggt   7860
cctaaatggg gtaccggtag tgttagacct gaacaaggtt tactaaaaat ccgtaaagaa   7920
cttcaattgt acgccaactt aagaccatgt aactttgcat ccgactctct tttagactta   7980
tctccaatca agccacaatt tgctaaaggt actgacttcg ttgttgtcag agaattagtg   8040
ggaggtattt actttggtaa gagaaaggaa gacgatggtg atggtgtcgc ttgggatagt   8100
gaacaataca ccgttccaga agtgcaaaga atcacaagaa tggccgcttt catggcccta   8160
caacatgagc caccattgcc tatttggtcc ttggataaag ctaatgtttt ggcctcttca   8220
agattatgga gaaaaactgt ggaggaaacc atcaagaacg aattccctac attgaaggtt   8280
caacatcaat tgattgattc tgccgccatg atcctagtta agaacccaac ccacctaaat   8340
ggtattataa tcaccagcaa catgtttggt gatatcatct ccgatgaagc ctccgttatc   8400
ccaggttcct tgggtttgtt gccatctgcg tccttggcct ctttgccaga caagaacacc   8460
gcatttggtt tgtacgaacc atgccacggt tctgctccag atttgccaaa gaataaggtt   8520
gaccctatcg ccactatctt gtctgctgca atgatgttga aattgtcatt gaacttgcct   8580
gaagaaggta aggccattga agatgcagtt aaaaaggttt tggatgcagg tatcagaact   8640
ggtgatttag gtggttccaa cagtaccacc gaagtcggtg atgctgtcgc cgaagaagtt   8700
aagaaaatcc ttgcttaaaa agattctctt tttttatgat atttgtacaa aaaaaaaaaa   8760
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcagc gtcacatcgg ataataatga   8820
tggcagccat tgtagaagtg ccttttgcat ttctagtctc tttctcggtc tagctagttt   8880
tactacatcg cgaagataga atcttagatc acactgcctt tgctgagctg gatcatatga   8940
gtaacaaaag agtggtaagg cctcgttaaa ggacaaggac ctgagcggaa gtgtatcgta   9000
aagtagacgg agtatactag tatagtctat agtccgtgga attctaagtg ccagctttat   9060
aatgtcattc tccttactac agacccgcct gaaagtagac acatcatcat cagtaagctt   9120
tgacaaaaag cattgagtag ctaactcttc tatgcaatct atagctgttt tataaggcat   9180
tcaatggaca gattgaggtt tttgaaacat actagtgaaa ttagccttaa tcccttctcg   9240
aagttaatca tgcattatgg tgtaaaaaat gcaactcgcg ttgctctact ttttcccgaa   9300
tttccaaata cgcagctggg gtgattgctc gatttcgtaa cgaaagtttt gtttataaaa   9360
accgcgaaaa ccttctgtaa cagatagatt tttacagcgc tgatatacaa tgacatcagc   9420
tgtaatggaa aataactgaa atatgaatgg cgagagactg cttgcttgta ttaagcaatg   9480
tattatgcag cacttccaac ctatggtgta cgatgaaagt aggtgtgtaa tcgagacgac   9540
aagggggact tttccagttc ctgatcatta taagaaatac aaaacgttag catttgcatt   9600
tgttggacat gtactgaata cagacgacac accggtaatt gaaaaagaac tggattggcc   9660
tgatcctgca ctagtgtaca atacaattgt cgatcgaatc ataaatcacc cagaattatc     9720
acagtttata tcggttgcat ttattagtca gttaaaggcc accatcggag agggtttaga     9780
tattaatgta aaaggcacgc taaaccgcag gggaaagggt atcagaaggc ctaaaggcgt     9840
attttttaga tacatggaat ctccatttgt caatacaaag gtcactgcat tcttctctta     9900
tcttcgagat tataataaaa ttgcctcaga atatcacaat aatactaaat tcattctcac     9960
gttttcatgt caagcatatt gggcatctgg cccaaacttc tccgccttga agaatgttat    10020
ttggtgctcc ataattcatg aatacatttc taagtttgtg gaaagagaac aggataaagg    10080
tcatatagga gatcaggagc taccgcctga agaggaccct tctcgtgaac taaacaatgt    10140
acaacatgaa gtcaatagtt taacggaaca agatgcggag gcggatgaag gattgtgggg    10200
tgaaatagat tcattatgtg aaaaatggca gtctgaagcg gagagtcaaa ctgaggcgga    10260
gataatagcc gacaggataa ttggaaatag ccagaggatg gcgaacctca aaattcgtcg    10320
tacaaagttc aaaagtgtct tgtatcatat actaaaggaa ctaattcaat ctcagggaac    10380
cgtaaaggtt tatcgcggta gtagtttttc acacgattcg ataaagataa gcttacatta    10440
tgaagagcag catattacag ccgtatgggt ctacttgata gtaaaatttg aagagcattg    10500
gaagcctgtt gatgtagagg tcgagtttag atgcaagttc aaggagcgaa aggtggatgg    10560
gtaggttata tagggatata gcacagagat atatagcaaa gagatacttt tgaggcaatg    10620
tttgtggaag cggtattcgc aatattttag tagctcgtta cagtccggtg cgtttttggt    10680
tttttgaaag tgcgtcttca gagcgctttt ggttttcaaa agcgctctga agttcctata    10740
ctttctagag aataggaact tcggaatagg aacttcaaag cgtttccgaa aacgagcgct  10800
tccgaaaatg caacgcgagc tgcgcacata cagctcactg ttcacgtcgc acctatatct  10860
gcgtgttgcc tgtatatata tatacatgag aagaacggca tagtgcgtgt ttatgcttaa  10920
atgcgtactt atatgcgtct atttatgtag gatgaaaggt agtctagtac ctcctgtgat  10980
attatcccat tccatgcggg gtatcgtatg cttccttcag cactaccctt tagctgttct  11040
atatgctgcc actcctcaat tggattagtc tcatccttca atgcattcat ttcctttgat  11100
attggatcat accctagaag tattacgtga ttttctgccc cttaccctcg ttgctactct  11160
cctttttttc gtgggaaccg ctttagggcc ctcagtgatg gtgttttgta atttatatgc  11220
tcctcttgca tttgtgtctc tacttcttgt tcgcctggag ggaacttctt catttgtatt  11280
agcatggttc acttcagtcc ttccttccaa ctcactcttt ttttgctgta aacgattctc  11340
tgccgccagt tcattgaaac tattgaatat atcctttaga gattccggga tgaataaatc  11400
acctattaaa gcagcttgac gatctggtgg aactaaagta agcaattggg taacgacgct  11460
tacgagcttc ataacatctt cttccgttgg agctggtggg actaataact gtgtacaatc  11520
catttttctc atgagcattt cggtagctct cttcttgtct ttctcgggca atcttcctat  11580
tattatagca atagatttgt atagttgctt tctattgtct aacagcttgt tattctgtag  11640
catcaaatct atggcagcct gacttgcttc ttgtgaagag agcataccat ttccaatcga  11700
agatacgctg gaatcttctg cgctagaatc aagaccatac ggcctaccgg ttgtgagaga  11760
ttccatgggc cttatgacat atcctggaaa gagtagctca tcagacttac gtttactctc  11820
tatatcaata tctacatcag gagcaatcat ttcaataaac agccgacata catcccagac  11880
gctataagct gtacgtgctt ttaccgtcag attcttggct gtttcaatgt cgtccatttt    11940
ggttttcttt taccagtatt gttcgtttga taatgtattc ttgcttatta cattataaaa    12000
tctgtgcaga tcacatgtca aaacaacttt ttatcacaag atagtaccgc aaaacgaacc    12060
tgcgggccgt ctaaaaatta aggaaaagca gcaaaggtgc atttttaaaa tatgaaatga    12120
agataccgca gtaccaatta ttttcgcagt acaaataatg cgcggccggt gcatttttcg    12180
aaagaacgcg agacaaacag gacaattaaa gttagttttt cgagttagcg tgtttgaata    12240
ctgcaagata caagataaat agagtagttg aaactagata tcaattgcac acaagatcgg    12300
cgctaagcat gccacaattt ggtatattat gtaaaacacc acctaaggtg cttgttcgtc    12360
agtttgtgga aaggtttgaa agaccttcag gtgagaaaat agcattatgt gctgctgaac    12420
taacctattt atgttggatg attacacata acggaacagc aatcaagaga gccacattca    12480
tgagctataa tactatcata agcaattcgc tgagtttcga tattgtcaat aaatcactcc    12540
agtttaaata caagacgcaa aaagcaacaa ttctggaagc ctcattaaag aaattgattc    12600
ctgcttggga atttacaatt attccttact atggacaaaa acatcaatct gatatcactg    12660
atattgtaag tagtttgcaa ttacagttcg aatcatcgga agaagcagat aagggaaata    12720
gccacagtaa aaaaatgcta aagcacttct aagtgagggt gaaagcatct gggagatcac    12780
tgagaaaata ctaaattcgt ttgagtatac ttcgagattt acaaaaacaa aaactttata    12840
ccaattcctc ttcctagcta ctttcatcaa ttgtggaaga ttcagcgata ttaagaacgt    12900
tgatccgaaa tcatttaaat tagtccaaaa taagtatctg ggagtaataa tccagtgttt    12960
agtgacagag acaaagacaa gcgttagtag gcacatatac ttctttagcg caaggggtag  13020
<210>44
<211>15810
<212>DNA
<213>载体pSY1AMFE1sH6a
<400>44
atcgataagc ttttcaattc aattcatcat ttttttttta ttcttttttt tgatttcggt     60
ttctttgaaa tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc    120
acagacttag attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag    180
tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga    240
aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta    300
atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg    360
aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg    420
atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca    480
agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat    540
tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg    600
gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg    660
aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag    720
aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta    780
ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg    840
gtgtgggttt agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg     900
tggtctctac aggatctgac attattattg ttggaagagg actatttgca aagggaaggg     960
atgctaaggt agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat    1020
gcggccagca aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa    1080
ttagagcttc aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt    1140
ataatgacga aaaaaaaaaa attggaaaga aaaagcttta atgcggtagt ttatcacagt    1200
taaattgcta acgcagtcag gcaccgtgta tgaaatctaa caatgcgctc atcgtcatcc    1260
tcggcaccgt caccctggat gctgtaggca taggcttggt tatgccggta ctgccgggcc    1320
tcttgcggga tatcgtccat tccgacagca tcgccagtca ctatggcgtg ctgctagcgc    1380
tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgctttg    1440
gccgccgccc agtcctgctc gcttcgctac ttggagccac tatcgactac gcgatcatgg    1500
cgaccacacc cgtcctgtgg atccttcaat atgcgcacat acgctgttat gttcaaggtc    1560
ccttcgttta agaacgaaag cggtcttcct tttgagggat gtttcaagtt gttcaaatct    1620
atcaaatttg caaatcccca gtctgtatct agagcgttga atcggtgatg cgatttgtta    1680
attaaattga tggtgtcacc attaccaggt ctagatatac caatggcaaa ctgagcacaa    1740
caataccagt ccggatcaac tggcaccatc tctcccgtag tctcatctaa tttttcttcc    1800
ggatgaggtt ccagatatac cgcaacacct ttattatggt ttccctgagg gaataataga    1860
atgtcccatt cgaaatcacc aattctaaac ctgggcgaat tgtatttcgg gtttgttaac    1920
tcgttccagt caggaatgtt ccacgtgaag ctatcttcca gcaaagtctc cacttcttca    1980
tcaaattgtg gagaatactc ccaatgctct tatctatggg acttccggga aacacagtac    2040
cgatacttcc caattcgtct tcagagctca ttgtttgttt gaagagacta atcaaagaat    2100
cgttttctca aaaaaattaa tatcttaact gatagtttga tcaaaggggc aaaacgtagg    2160
ggcaaacaaa cggaaaaatc gtttctcaaa ttttctgatg ccaagaactc taaccagtct    2220
tatctaaaaa ttgccttatg atccgtctct ccggttacag cctgtgtaac tgattaatcc    2280
tgcctttcta atcaccattc taatgtttta attaagggat tttgtcttca ttaacggctt    2340
tcgctcataa aaatgttatg acgttttgcc cgcaggcggg aaaccatcca cttcacgaga    2400
ctgatctcct ctgccggaac accgggcatc tccaacttat aagttggaga aataagagaa    2460
tttcagattg agagaatgaa aaaaaaaaac cctgaaaaaa aaggttgaaa ccagttccct    2520
gaaattattc ccctacttga ctaataagta tataaagacg gtaggtattg attgtaattc    2580
tgtaaatcta tttcttaaac ttcttaaatt ctacttttat agttagtctt ttttttagtt    2640
ttaaaacacc aagaacttag tttcgaataa acacacataa acaaacacca tgagatttcc    2700
ttcaattttt actgcagttt tattcgcagc atcctccgca ttagctgctc cagtcaacac    2760
tacaacagaa gatgaaacgg cacaaattcc ggctgaagct gtcatcggtt actcagattt    2820
agaaggggat ttcgatgttg ctgttttgcc attttccaac agcacaaata acgggttatt    2880
gtttataaat actactattg ccagcattgc tgctaaagaa gaaggggtat ctctagataa    2940
aaggtatgag gtgcgcaacg tgtccgggat gtaccatgtc acgaacgact gctccaactc    3000
aagcattgtg tatgaggcag cggacatgat catgcacacc cccgggtgcg tgccctgcgt    3060
tcgggagaac aactcttccc gctgctgggt agcgctcacc cccacgctcg cagctaggaa    3120
cgccagcgtc cccactacga caatacgacg ccacgtcgat ttgctcgttg gggcggctgc    3180
tttctgttcc gctatgtacg tgggggatct ctgcggatct gtcttcctcg tctcccagct    3240
gttcaccatc tcgcctcgcc ggcatgagac ggtgcaggac tgcaattgct caatctatcc    3300
cggccacata acgggtcacc gtatggcttg ggatatgatg atgaactggc accaccacca    3360
tcaccattaa agatctcgac ttggttgaac acgttgccaa ggcttaagtg aatttacttt    3420
aaagtcttgc atttaaataa attttctttt tatagcttta tgacttagtt tcaatttata    3480
tactatttta atgacatttt cgattcattg attgaaagct ttgtgttttt tcttgatgcg    3540
ctattgcatt gttcttgtct ttttcgccac atgtaatatc tgtagtagat acctgataca    3600
ttgtggatgc tgagtgaaat tttagttaat aatggaggcg ctcttaataa ttttggggat    3660
attggctttt ttttttaaag tttacaaatg aattttttcc gccaggataa cgattctgaa    3720
gttactctta gcgttcctat cggtacagcc atcaaatcat gcctataaat catgcctata    3780
tttgcgtgca gtcagtatca tctacatgaa aaaaactccc gcaatttctt atagaatacg    3840
ttgaaaatta aatgtacgcg ccaagataag ataacatata tctagctaga tgcagtaata    3900
tacacagatt cccgcggacg tgggaaggaa aaaattagat aacaaaatct gagtgatatg    3960
gaaattccgc tgtatagctc atatctttcc cttcaacacc agaaatgtaa aaatcttgtt    4020
acgaaggatc tttttgctaa tgtttctcgc tcaatcctca tttcttccct acgaagagtc    4080
aaatctactt gttttctgcc ggtatcaaga tccatatctt ctagtttcac catcaaagtc    4140
caatttctag tatacagttt atgtcccaac gtaacagaca atcaaaattg gaaaggataa    4200
gtatccttca aagaatgatt ctgcgctggc tcctgaaccg cctaatggga acagagaagt    4260
ccaaaacgat gctataagaa ccagaaataa aacgataaaa ccataccagg atcctctacg    4320
ccggacgcat cgtggccggc atcaccggcg ccacaggtgc ggttgctggc ccctatatcg    4380
ccgacatcac cgatggggaa gatcgggctc gccacttcgg gctcatgagc gcttgtttcg    4440
gcgtgggtat ggtggcaggc cccgtggccg ggggactgtt gggcgccatc tccttgcatg    4500
caccattcct tgcggcggcg gtgctcaacg gcctcaacct actactgggc tgcttcctaa    4560
tgcaggagtc gcataaggga gagcgtcgac cgatgccctt gagagccttc aacccagtca    4620
gctccttccg gtgggcgcgg ggcatgacta tcgtcgccgc acttatgact gtcttcttta    4680
tcatgcaact cgtaggacag gtgccggcag cgctctgggt cattttcggc gaggaccgct    4740
ttcgctggag cgcgacgatg atcggcctgt cgcttgcggt attcggaatc ttgcacgccc    4800
tcgctcaagc cttcgtcact ggtcccgcca ccaaacgttt cggcgagaag caggccatta    4860
tcgccggcat ggcggccgac gcgctgggct acgtcttgct ggcgttcgcg acgcgaggct    4920
ggatggcctt ccccattatg attcttctcg cttccggcgg catcgggatg cccgcgttgc    4980
aggccatgct gtccaggcag gtagatgacg accatcaggg acagcttcaa ggatcgctcg    5040
cggctcttac cagcctaact tcgatcactg gaccgctgat cgtcacggcg atttatgccg    5100
cctcggcgag cacatggaac gggttggcat ggattgtagg cgccgcccta taccttgtct    5160
gcctccccgc gttgcgtcgc ggtgcatgga gccgggccac ctcgacctga atggaagccg    5220
gcggcacctc gctaacggat tcaccactcc aagaattgga gccaatcaat tcttgcggag    5280
aactgtgaat gcgcaaacca acccttggca gaacatatcc atcgcgtccg ccatctccag    5340
cagccgcacg cggcgcatct cgggcagcgt tgggtcctgg ccacgggtgc gcatgatcgt    5400
gctcctgtcg ttgaggaccc ggctaggctg gcggggttgc cttactggtt agcagaatga    5460
atcaccgata cgcgagcgaa cgtgaagcga ctgctgctgc aaaacgtctg cgacctgagc    5520
aacaacatga atggtcttcg gtttccgtgt ttcgtaaagt ctggaaacgc ggaagtcagc    5580
gccctgcacc attatgttcc ggatctgcat cgcaggatgc tgctggctac cctgtggaac    5640
acctacatct gtattaacga agcgctggca ttgaccctga gtgatttttc tctggtcccg    5700
ccgcatccat accgccagtt gtttaccctc acaacgttcc agtaaccggg catgttcatc    5760
atcagtaacc cgtatcgtga gcatcctctc tcgtttcatc ggtatcatta cccccatgaa    5820
cagaaattcc cccttacacg gaggcatcaa gtgaccaaac aggaaaaaac cgcccttaac    5880
atggcccgct ttatcagaag ccagacatta acgcttctgg agaaactcaa cgagctggac    5940
gcggatgaac aggcagacat ctgtgaatcg cttcacgacc acgctgatga gctttaccgc    6000
agctgcctcg cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag    6060
acggtcacag cttgtctgta agcggtgccg ggagcagaca agcccgtcag ggcgcgtcag    6120
cgggtgttgg cgggtgtcgg ggcgcagcca tgacccagtc acgtagcgat agcggagtgt    6180
atactggctt aactatgcgg catcagagca gattgtactg agagtgcacc atatgcggtg    6240
tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt ccgcttcctc    6300
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa    6360
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa    6420
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct    6480
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac    6540
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc    6600
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc    6660
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg    6720
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga    6780
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag    6840
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta    6900
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag    6960
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg    7020
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac    7080
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc    7140
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag    7200
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc    7260
agcgatctgt ctatttcgtt catccatagt  tgcctgactc cccgtcgtgt agataactac   7320
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc    7380
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg    7440
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag    7500
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca tcgtggtgtc    7560
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac    7620
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag    7680
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac    7740
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg    7800
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc    7860
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact    7920
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg    7980
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa    8040
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt    8100
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg    8160
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga    8220
cgtctaagaa accattatta tcatgacatt aacctataaa aaataggcgt atcacgaggc    8280
cctttcgtct tcaagaattc tcatgtttga cagcttatca tcgatccact tgtatatttg    8340
gatgaatttt tgaggaattc tgaaccagtc ctaaaacgag taaataggac cggcaattct    8400
tcaagcaata aacaggaata ccaattatta aaagataact tagtcagatc gtacaataaa    8460
gctttgaaga aaaatgcgcc ttattcaatc tttgcataaa aaaatggccc aaaatctcac    8520
attggaagac atttgatgac ctcatttctt tcaatgaagg gcctaacgga gttgactaat    8580
gttgtgggaa attggaccga taagcgtgct tctgccgtgg ccaggacaac gtatactcat    8640
cagataacag caatacctga tcactacttc gcactagttt ctcggtacta tgcatatgat    8700
ccaatatcaa aggaaatgat agcattgaag gatgagacta atccaattga ggagtggcag    8760
catatagaac agctaaaggg tagtgctgaa ggaagcatac gataccccgc atggaatggg    8820
ataatatcac aggaggtact agactacctt tcatcctaca taaatagacg catataagta    8880
cgcatttaag cataaacacg cactatgccg ttcttctcat gtatatatat atacaggcaa    8940
cacgcagata taggtgcgac gtgaacagtg agctgtatgt gcgcagctcg cgttgcattt    9000
tcggaagcgc tcgttttcgg aaacgctttg aagttcctat tccgaagttc ctattctcta    9060
gaaagtatag gaacttcaga gcgcttttga aaaccaaaag cgctctgaag acgcactttc    9120
aaaaaaccaa aaacgcaccg gactgtaacg agctactaaa atattgcgaa taccgcttcc    9180
acaaacattg ctcaaaagta tctctttgct atatatctct gtgctatatc cctatataac    9240
catcccatcc acctttcgct ccttgaactt gcatctaaac tcgacctcta cattttttat    9300
gtttatctct agtattacct cttagacaaa aaaattgtag taagaactat tcatagagtt    9360
aatcgaaaac aatacgaaaa tgtaaacatt tcctatacgt agtatataga gacaaaatag    9420
aagaaaccgt tcataatttt ctgaccaatg aagaatcatc aacgctatca ctttctgttc    9480
acaaagtatg cgcaatccac atcggtatag aatataatcg gggatgcctt tatcttgaaa    9540
aaatgcaccc gcagcttcgc tagtaatcag taaacgcggg aagtggagtc aggctttttt    9600
tatggaagag aaaatagaca ccaaagtagc cttcttctaa ccttaacgga cctacagtgc    9660
aaaaagttat caagagactg cattatagag cgcacaaagg agaaaaaaag taatctaaga    9720
tgctttgtta gaaaaatagc gctctcggga tgcatttttg tagaacaaaa aagaagtata     9780
gattcttgtt ggtaaaatag cgctctcgcg ttgcatttct gttctgtaaa aatgcagctc     9840
agattctttg tttgaaaaat tagcgctctc gcgttgcatt tttgttttac aaaaatgaag     9900
cacagattct tcgttggtaa aatagcgctt tcgcgttgca tttctgttct gtaaaaatgc     9960
agctcagatt ctttgtttga aaaattagcg ctctcgcgtt gcatttttgt tctacaaaat    10020
gaagcacaga tgcttcgtta acaaagatat gctattgaag tgcaagatgg aaacgcagaa    10080
aatgaaccgg ggatgcgacg tgcaagatta cctatgcaat agatgcaata gtttctccag    10140
gaaccgaaat acatacattg tcttccgtaa agcgctagac tatatattat tatacaggtt    10200
caaatatact atctgtttca gggaaaactc ccaggttcgg atgttcaaaa ttcaatgatg    10260
ggtaacaagt acgatcgtaa atctgtaaaa cagtttgtcg gatattaggc tgtatctcct    10320
caaagcgtat tcgaatatca ttgagaagct gcattttttt tttttttttt tttttttttt    10380
tttttatata tatttcaagg atataccatt gtaatgtctg cccctaagaa gatcgtcgtt    10440
ttgccaggtg accacgttgg tcaagaaatc acagccgaag ccattaaggt tcttaaagct    10500
atttctgatg ttcgttccaa tgtcaagttc gatttcgaaa atcatttaat tggtggtgct    10560
gctatcgatg ctacaggtgt cccacttcca gatgaggcgc tggaagcctc caagaaggtt    10620
gatgccgttt tgttaggtgc tgtgggtggt cctaaatggg gtaccggtag tgttagacct    10680
gaacaaggtt tactaaaaat ccgtaaagaa cttcaattgt acgccaactt aagaccatgt    10740
aactttgcat ccgactctct tttagactta tctccaatca agccacaatt tgctaaaggt    10800
actgacttcg ttgttgtcag agaattagtg ggaggtattt actttggtaa gagaaaggaa    10860
gacgatggtg atggtgtcgc ttgggatagt gaacaataca ccgttccaga agtgcaaaga    10920
atcacaagaa tggccgcttt catggcccta caacatgagc caccattgcc tatttggtcc    10980
ttggataaag ctaatgtttt ggcctcttca agattatgga gaaaaactgt ggaggaaacc    11040
atcaagaacg aattccctac attgaaggtt caacatcaat tgattgattc tgccgccatg    11100
atcctagtta agaacccaac ccacctaaat ggtattataa tcaccagcaa catgtttggt    11160
gatatcatct ccgatgaagc ctccgttatc ccaggttcct tgggtttgtt gccatctgcg    11220
tccttggcct ctttgccaga caagaacacc gcatttggtt tgtacgaacc atgccacggt    11280
tctgctccag atttgccaaa gaataaggtt gaccctatcg ccactatctt gtctgctgca    11340
atgatgttga aattgtcatt gaacttgcct gaagaaggta aggccattga agatgcagtt    11400
aaaaaggttt tggatgcagg tatcagaact ggtgatttag gtggttccaa cagtaccacc    11460
gaagtcggtg atgctgtcgc cgaagaagtt aagaaaatcc ttgcttaaaa agattctctt    11520
tttttatgat atttgtacaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa    11580
aaaatgcagc gtcacatcgg ataataatga tggcagccat tgtagaagtg ccttttgcat    11640
ttctagtctc tttctcggtc tagctagttt tactacatcg cgaagataga atcttagatc    11700
acactgcctt tgctgagctg gatcatatga gtaacaaaag agtggtaagg cctcgttaaa    11760
ggacaaggac ctgagcggaa gtgtatcgta aagtagacgg agtatactag tatagtctat    11820
agtccgtgga attctaagtg ccagctttat aatgtcattc tccttactac agacccgcct    11880
gaaagtagac acatcatcat cagtaagctt tgacaaaaag cattgagtag ctaactcttc    11940
tatgcaatct atagctgttt tataaggcat tcaatggaca gattgaggtt tttgaaacat    12000
actagtgaaa ttagccttaa tcccttctcg aagttaatca tgcattatgg tgtaaaaaat    12060
gcaactcgcg ttgctctact ttttcccgaa tttccaaata cgcagctggg gtgattgctc    12120
gatttcgtaa cgaaagtttt gtttataaaa accgcgaaaa ccttctgtaa cagatagatt    12180
tttacagcgc tgatatacaa tgacatcagc tgtaatggaa aataactgaa atatgaatgg    12240
cgagagactg cttgcttgta ttaagcaatg tattatgcag cacttccaac ctatggtgta    12300
cgatgaaagt aggtgtgtaa tcgagacgac aagggggact tttccagttc ctgatcatta    12360
taagaaatac aaaacgttag catttgcatt tgttggacat gtactgaata cagacgacac    12420
accggtaatt gaaaaagaac tggattggcc tgatcctgca ctagtgtaca atacaattgt    12480
cgatcgaatc ataaatcacc cagaattatc acagtttata tcggttgcat ttattagtca    12540
gttaaaggcc accatcggag agggtttaga tattaatgta aaaggcacgc taaaccgcag    12600
gggaaagggt atcagaaggc ctaaaggcgt attttttaga tacatggaat ctccatttgt    12660
caatacaaag gtcactgcat tcttctctta tcttcgagat tataataaaa ttgcctcaga    12720
atatcacaat aatactaaat tcattctcac gttttcatgt caagcatatt gggcatctgg    12780
cccaaacttc tccgccttga agaatgttat ttggtgctcc ataattcatg aatacatttc    12840
taagtttgtg gaaagagaac aggataaagg tcatatagga gatcaggagc taccgcctga    12900
agaggaccct tctcgtgaac taaacaatgt acaacatgaa gtcaatagtt taacggaaca    12960
agatgcggag gcggatgaag gattgtgggg tgaaatagat tcattatgtg aaaaatggca    13020
gtctgaagcg gagagtcaaa ctgaggcgga gataatagcc gacaggataa ttggaaatag    13080
ccagaggatg gcgaacctca aaattcgtcg tacaaagttc aaaagtgtct tgtatcatat    13140
actaaaggaa ctaattcaat ctcagggaac cgtaaaggtt tatcgcggta gtagtttttc    13200
acacgattcg ataaagataa gcttacatta tgaagagcag catattacag ccgtatgggt    13260
ctacttgata gtaaaatttg aagagcattg gaagcctgtt gatgtagagg tcgagtttag    13320
atgcaagttc aaggagcgaa aggtggatgg gtaggttata tagggatata gcacagagat    13380
atatagcaaa gagatacttt tgaggcaatg tttgtggaag cggtattcgc aatattttag    13440
tagctcgtta cagtccggtg cgtttttggt tttttgaaag tgcgtcttca gagcgctttt    13500
ggttttcaaa agcgctctga agttcctata ctttctagag aataggaact tcggaatagg    13560
aacttcaaag cgtttccgaa aacgagcgct tccgaaaatg caacgcgagc tgcgcacata    13620
cagctcactg ttcacgtcgc acctatatct gcgtgttgcc tgtatatata tatacatgag    13680
aagaacggca tagtgcgtgt ttatgcttaa atgcgtactt atatgcgtct atttatgtag    13740
gatgaaaggt agtctagtac ctcctgtgat attatcccat tccatgcggg gtatcgtatg    13800
cttccttcag cactaccctt tagctgttct atatgctgcc actcctcaat tggattagtc    13860
tcatccttca atgcattcat ttcctttgat attggatcat accctagaag tattacgtga    13920
ttttctgccc cttaccctcg ttgctactct cctttttttc gtgggaaccg ctttagggcc    13980
ctcagtgatg gtgttttgta atttatatgc tcctcttgca tttgtgtctc tacttcttgt    14040
tcgcctggag ggaacttctt catttgtatt agcatggttc acttcagtcc ttccttccaa    14100
ctcactcttt ttttgctgta aacgattctc tgccgccagt tcattgaaac tattgaatat    14160
atcctttaga gattccggga tgaataaatc acctattaaa gcagcttgac gatctggtgg    14220
aactaaagta agcaattggg taacgacgct tacgagcttc ataacatctt cttccgttgg    14280
agctggtggg actaataact gtgtacaatc catttttctc atgagcattt cggtagctct    14340
cttcttgtct ttctcgggca atcttcctat tattatagca atagatttgt atagttgctt    14400
tctattgtct aacagcttgt tattctgtag catcaaatct atggcagcct gacttgcttc    14460
ttgtgaagag agcataccat ttccaatcga agatacgctg gaatcttctg cgctagaatc    14520
aagaccatac ggcctaccgg ttgtgagaga ttccatgggc cttatgacat atcctggaaa    14580
gagtagctca tcagacttac gtttactctc tatatcaata tctacatcag gagcaatcat    14640
ttcaataaac agccgacata catcccagac gctataagct gtacgtgctt ttaccgtcag    14700
attcttggct gtttcaatgt cgtccatttt ggttttcttt taccagtatt gttcgtttga    14760
taatgtattc ttgcttatta cattataaaa tctgtgcaga tcacatgtca aaacaacttt    14820
ttatcacaag atagtaccgc aaaacgaacc tgcgggccgt ctaaaaatta aggaaaagca    14880
gcaaaggtgc atttttaaaa tatgaaatga agataccgca gtaccaatta ttttcgcagt    14940
acaaataatg cgcggccggt gcatttttcg aaagaacgcg agacaaacag gacaattaaa    15000
gttagttttt cgagttagcg tgtttgaata ctgcaagata caagataaat agagtagttg    15060
aaactagata tcaattgcac acaagatcgg cgctaagcat gccacaattt ggtatattat    15120
gtaaaacacc acctaaggtg cttgttcgtc agtttgtgga aaggtttgaa agaccttcag    15180
gtgagaaaat agcattatgt gctgctgaac taacctattt atgttggatg attacacata    15240
acggaacagc aatcaagaga gccacattca tgagctataa tactatcata agcaattcgc    15300
tgagtttcga tattgtcaat aaatcactcc agtttaaata caagacgcaa aaagcaacaa    15360
ttctggaagc ctcattaaag aaattgattc ctgcttggga atttacaatt attccttact    15420
atggacaaaa acatcaatct gatatcactg atattgtaag tagtttgcaa ttacagttcg    15480
aatcatcgga agaagcagat aagggaaata gccacagtaa aaaaatgcta aagcacttct    15540
aagtgagggt gaaagcatct gggagatcac tgagaaaata ctaaattcgt ttgagtatac    15600
ttcgagattt acaaaaacaa aaactttata ccaattcctc ttcctagcta ctttcatcaa    15660
ttgtggaaga ttcagcgata ttaagaacgt tgatccgaaa tcatttaaat tagtccaaaa    15720
taagtatctg ggagtaataa tccagtgttt agtgacagag acaaagacaa gcgttagtag    15780
gcacatatac ttctttagcg caaggggtag                                     15810
<210>45
<211>3928
<212>DNA
<213>载体pBKS-E2sH6
<400>45
cacctaaatt gtaagcgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag       60
ctcatttttt aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac      120
cgagataggg ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga      180
ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc      240
accctaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg      300
gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa      360
gaaagcgaaa ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac     420
caccacaccc gccgcgctta atgcgccgct acagggcgcg tcccattcgc cattcaggct     480
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa     540
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg     600
ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgggtaccgg     660
gccccccctc gaggtcgacg gtatcgataa gcttgcatgc ctgcagttaa ttaactatta     720
gtgatggtgg tgatggtgtc tgccctcgat cacctgccac tctgttgtag acagcagcag     780
cgggctaagc tctgatctat ccctgtcctc caagtcacaa cgctctcctc gagtccaatt     840
gcatgcggct tcgaacctgt gctccacgcc ccccacgtac atcctaacct tgaagatggt     900
gaagttgaca gtgcaggggt agtgccagag cctatatggg taatgaacca tacacctagg     960
tgtcagccag ggcccagaac cgcatctggc gtaggtggcc tcggggtgct tccgaaaaca    1020
gtcagtgggg caggtcaagg tgttgttgcc ggcccccccg atgttgcacg gggggccccc    1080
acacgtcttg gtgaacccag tgccattcat ccatgtacag ccgaaccagt tgcctcgcgg    1140
cggccgcgtg ttgttgagaa tcagcacatc cgagtcgttc gccccccagt tatacgtggg    1200
gacaccaaac cgatcggtcg tccccaccac aacagggctc ggggtgaagc aatacactgg    1260
accgcacacc tgagacgcgg gtacaatacc acacggtcga ggcgcgtagt gccagcagta    1320
gggcctctgg tccgagctgt taggctcagt gtaagtgagg ggaccccacc cctgagcgaa    1380
cttgtcgatg gagcgacagc tggccaagcg ctctgggcat ccagacgagt tgaatttgtg    1440
tttgtagaat agtgcggcaa agaaccctgt ttggagggag tcgttgcagt tcagggcagt    1500
cctgttgatg tgccaactgc cgttggtgtt tacgagctgg attttctgag ccgacccggg    1560
gctaaagagg gacacaaggc ccctggtatc ggaggctgct gcccctcctg acacgcgggt    1620
atggtaccgg gccccccctc gaggtcgacg gtatcgataa gcttgatatc gaattcctgc    1680
agcccggggg atccactagt tctagagcgg ccgccaccgc ggtggagctc cagcttttgt    1740
tccctttagt gagggttaat ttcgagcttg gcgtaatcat ggtcatagct gtttcctgtg    1800
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa    1860
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct    1920
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga    1980
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc    2040
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa    2100
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt    2160
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa    2220
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt    2280
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg    2340
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc    2400
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc    2460
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta    2520
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct    2580
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc   2640
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa   2700
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa   2760
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa   2820
aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt   2880
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac   2940
agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc   3000
atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc   3060
cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata   3120
aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc   3180
cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc   3240
aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca   3300
ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa   3360
gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca   3420
ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt   3480
tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt   3540
tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg   3600
ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga   3660
tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc   3720
agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg   3780
acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag   3840
ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg   3900
gttccgcgca catttccccg aaaagtgc                                      3928
<210>46
<211>6104
<212>DNA
<213>载体pYIG5HCCL-22aH6
<400>46
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc     60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc    120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa    180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gaatttaata    240
cgactcacta tagggaattc gaggatcctt caatatgcgc acatacgctg ttatgttcaa    300
ggtcccttcg tttaagaacg aaagcggtct tccttttgag ggatgtttca agttgttcaa    360
atctatcaaa tttgcaaatc cccagtctgt atctagagcg ttgaatcggt gatgcgattt    420
gttaattaaa ttgatggtgt caccattacc aggtctagat ataccaatgg caaactgagc    480
acaacaatac cagtccggat caactggcac catctctccc gtagtctcat ctaatttttc    540
ttccggatga ggttccagat ataccgcaac acctttatta tggtttccct gagggaataa    600
tagaatgtcc cattcgaaat caccaattct aaacctgggc gaattgtatt tcgggtttgt    660
taactcgttc cagtcaggaa tgttccacgt gaagctatct tccagcaaag tctccacttc    720
ttcatcaaat tgtggagaat actcccaatg ctcttatcta tgggacttcc gggaaacaca    780
gtaccgatac ttcccaattc gtcttcagag ctcattgttt gtttgaagag actaatcaaa    840
gaatcgtttt ctcaaaaaaa ttaatatctt aactgatagt ttgatcaaag gggcaaaacg    900
taggggcaaa caaacggaaa aatcgtttct caaattttct gatgccaaga actctaacca    960
gtcttatcta aaaattgcct tatgatccgt ctctccggtt acagcctgtg taactgatta   1020
atcctgcctt tctaatcacc attctaatgt tttaattaag ggattttgtc ttcattaacg   1080
gctttcgctc ataaaaatgt tatgacgttt tgcccgcagg cgggaaacca tccacttcac   1140
gagactgatc tcctctgccg gaacaccggg catctccaac ttataagttg gagaaataag   1200
agaatttcag attgagagaa tgaaaaaaaa aaaccctgaa aaaaaaggtt gaaaccagtt   1260
ccctgaaatt attcccctac ttgactaata agtatataaa gacggtaggt attgattgta   1320
attctgtaaa tctatttctt aaacttctta aattctactt ttatagttag tctttttttt   1380
agttttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac accatgagat   1440
ttccttcaat ttttactgca gttttattcg cagcatcctc cgcattagct gctccagtca   1500
acactacaac agaagatgaa acggcacaaa ttccggctga agctgtcatc ggttactcag   1560
atttagaagg ggatttcgat gttgctgttt tgccattttc caacagcaca aataacgggt   1620
tattgtttat aaatactact attgccagca ttgctgctaa agaagaaggg gtatctctag   1680
ataaaaggca tacccgcgtg tcaggagggg cagcagcctc cgataccagg ggccttgtgt   1740
ccctctttag ccccgggtcg gctcagaaaa tccagctcgt aaacaccaac ggcagttggc   1800
acatcaacag gactgccctg aactgcaacg actccctcca aacagggttc tttgccgcac   1860
tattctacaa acacaaattc aactcgtctg gatgcccaga gcgcttggcc agctgtcgct   1920
ccatcgacaa gttcgctcag gggtggggtc ccctcactta cactgagcct aacagctcgg   1980
accagaggcc ctactgctgg cactacgcgc ctcgaccgtg tggtattgta cccgcgtctc   2040
aggtgtgcgg tccagtgtat tgcttcaccc cgagccctgt tgtggtgggg acgaccgatc   2100
ggtttggtgt ccccacgtat aactgggggg cgaacgactc ggatgtgctg attctcaaca   2160
acacgcggcc gccgcgaggc aactggttcg gctgtacatg gatgaatggc actgggttca   2220
ccaagacgtg tgggggcccc ccgtgcaaca tcgggggggc cggcaacaac accttgacct   2280
gccccactga ctgttttcgg aagcaccccg aggccactta cgccagatgc ggttctgggc   2340
cctggctgac acctaggtgt atggttcatt acccatatag gctctggcac tacccctgca   2400
ctgtcaactt caccatcttc aaggttagga tgtacgtggg gggcgtggag cacaggttcg   2460
aagccgcatg caattggact cgaggagagc gttgtgactt ggaggacagg gatagatcag   2520
agcttagctc gctgctgctg tctacaacag agtggcaggt gatcgagggc agacaccatc   2580
accaccatca ctaatagtta attaacgatc tcgacttggt tgaacacgtt gccaaggctt   2640
aagtgaattt actttaaagt cttgcattta aataaatttt ctttttatag ctttatgact   2700
tagtttcaat ttatatacta ttttaatgac attttcgatt cattgattga aagctttgtg   2760
ttttttcttg atgcgctatt gcattgttct tgtctttttc gccacatgta atatctgtag   2820
tagatacctg atacattgtg gatgctgagt gaaattttag ttaataatgg aggcgctctt   2880
aataattttg gggatattgg cttttttttt taaagtttac aaatgaattt tttccgccag   2940
gataacgatt ctgaagttac tcttagcgtt cctatcggta cagccatcaa atcatgccta   3000
taaatcatgc ctatatttgc gtgcagtcag tatcatctac atgaaaaaaa ctcccgcaat   3060
ttcttataga atacgttgaa aattaaatgt acgcgccaag ataagataac atatatctag   3120
ctagatgcag taatatacac agattcccgc ggacgtggga aggaaaaaat tagataacaa   3180
aatctgagtg atatggaaat tccgctgtat agctcatatc tttcccttca acaccagaaa   3240
tgtaaaaatc ttgttacgaa ggatcttttt gctaatgttt ctcgctcaat cctcatttct   3300
tccctacgaa gagtcaaatc tacttgtttt ctgccggtat caagatccat atcttctagt   3360
ttcaccatca aagtccaatt tctagtatac agtttatgtc ccaacgtaac agacaatcaa   3420
aattggaaag gataagtatc cttcaaagaa tgattctgcg ctggctcctg aaccgcctaa   3480
tgggaacaga gaagtccaaa acgatgctat aagaaccaga aataaaacga taaaaccata   3540
ccaggatcca agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg   3600
cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga   3660
agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatgggaaat   3720
tgtaaacgtt aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt   3780
taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg   3840
gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt   3900
caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc   3960
aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg   4020
atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa   4080
aggagcgggc gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc   4140
cgccgcgctt aatgcgccgc tacagggcgc gtcaggtggc acttttcggg gaaatgtgcg   4200
cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca   4260
ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt   4320
ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga   4380
aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga   4440
actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat   4500
gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca   4560
agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt   4620
cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac   4680
catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct   4740
aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga   4800
gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac   4860
aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat   4920
agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg   4980
ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc   5040
actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc   5100
aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg   5160
gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta   5220
atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg   5280
tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga   5340
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt   5400
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag   5460
agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa   5520
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag   5580
tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca   5640
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac   5700
cgaactgaga tacctacagc gtgagcattg agaaagcgcc acgcttcccg aagggagaaa   5760
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc   5820
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg   5880
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc   5940
ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc   6000
ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag   6060
ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaag                    6104
<210>47
<211>16301
<212>DNA
<213>载体pYYIGSE2H6
<400>47
atcgataagc ttttcaattc aattcatcat ttttttttta ttcttttttt tgatttcggt    60
ttctttgaaa tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc   120
acagacttag attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag   180
tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga   240
aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta   300
atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg   360
aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg   420
atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca   480
agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat   540
tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg   600
gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg   660
aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag   720
aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta   780
ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg   840
gtgtgggttt agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg   900
tggtctctac aggatctgac attattattg ttggaagagg actatttgca aagggaaggg   960
atgctaaggt agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat   1020
gcggccagca aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa   1080
ttagagcttc aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt   1140
ataatgacga aaaaaaaaaa attggaaaga aaaagcttta atgcggtagt ttatcacagt   1200
taaattgcta acgcagtcag gcaccgtgta tgaaatctaa caatgcgctc atcgtcatcc   1260
tcggcaccgt caccctggat gctgtaggca taggcttggt tatgccggta ctgccgggcc   1320
tcttgcggga tatcgtccat tccgacagca tcgccagtca ctatggcgtg ctgctagcgc   1380
tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgctttg   1440
gccgccgccc agtcctgctc gcttcgctac ttggagccac tatcgactac gcgatcatgg   1500
cgaccacacc cgtcctgtgg atccttcaat atgcgcacat acgctgttat gttcaaggtc   1560
ccttcgttta agaacgaaag cggtcttcct tttgagggat gtttcaagtt gttcaaatct   1620
atcaaatttg caaatcccca gtctgtatct agagcgttga atcggtgatg cgatttgtta   1680
attaaattga tggtgtcacc attaccaggt ctagatatac caatggcaaa ctgagcacaa   1740
caataccagt ccggatcaac tggcaccatc tctcccgtag tctcatctaa tttttcttcc   1800
ggatgaggtt ccagatatac cgcaacacct ttattatggt ttccctgagg gaataataga   1860
atgtcccatt cgaaatcacc aattctaaac ctgggcgaat tgtatttcgg gtttgttaac   1920
tcgttccagt caggaatgtt ccacgtgaag ctatcttcca gcaaagtctc cacttcttca   1980
tcaaattgtg gagaatactc ccaatgctct tatctatggg acttccggga aacacagtac   2040
cgatacttcc caattcgtct tcagagctca ttgtttgttt gaagagacta atcaaagaat   2100
cgttttctca aaaaaattaa tatcttaact gatagtttga tcaaaggggc aaaacgtagg   2160
ggcaaacaaa cggaaaaatc gtttctcaaa ttttctgatg ccaagaactc taaccagtct   2220
tatctaaaaa ttgccttatg atccgtctct ccggttacag cctgtgtaac tgattaatcc   2280
tgcctttcta atcaccattc taatgtttta attaagggat tttgtcttca ttaacggctt   2340
tcgctcataa aaatgttatg acgttttgcc cgcaggcggg aaaccatcca cttcacgaga   2400
ctgatctcct ctgccggaac accgggcatc tccaacttat aagttggaga aataagagaa   2460
tttcagattg agagaatgaa aaaaaaaaac cctgaaaaaa aaggttgaaa ccagttccct   2520
gaaattattc ccctacttga ctaataagta tataaagacg gtaggtattg attgtaattc   2580
tgtaaatcta tttcttaaac ttcttaaatt ctacttttat agttagtctt ttttttagtt   2640
ttaaaacacc aagaacttag tttcgaataa acacacataa acaaacacca tgagatttcc   2700
ttcaattttt actgcagttt tattcgcagc atcctccgca ttagctgctc cagtcaacac   2760
tacaacagaa gatgaaacgg cacaaattcc ggctgaagct gtcatcggtt actcagattt   2820
agaaggggat ttcgatgttg ctgttttgcc attttccaac agcacaaata acgggttatt   2880
gtttataaat actactattg ccagcattgc tgctaaagaa gaaggggtat ctctagataa   2940
aaggcatacc cgcgtgtcag gaggggcagc agcctccgat accaggggcc ttgtgtccct   3000
ctttagcccc gggtcggctc agaaaatcca gctcgtaaac accaacggca gttggcacat   3060
caacaggact gccctgaact gcaacgactc cctccaaaca gggttctttg ccgcactatt   3120
ctacaaacac aaattcaact cgtctggatg cccagagcgc ttggccagct gtcgctccat   3180
cgacaagttc gctcaggggt ggggtcccct cacttacact gagcctaaca gctcggacca   3240
gaggccctac tgctggcact acgcgcctcg accgtgtggt attgtacccg cgtctcaggt   3300
gtgcggtcca gtgtattgct tcaccccgag ccctgttgtg gtggggacga ccgatcggtt   3360
tggtgtcccc acgtataact ggggggcgaa cgactcggat gtgctgattc tcaacaacac   3420
gcggccgccg cgaggcaact ggttcggctg tacatggatg aatggcactg ggttcaccaa   3480
gacgtgtggg ggccccccgt gcaacatcgg gggggccggc aacaacacct tgacctgccc   3540
cactgactgt tttcggaagc accccgaggc cacttacgcc agatgcggtt ctgggccctg   3600
gctgacacct aggtgtatgg ttcattaccc atataggctc tggcactacc cctgcactgt   3660
caacttcacc atcttcaagg ttaggatgta cgtggggggc gtggagcaca ggttcgaagc   3720
cgcatgcaat tggactcgag gagagcgttg tgacttggag gacagggata gatcagagct   3780
tagctcgctg ctgctgtcta caacagagtg gcaggtgatc gagggcagac accatcacca   3840
ccatcactaa tagttaatta acgatctcga cttggttgaa cacgttgcca aggcttaagt   3900
gaatttactt taaagtcttg catttaaata aattttcttt ttatagcttt atgacttagt   3960
ttcaatttat atactatttt aatgacattt tcgattcatt gattgaaagc tttgtgtttt   4020
ttcttgatgc gctattgcat tgttcttgtc tttttcgcca catgtaatat ctgtagtaga   4080
tacctgatac attgtggatg ctgagtgaaa ttttagttaa taatggaggc gctcttaata   4140
attttgggga tattggcttt tttttttaaa gtttacaaat gaattttttc cgccaggata   4200
acgattctga agttactctt agcgttccta tcggtacagc catcaaatca tgcctataaa   4260
tcatgcctat atttgcgtgc agtcagtatc atctacatga aaaaaactcc cgcaatttct   4320
tatagaatac gttgaaaatt aaatgtacgc gccaagataa gataacatat atctagctag   4380
atgcagtaat atacacagat tcccgcggac gtgggaagga aaaaattaga taacaaaatc   4440
tgagtgatat ggaaattccg ctgtatagct catatctttc ccttcaacac cagaaatgta   4500
aaaatcttgt tacgaaggat ctttttgcta atgtttctcg ctcaatcctc atttcttccc   4560
tacgaagagt caaatctact tgttttctgc cggtatcaag atccatatct tctagtttca   4620
ccatcaaagt ccaatttcta gtatacagtt tatgtcccaa cgtaacagac aatcaaaatt   4680
ggaaaggata agtatccttc aaagaatgat tctgcgctgg ctcctgaacc gcctaatggg   4740
aacagagaag tccaaaacga tgctataaga accagaaata aaacgataaa accataccag   4800
gatcctctac gccggacgca tcgtggccgg catcaccggc gccacaggtg cggttgctgg   4860
cccctatatc gccgacatca ccgatgggga agatcgggct cgccacttcg ggctcatgag   4920
cgcttgtttc ggcgtgggta tggtggcagg ccccgtggcc gggggactgt tgggcgccat   4980
ctccttgcat gcaccattcc ttgcggcggc ggtgctcaac ggcctcaacc tactactggg   5040
ctgcttccta atgcaggagt cgcataaggg agagcgtcga ccgatgccct tgagagcctt   5100
caacccagtc agctccttcc ggtgggcgcg gggcatgact atcgtcgccg cacttatgac   5160
tgtcttcttt atcatgcaac tcgtaggaca ggtgccggca gcgctctggg tcattttcgg   5220
cgaggaccgc tttcgctgga gcgcgacgat gatcggcctg tcgcttgcgg tattcggaat   5280
cttgcacgcc ctcgctcaag ccttcgtcac tggtcccgcc accaaacgtt tcggcgagaa   5340
gcaggccatt atcgccggca tggcggccga cgcgctgggc tacgtcttgc tggcgttcgc   5400
gacgcgaggc tggatggcct tccccattat gattcttctc gcttccggcg gcatcgggat   5460
gcccgcgttg caggccatgc tgtccaggca ggtagatgac gaccatcagg gacagcttca   5520
aggatcgctc gcggctctta ccagcctaac ttcgatcact ggaccgctga tcgtcacggc   5580
gatttatgcc gcctcggcga gcacatggaa cgggttggca tggattgtag gcgccgccct   5640
ataccttgtc tgcctccccg cgttgcgtcg cggtgcatgg agccgggcca cctcgacctg   5700
aatggaagcc ggcggcacct cgctaacgga ttcaccactc caagaattgg agccaatcaa   5760
ttcttgcgga gaactgtgaa tgcgcaaacc aacccttggc agaacatatc catcgcgtcc   5820
gccatctcca gcagccgcac gcggcgcatc tcgggcagcg ttgggtcctg gccacgggtg   5880
cgcatgatcg tgctcctgtc gttgaggacc cggctaggct ggcggggttg ccttactggt   5940
tagcagaatg aatcaccgat acgcgagcga acgtgaagcg actgctgctg caaaacgtct   6000
gcgacctgag caacaacatg aatggtcttc ggtttccgtg tttcgtaaag tctggaaacg   6060
cggaagtcag cgccctgcac cattatgttc cggatctgca tcgcaggatg ctgctggcta   6120
ccctgtggaa cacctacatc tgtattaacg aagcgctggc attgaccctg agtgattttt   6180
ctctggtccc gccgcatcca taccgccagt tgtttaccct cacaacgttc cagtaaccgg   6240
gcatgttcat catcagtaac ccgtatcgtg agcatcctct ctcgtttcat cggtatcatt   6300
acccccatga acagaaattc ccccttacac ggaggcatca agtgaccaaa caggaaaaaa   6360
ccgcccttaa catggcccgc tttatcagaa gccagacatt aacgcttctg gagaaactca   6420
acgagctgga cgcggatgaa caggcagaca tctgtgaatc gcttcacgac cacgctgatg   6480
agctttaccg cagctgcctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc   6540
agctcccgga gacggtcaca gcttgtctgt aagcggtgcc gggagcagac aagcccgtca   6600
gggcgcgtca gcgggtgttg gcgggtgtcg gggcgcagcc atgacccagt cacgtagcga   6660
tagcggagtg tatactggct taactatgcg gcatcagagc agattgtact gagagtgcac   6720
catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgctct   6780
tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca   6840
gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac   6900
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt   6960
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg   7020
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc   7080
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc   7140
gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc   7200
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac   7260
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt   7320
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct   7380
aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc   7440
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt   7500
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg   7560
atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc   7620
atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa   7680
tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag   7740
gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg   7800
tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga   7860
gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag   7920
cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa   7980
gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctgcaggc   8040
atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca   8100
aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg   8160
atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat   8220
aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc   8280
aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaacacgg   8340
gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg   8400
gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt   8460
gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca   8520
ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata   8580
ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac   8640
atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa   8700
gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa aaaataggcg   8760
tatcacgagg ccctttcgtc ttcaagaatt ctcatgtttg acagcttatc atcgatccac   8820
ttgtatattt ggatgaattt ttgaggaatt ctgaaccagt cctaaaacga gtaaatagga   8880
ccggcaattc ttcaagcaat aaacaggaat accaattatt aaaagataac ttagtcagat   8940
cgtacaataa agctttgaag aaaaatgcgc cttattcaat ctttgcataa aaaaatggcc   9000
caaaatctca cattggaaga catttgatga cctcatttct ttcaatgaag ggcctaacgg   9060
agttgactaa tgttgtggga aattggaccg ataagcgtgc ttctgccgtg gccaggacaa   9120
cgtatactca tcagataaca gcaatacctg atcactactt cgcactagtt tctcggtact   9180
atgcatatga tccaatatca aaggaaatga tagcattgaa ggatgagact aatccaattg   9240
aggagtggca gcatatagaa cagctaaagg gtagtgctga aggaagcata cgataccccg   9300
catggaatgg gataatatca caggaggtac tagactacct ttcatcctac ataaatagac   9360
gcatataagt acgcatttaa gcataaacac gcactatgcc gttcttctca tgtatatata   9420
tatacaggca acacgcagat ataggtgcga cgtgaacagt gagctgtatg tgcgcagctc   9480
gcgttgcatt ttcggaagcg ctcgttttcg gaaacgcttt gaagttccta ttccgaagtt   9540
cctattctct agaaagtata ggaacttcag agcgcttttg aaaaccaaaa gcgctctgaa   9600
gacgcacttt caaaaaacca aaaacgcacc ggactgtaac gagctactaa aatattgcga   9660
ataccgcttc cacaaacatt gctcaaaagt atctctttgc tatatatctc tgtgctatat   9720
ccctatataa ccatcccatc cacctttcgc tccttgaact tgcatctaaa ctcgacctct   9780
acatttttta tgtttatctc tagtattacc tcttagacaa aaaaattgta gtaagaacta   9840
ttcatagagt taatcgaaaa caatacgaaa atgtaaacat ttcctatacg tagtatatag   9900
agacaaaata gaagaaaccg ttcataattt tctgaccaat gaagaatcat caacgctatc   9960
actttctgtt cacaaagtat gcgcaatcca catcggtata gaatataatc ggggatgcct  10020
ttatcttgaa aaaatgcacc cgcagcttcg ctagtaatca gtaaacgcgg gaagtggagt  10080
caggcttttt ttatggaaga gaaaatagac accaaagtag ccttcttcta accttaacgg  10140
acctacagtg caaaaagtta tcaagagact gcattataga gcgcacaaag gagaaaaaaa  10200
gtaatctaag atgctttgtt agaaaaatag cgctctcggg atgcattttt gtagaacaaa  10260
aaagaagtat agattcttgt tggtaaaata gcgctctcgc gttgcatttc tgttctgtaa  10320
aaatgcagct cagattcttt gtttgaaaaa ttagcgctct cgcgttgcat ttttgtttta  10380
caaaaatgaa gcacagattc ttcgttggta aaatagcgct ttcgcgttgc atttctgttc  10440
tgtaaaaatg cagctcagat tctttgtttg aaaaattagc gctctcgcgt tgcatttttg  10500
ttctacaaaa tgaagcacag atgcttcgtt aacaaagata tgctattgaa gtgcaagatg  10560
gaaacgcaga aaatgaaccg gggatgcgac gtgcaagatt acctatgcaa tagatgcaat  10620
agtttctcca ggaaccgaaa tacatacatt gtcttccgta aagcgctaga ctatatatta  10680
ttatacaggt tcaaatatac tatctgtttc agggaaaact cccaggttcg gatgttcaaa  10740
attcaatgat gggtaacaag tacgatcgta aatctgtaaa acagtttgtc ggatattagg  10800
ctgtatctcc tcaaagcgta ttcgaatatc attgagaagc tgcatttttt tttttttttt  10860
tttttttttt ttttttatat atatttcaag gatataccat tgtaatgtct gcccctaaga  10920
agatcgtcgt tttgccaggt gaccacgttg gtcaagaaat cacagccgaa gccattaagg  10980
ttcttaaagc tatttctgat gttcgttcca atgtcaagtt cgatttcgaa aatcatttaa  11040
ttggtggtgc tgctatcgat gctacaggtg tcccacttcc agatgaggcg ctggaagcct  11100
ccaagaaggt tgatgccgtt ttgttaggtg ctgtgggtgg tcctaaatgg ggtaccggta  11160
gtgttagacc tgaacaaggt ttactaaaaa tccgtaaaga acttcaattg tacgccaact  11220
taagaccatg taactttgca tccgactctc ttttagactt atctccaatc aagccacaat  11280
ttgctaaagg tactgacttc gttgttgtca gagaattagt gggaggtatt tactttggta  11340
agagaaagga agacgatggt gatggtgtcg cttgggatag tgaacaatac accgttccag  11400
aagtgcaaag aatcacaaga atggccgctt tcatggccct acaacatgag ccaccattgc  11460
ctatttggtc cttggataaa gctaatgttt tggcctcttc aagattatgg agaaaaactg  11520
tggaggaaac catcaagaac gaattcccta cattgaaggt tcaacatcaa ttgattgatt  11580
ctgccgccat gatcctagtt aagaacccaa cccacctaaa tggtattata atcaccagca  11640
acatgtttgg tgatatcatc tccgatgaag cctccgttat cccaggttcc ttgggtttgt  11700
tgccatctgc gtccttggcc tctttgccag acaagaacac cgcatttggt ttgtacgaac  11760
catgccacgg ttctgctcca gatttgccaa agaataaggt tgaccctatc gccactatct  11820
tgtctgctgc aatgatgttg aaattgtcat tgaacttgcc tgaagaaggt aaggccattg  11880
aagatgcagt taaaaaggtt ttggatgcag gtatcagaac tggtgattta ggtggttcca  11940
acagtaccac cgaagtcggt gatgctgtcg ccgaagaagt taagaaaatc cttgcttaaa  12000
aagattctct ttttttatga tatttgtaca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa  12060
aaaaaaaaaa aaaaatgcag cgtcacatcg gataataatg atggcagcca ttgtagaagt  12120
gccttttgca tttctagtct ctttctcggt ctagctagtt ttactacatc gcgaagatag  12180
aatcttagat cacactgcct ttgctgagct ggatcatatg agtaacaaaa gagtggtaag  12240
gcctcgttaa aggacaagga cctgagcgga agtgtatcgt aaagtagacg gagtatacta  12300
gtatagtcta tagtccgtgg aattctaagt gccagcttta taatgtcatt ctccttacta  12360
cagacccgcc tgaaagtaga cacatcatca tcagtaagct ttgacaaaaagcattgagta   12420
gctaactctt ctatgcaatc tatagctgtt ttataaggca ttcaatggac agattgaggt  12480
ttttgaaaca tactagtgaa attagcctta atcccttctc gaagttaatc atgcattatg  12540
gtgtaaaaaa tgcaactcgc gttgctctac tttttcccga atttccaaat acgcagctgg  12600
ggtgattgct cgatttcgta acgaaagttt tgtttataaa aaccgcgaaa accttctgta  12660
acagatagat ttttacagcg ctgatataca atgacatcag ctgtaatgga aaataactga  12720
aatatgaatg gcgagagact gcttgcttgt attaagcaat gtattatgca gcacttccaa  12780
cctatggtgt acgatgaaag taggtgtgta atcgagacga caagggggac ttttccagtt  12840
cctgatcatt ataagaaata caaaacgtta gcatttgcat ttgttggaca tgtactgaat  12900
acagacgaca caccggtaat tgaaaaagaa ctggattggc ctgatcctgc actagtgtac  12960
aatacaattg tcgatcgaat cataaatcac ccagaattat cacagtttat atcggttgca  13020
tttattagtc agttaaaggc caccatcgga gagggtttag atattaatgt aaaaggcacg  13080
ctaaaccgca ggggaaaggg tatcagaagg cctaaaggcg tattttttag atacatggaa  13140
tctccatttg tcaatacaaa ggtcactgca ttcttctctt atcttcgaga ttataataaa  13200
attgcctcag aatatcacaa taatactaaa ttcattctca cgttttcatg tcaagcatat  13260
tgggcatctg gcccaaactt ctccgccttg aagaatgtta tttggtgctc cataattcat  13320
gaatacattt ctaagtttgt ggaaagagaa caggataaag gtcatatagg agatcaggag  13380
ctaccgcctg aagaggaccc ttctcgtgaa ctaaacaatg tacaacatga agtcaatagt  13440
ttaacggaac aagatgcgga ggcggatgaa ggattgtggg gtgaaataga ttcattatgt  13500
gaaaaatggc agtctgaagc ggagagtcaa actgaggcgg agataatagc cgacaggata  13560
attggaaata gccagaggat ggcgaacctc aaaattcgtc gtacaaagtt caaaagtgtc  13620
ttgtatcata tactaaagga actaattcaa tctcagggaa ccgtaaaggt ttatcgcggt  13680
agtagttttt cacacgattc gataaagata agcttacatt atgaagagca gcatattaca  13740
gccgtatggg tctacttgat agtaaaattt gaagagcatt ggaagcctgt tgatgtagag  13800
gtcgagttta gatgcaagtt caaggagcga aaggtggatg ggtaggttat atagggatat  13860
agcacagaga tatatagcaa agagatactt ttgaggcaat gtttgtggaa gcggtattcg  13920
caatatttta gtagctcgtt acagtccggt gcgtttttgg ttttttgaaa gtgcgtcttc  13980
agagcgcttt tggttttcaa aagcgctctg aagttcctat actttctaga gaataggaac  14040
ttcggaatag gaacttcaaa gcgtttccga aaacgagcgc ttccgaaaat gcaacgcgag  14100
ctgcgcacat acagctcact gttcacgtcg cacctatatc tgcgtgttgc ctgtatatat  14160
atatacatga gaagaacggc atagtgcgtg tttatgctta aatgcgtact tatatgcgtc  14220
tatttatgta ggatgaaagg tagtctagta cctcctgtga tattatccca ttccatgcgg  14280
ggtatcgtat gcttccttca gcactaccct ttagctgttc tatatgctgc cactcctcaa  14340
ttggattagt ctcatccttc aatgcattca tttcctttga tattggatca taccctagaa  14400
gtattacgtg attttctgcc ccttaccctc gttgctactc tccttttttt cgtgggaacc  14460
gctttagggc cctcagtgat ggtgttttgt aatttatatg ctcctcttgc atttgtgtct  14520
ctacttcttg ttcgcctgga gggaacttct tcatttgtat tagcatggtt cacttcagtc  14580
cttccttcca actcactctt tttttgctgt aaacgattct ctgccgccag ttcattgaaa  14640
ctattgaata tatcctttag agattccggg atgaataaat cacctattaa agcagcttga  14700
cgatctggtg gaactaaagt aagcaattgg gtaacgacgc ttacgagctt cataacatct  14760
tcttccgttg gagctggtgg gactaataac tgtgtacaat ccatttttct catgagcatt  14820
tcggtagctc tcttcttgtc tttctcgggc aatcttccta ttattatagc aatagatttg  14880
tatagttgct ttctattgtc taacagcttg ttattctgta gcatcaaatc tatggcagcc  14940
tgacttgctt cttgtgaaga gagcatacca tttccaatcg aagatacgct ggaatcttct  15000
gcgctagaat caagaccata cggcctaccg gttgtgagag attccatggg ccttatgaca  15060
tatcctggaa agagtagctc atcagactta cgtttactct ctatatcaat atctacatca  15120
ggagcaatca tttcaataaa cagccgacat acatcccaga cgctataagc tgtacgtgct  15180
tttaccgtca gattcttggc tgtttcaatg tcgtccattt tggttttctt ttaccagtat  15240
tgttcgtttg ataatgtatt cttgcttatt acattataaa atctgtgcag atcacatgtc  15300
aaaacaactt tttatcacaa gatagtaccg caaaacgaac ctgcgggccg tctaaaaatt  15360
aaggaaaagc agcaaaggtg catttttaaa atatgaaatg aagataccgc agtaccaatt  15420
attttcgcag tacaaataat gcgcggccgg tgcatttttc gaaagaacgc gagacaaaca  15480
ggacaattaa agttagtttt tcgagttagc gtgtttgaat actgcaagat acaagataaa  15540
tagagtagtt gaaactagat atcaattgca cacaagatcg gcgctaagca tgccacaatt  15600
tggtatatta tgtaaaacac cacctaaggt gcttgttcgt cagtttgtgg aaaggtttga  15660
aagaccttca ggtgagaaaa tagcattatg tgctgctgaa ctaacctatt tatgttggat  15720
gattacacat aacggaacag caatcaagag agccacattc atgagctata atactatcat  15780
aagcaattcg ctgagtttcg atattgtcaa taaatcactc cagtttaaat acaagacgca  15840
aaaagcaaca attctggaag cctcattaaa gaaattgatt cctgcttggg aatttacaat  15900
tattccttac tatggacaaa aacatcaatc tgatatcact gatattgtaa gtagtttgca  15960
attacagttc gaatcatcgg aagaagcaga taagggaaat agccacagta aaaaaatgct  16020
aaagcacttc taagtgaggg tgaaagcatc tgggagatca ctgagaaaat actaaattcg  16080
tttgagtata cttcgagatt tacaaaaaca aaaactttat accaattcct cttcctagct  16140
actttcatca attgtggaag attcagcgat attaagaacg ttgatccgaa atcatttaaa  16200
ttagtccaaa ataagtatct gggagtaata atccagtgtt tagtgacaga gacaaagaca  16260
agcgttagta ggcacatata cttctttagc gcaaggggta g                      16301
<210>48
<211>4989
<212>DNA
<213>载体pYIG7
<400>48
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc     60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc    120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa    180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gaatttaata    240
cgactcacta tagggaattc ggatccttca atatgcgcac atacgctgtt atgttcaagg    300
tcccttcgtt taagaacgaa agcggtcttc cttttgaggg atgtttcaag ttgttcaaat    360
ctatcaaatt tgcaaatccc cagtctgtat ctagagcgtt gaatcggtga tgcgatttgt    420
taattaaatt gatggtgtca ccattaccag gtctagatat accaatggca aactgagcac    480
aacaatacca gtccggatca actggcacca tctctcccgt agtctcatct aatttttctt    540
ccggatgagg ttccagatat accgcaacac ctttattatg gtttccctga gggaataata    600
gaatgtccca ttcgaaatca ccaattctaa acctgggcga attgtatttc gggtttgtta    660
actcgttcca gtcaggaatg ttccacgtga agctatcttc cagcaaagtc tccacttctt    720
catcaaattg tggagaatac tcccaatgct cttatctatg ggacttccgg gaaacacagt    780
accgatactt cccaattcgt cttcagagct cattgtttgt ttgaagagac taatcaaaga    840
atcgttttct caaaaaaatt aatatcttaa ctgatagttt gatcaaaggg gcaaaacgta    900
ggggcaaaca aacggaaaaa tcgtttctca aattttctga tgccaagaac tctaaccagt    960
cttatctaaa aattgcctta tgatccgtct ctccggttac agcctgtgta actgattaat   1020
cctgcctttc taatcaccat tctaatgttt taattaaggg attttgtctt cattaacggc   1080
tttcgctcat aaaaatgtta tgacgttttg cccgcaggcg ggaaaccatc cacttcacga   1140
gactgatctc ctctgccgga acaccgggca tctccaactt ataagttgga gaaataagag   1200
aatttcagat tgagagaatg aaaaaaaaaa accctgaaaa aaaaggttga aaccagttcc   1260
ctgaaattat tcccctactt gactaataag tatataaaga cggtaggtat tgattgtaat   1320
tctgtaaatc tatttcttaa acttcttaaa ttctactttt atagttagtc ttttttttag   1380
ttttaaaaca ccaagaactt agtttcgaat aaacacacat aaacaaacac catgaggtct   1440
ttgctaatac tagtgctttg cttcctgccc ctggctgctc tgggggtacc agatctcgac   1500
ttggttgaac acgttgccaa ggcttaagtg aatttacttt aaagtcttgc atttaaataa   1560
attttctttt tatagcttta tgacttagtt tcaatttata tactatttta atgacatttt   1620
cgattcattg attgaaagct ttgtgttttt tcttgatgcg ctattgcatt gttcttgtct   1680
ttttcgccac atgtaatatc tgtagtagat acctgataca ttgtggatgc tgagtgaaat   1740
tttagttaat aatggaggcg ctcttaataa ttttggggat attggctttt ttttttaaag   1800
tttacaaatg aattttttcc gccaggataa cgattctgaa gttactctta gcgttcctat   1860
cggtacagcc atcaaatcat gcctataaat catgcctata tttgcgtgca gtcagtatca   1920
tctacatgaa aaaaactccc gcaatttctt atagaatacg ttgaaaatta aatgtacgcg   1980
ccaagataag ataacatata tctagctaga tgcagtaata tacacagatt cccgcggacg   2040
tgggaaggaa aaaattagat aacaaaatct gagtgatatg gaaattccgc tgtatagctc   2100
atatctttcc cttcaacacc agaaatgtaa aaatcttgtt acgaaggatc tttttgctaa   2160
tgtttctcgc tcaatcctca tttcttccct acgaagagtc aaatctactt gttttctgcc   2220
ggtatcaaga tccatatctt ctagtttcac catcaaagtc caatttctag tatacagttt   2280
atgtcccaac gtaacagaca atcaaaattg gaaaggataa gtatccttca aagaatgatt   2340
ctgcgctggc tcctgaaccg cctaatggga acagagaagt ccaaaacgat gctataagaa   2400
ccagaaataa aacgataaaa ccataccagg atccaagctt ggcactggcc gtcgttttac   2460
aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc   2520
ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc   2580
gcagcctgaa tggcgaatgg gaaattgtaa acgttaatat tttgttaaaa ttcgcgttaa   2640
atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa atcccttata   2700
aatcaaaaga atagaccgag atagggttga gtgttgttcc agtttggaac aagagtccac   2760
tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac cgtctatcag ggcgatggcc   2820
cactacgtga accatcaccc taatcaagtt ttttggggtc gaggtgccgt aaagcactaa   2880
atcggaaccc taaagggagc ccccgattta gagcttgacg gggaaagccg gcgaacgtgg   2940
cgagaaagga agggaagaaa gcgaaaggag cgggcgctag ggcgctggca agtgtagcgg   3000
tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc gccgctacag ggcgcgtcag   3060
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt   3120
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa   3180
ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt   3240
gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt   3300
tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt   3360
ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg   3420
tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga   3480
atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa   3540
gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga   3600
caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa   3660
ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca   3720
ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta   3780
ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac   3840
ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc   3900
gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag   3960
ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga   4020
taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt   4080
agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata   4140
atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag   4200
aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa   4260
caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt   4320
ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc   4380
cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa   4440
tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa   4500
gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc   4560
ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag cattgagaaa   4620
gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa   4680
caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg   4740
ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc   4800
tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg   4860
ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg   4920
agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg   4980
aagcggaag                                                           4989
<210>49
<211>5422
<212>DNA
<213>载体pYIG7E1
<400>49
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc     60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc    120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa    180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gaatttaata    240
cgactcacta tagggaattc ggatccttca atatgcgcac atacgctgtt atgttcaagg    300
tcccttcgtt taagaacgaa agcggtcttc cttttgaggg atgtttcaag ttgttcaaat    360
ctatcaaatt tgcaaatccc cagtctgtat ctagagcgtt gaatcggtga tgcgatttgt    420
taattaaatt gatggtgtca ccattaccag gtctagatat accaatggca aactgagcac    480
aacaatacca gtccggatca actggcacca tctctcccgt agtctcatct aatttttctt    540
ccggatgagg ttccagatat accgcaacac ctttattatg gtttccctga gggaataata    600
gaatgtccca ttcgaaatca ccaattctaa acctgggcga attgtatttc gggtttgtta    660
actcgttcca gtcaggaatg ttccacgtga agctatcttc cagcaaagtc tccacttctt    720
catcaaattg tggagaatac tcccaatgct cttatctatg ggacttccgg gaaacacagt    780
accgatactt cccaattcgt cttcagagct cattgtttgt ttgaagagac taatcaaaga    840
atcgttttct caaaaaaatt aatatcttaa ctgatagttt gatcaaaggg gcaaaacgta    900
ggggcaaaca aacggaaaaa tcgtttctca aattttctga tgccaagaac tctaaccagt    960
cttatctaaa aattgcctta tgatccgtct ctccggttac agcctgtgta actgattaat   1020
cctgcctttc taatcaccat tctaatgttt taattaaggg attttgtctt cattaacggc   1080
tttcgctcat aaaaatgtta tgacgttttg cccgcaggcg ggaaaccatc cacttcacga   1140
gactgatctc ctctgccgga acaccgggca tctccaactt ataagttgga gaaataagag   1200
aatttcagat tgagagaatg aaaaaaaaaa accctgaaaa aaaaggttga aaccagttcc   1260
ctgaaattat tcccctactt gactaataag tatataaaga cggtaggtat tgattgtaat   1320
tctgtaaatc tatttcttaa acttcttaaa ttctactttt atagttagtc ttttttttag   1380
ttttaaaaca ccaagaactt agtttcgaat aaacacacat aaacaaacac catgaggtct   1440
ttgctaatac tagtgctttg cttcctgccc ctggctgctc tggggtatga ggtgcgcaac   1500
gtgtccggga tgtaccatgt cacgaacgac tgctccaact caagcattgt gtatgaggca   1560
gcggacatga tcatgcacac ccccgggtgc gtgccctgcg ttcgggagaa caactcttcc   1620
cgctgctggg tagcgctcac ccccacgctc gcagctagga acgccagcgt ccccaccacg   1680
acaatacgac gccacgtcga tttgctcgtt ggggcggctg ctttctgttc cgctatgtac   1740
gtgggggacc tctgcggatc tgtcttcctc gtctcccagc tgttcaccat ctcgcctcgc   1800
cggcatgaga cggtgcagga ctgcaattgc tcaatctatc ccggccacat aacgggtcac   1860
cgtatggctt gggatatgat gatgaactgg taatagaccc ttctcacctc ggccgataag   1920
ctcagatctc gacttggttg aacacgttgc caaggcttaa gtgaatttac tttaaagtct   1980
tgcatttaaa taaattttct ttttatagct ttatgactta gtttcaattt atatactatt   2040
ttaatgacat tttcgattca ttgattgaaa gctttgtgtt ttttcttgat gcgctattgc   2100
attgttcttg tctttttcgc cacatgtaat atctgtagta gatacctgat acattgtgga   2160
tgctgagtga aattttagtt aataatggag gcgctcttaa taattttggg gatattggct   2220
ttttttttta aagtttacaa atgaattttt tccgccagga taacgattct gaagttactc   2280
ttagcgttcc tatcggtaca gccatcaaat catgcctata aatcatgcct atatttgcgt   2340
gcagtcagta tcatctacat gaaaaaaact cccgcaattt cttatagaat acgttgaaaa   2400
ttaaatgtac gcgccaagat aagataacat atatctagct agatgcagta atatacacag   2460
attcccgcgg acgtgggaag gaaaaaatta gataacaaaa tctgagtgat atggaaattc   2520
cgctgtatag ctcatatctt tcccttcaac accagaaatg taaaaatctt gttacgaagg   2580
atctttttgc taatgtttct cgctcaatcc tcatttcttc cctacgaaga gtcaaatcta   2640
cttgttttct gccggtatca agatccatat cttctagttt caccatcaaa gtccaatttc   2700
tagtatacag tttatgtccc aacgtaacag acaatcaaaa ttggaaagga taagtatcct   2760
tcaaagaatg attctgcgct ggctcctgaa ccgcctaatg ggaacagaga agtccaaaac   2820
gatgctataa gaaccagaaa taaaacgata aaaccatacc aggatccaag cttggcactg   2880
gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt   2940
gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct   3000
tcccaacagt tgcgcagcct gaatggcgaa tgggaaattg taaacgttaa tattttgtta   3060
aaattcgcgt taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc   3120
aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg   3180
aacaagagtc cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat   3240
cagggcgatg gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc   3300
cgtaaagcac taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag   3360
ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg   3420
gcaagtgtag cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta   3480
cagggcgcgt caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt   3540
ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa   3600
taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt   3660
tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat   3720
gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag   3780
atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg   3840
ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata   3900
cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat   3960
ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc   4020
aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg   4080
ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac   4140
gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact   4200
ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa   4260
gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct   4320
ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc   4380
tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga   4440
cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac   4500
tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag   4560
atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg   4620
tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc   4680
tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag   4740
ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc   4800
cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac   4860
ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc   4920
gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt   4980
tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt   5040
gagcattgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc   5100
ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt   5160
tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca   5220
ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt   5280
tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt   5340
attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag   5400
tcagtgagcg aggaagcgga ag                                            5422
<210>50
<211>15621
<212>DNA
<213>载体pSY1YIG7E1s
<400>50
atcgataagc ttttcaattc aattcatcat ttttttttta ttcttttttt tgatttcggt     60
ttctttgaaa tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc    120
acagacttag attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag    180
tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga    240
aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta    300
atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg    360
aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg    420
atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca    480
agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat    540
tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg    600
gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg    660
aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag    720
aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta    780
ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg    840
gtgtgggttt agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg    900
tggtctctac aggatctgac attattattg ttggaagagg actatttgca aagggaaggg    960
atgctaaggt agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat   1020
gcggccagca aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa   1080
ttagagcttc aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt   1140
ataatgacga aaaaaaaaaa attggaaaga aaaagcttta atgcggtagt ttatcacagt   1200
taaattgcta acgcagtcag gcaccgtgta tgaaatctaa caatgcgctc atcgtcatcc   1260
tcggcaccgt caccctggat gctgtaggca taggcttggt tatgccggta ctgccgggcc   1320
tcttgcggga tatcgtccat tccgacagca tcgccagtca ctatggcgtg ctgctagcgc   1380
tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgctttg   1440
gccgccgccc agtcctgctc gcttcgctac ttggagccac tatcgactac gcgatcatgg   1500
cgaccacacc cgtcctgtgg atcctggtat ggttttatcg ttttatttct ggttcttata   1560
gcatcgtttt ggacttctct gttcccatta ggcggttcag gagccagcgc agaatcattc   1620
tttgaaggat acttatcctt tccaattttg attgtctgtt acgttgggac ataaactgta   1680
tactagaaat tggactttga tggtgaaact agaagatatg gatcttgata ccggcagaaa   1740
acaagtagat ttgactcttc gtagggaaga aatgaggatt gagcgagaaa cattagcaaa   1800
aagatccttc gtaacaagat ttttacattt ctggtgttga agggaaagat atgagctata   1860
cagcggaatt tccatatcac tcagattttg ttatctaatt ttttccttcc cacgtccgcg   1920
ggaatctgtg tatattactg catctagcta gatatatgtt atcttatctt ggcgcgtaca   1980
tttaattttc aacgtattct ataagaaatt gcgggagttt ttttcatgta gatgatactg   2040
actgcacgca aatataggca tgatttatag gcatgatttg atggctgtac cgataggaac   2100
gctaagagta acttcagaat cgttatcctg gcggaaaaaa ttcatttgta aactttaaaa   2160
aaaaaagcca atatccccaa aattattaag agcgcctcca ttattaacta aaatttcact   2220
cagcatccac aatgtatcag gtatctacta cagatattac atgtggcgaa aaagacaaga   2280
acaatgcaat agcgcatcaa gaaaaaacac aaagctttca atcaatgaat cgaaaatgtc   2340
attaaaatag tatataaatt gaaactaagt cataaagcta taaaaagaaa atttatttaa   2400
atgcaagact ttaaagtaaa ttcacttaag ccttggcaac gtgttcaacc aagtcgagat   2460
ctgagcttat cggccgaggt gagaagggtc tattaccagt tcatcatcat atcccaagcc   2520
atacggtgac ccgttatgtg gccgggatag attgagcaat tgcagtcctg caccgtctca   2580
tgccggcgag gcgagatggt gaacagctgg gagacgagga agacagatcc gcagaggtcc   2640
cccacgtaca tagcggaaca gaaagcagcc gccccaacga gcaaatcgac gtggcgtcgt   2700
attgtcgtgg tggggacgct ggcgttccta gctgcgagcg tgggggtgag cgctacccag   2760
cagcgggaag agttgttctc ccgaacgcag ggcacgcacc cgggggtgtg catgatcatg   2820
tccgctgcct catacacaat gcttgagttg gagcagtcgt tcgtgacatg gtacatcccg   2880
gacacgttgc gcacctcata ccccagagca gccaggggca ggaagcaaag cactagtatt   2940
agcaaagacc tcatggtgtt tgtttatgtg tgtttattcg aaactaagtt cttggtgttt   3000
taaaactaaa aaaaagacta actataaaag tagaatttaa gaagtttaag aaatagattt   3060
acagaattac aatcaatacc taccgtcttt atatacttat tagtcaagta ggggaataat   3120
ttcagggaac tggtttcaac cttttttttc agggtttttt tttttcattc tctcaatctg   3180
aaattctctt atttctccaa cttataagtt ggagatgccc ggtgttccgg cagaggagat   3240
cagtctcgtg aagtggatgg tttcccgcct gcgggcaaaa cgtcataaca tttttatgag   3300
cgaaagccgt taatgaagac aaaatccctt aattaaaaca ttagaatggt gattagaaag   3360
gcaggattaa tcagttacac aggctgtaac cggagagacg gatcataagg caatttttag   3420
ataagactgg ttagagttct tggcatcaga aaatttgaga aacgattttt ccgtttgttt   3480
gcccctacgt tttgcccctt tgatcaaact atcagttaag atattaattt ttttgagaaa   3540
acgattcttt gattagtctc ttcaaacaaa caatgagctc tgaagacgaa ttgggaagta   3600
tcggtactgt gtttcccgga agtcccatag ataagagcat tgggagtatt ctccacaatt   3660
tgatgaagaa gtggagactt tgctggaaga tagcttcacg tggaacattc ctgactggaa   3720
cgagttaaca aacccgaaat acaattcgcc caggtttaga attggtgatt tcgaatggga   3780
cattctatta ttccctcagg gaaaccataa taaaggtgtt gcggtatatc tggaacctca   3840
tccggaagaa aaattagatg agactacggg agagatggtg ccagttgatc cggactggta   3900
ttgttgtgct cagtttgcca ttggtatatc tagacctggt aatggtgaca ccatcaattt   3960
aattaacaaa tcgcatcacc gattcaacgc tctagataca gactggggat ttgcaaattt   4020
gatagatttg aacaacttga aacatccctc aaaaggaaga ccgctttcgt tcttaaacga   4080
agggaccttg aacataacag cgtatgtgcg catattgaag gatcctctac gccggacgca   4140
tcgtggccgg catcaccggc gccacaggtg cggttgctgg cccctatatc gccgacatca   4200
ccgatgggga agatcgggct cgccacttcg ggctcatgag cgcttgtttc ggcgtgggta   4260
tggtggcagg ccccgtggcc gggggactgt tgggcgccat ctccttgcat gcaccattcc   4320
ttgcggcggc ggtgctcaac ggcctcaacc tactactggg ctgcttccta atgcaggagt   4380
cgcataaggg agagcgtcga ccgatgccct tgagagcctt caacccagtc agctccttcc   4440
ggtgggcgcg gggcatgact atcgtcgccg cacttatgac tgtcttcttt atcatgcaac   4500
tcgtaggaca ggtgccggca gcgctctggg tcattttcgg cgaggaccgc tttcgctgga   4560
gcgcgacgat gatcggcctg tcgcttgcgg tattcggaat cttgcacgcc ctcgctcaag   4620
ccttcgtcac tggtcccgcc accaaacgtt tcggcgagaa gcaggccatt atcgccggca   4680
tggcggccga cgcgctgggc tacgtcttgc tggcgttcgc gacgcgaggc tggatggcct   4740
tccccattat gattcttctc gcttccggcg gcatcgggat gcccgcgttg caggccatgc   4800
tgtccaggca ggtagatgac gaccatcagg gacagcttca aggatcgctc gcggctctta   4860
ccagcctaac ttcgatcact ggaccgctga tcgtcacggc gatttatgcc gcctcggcga   4920
gcacatggaa cgggttggca tggattgtag gcgccgccct ataccttgtc tgcctccccg   4980
cgttgcgtcg cggtgcatgg agccgggcca cctcgacctg aatggaagcc ggcggcacct   5040
cgctaacgga ttcaccactc caagaattgg agccaatcaa ttcttgcgga gaactgtgaa   5100
tgcgcaaacc aacccttggc agaacatatc catcgcgtcc gccatctcca gcagccgcac   5160
gcggcgcatc tcgggcagcg ttgggtcctg gccacgggtg cgcatgatcg tgctcctgtc   5220
gttgaggacc cggctaggct ggcggggttg ccttactggt tagcagaatg aatcaccgat   5280
acgcgagcga acgtgaagcg actgctgctg caaaacgtct gcgacctgag caacaacatg   5340
aatggtcttc ggtttccgtg tttcgtaaag tctggaaacg cggaagtcag cgccctgcac   5400
cattatgttc cggatctgca tcgcaggatg ctgctggcta ccctgtggaa cacctacatc   5460
tgtattaacg aagcgctggc attgaccctg agtgattttt ctctggtccc gccgcatcca   5520
taccgccagt tgtttaccct cacaacgttc cagtaaccgg gcatgttcat catcagtaac   5580
ccgtatcgtg agcatcctct ctcgtttcat cggtatcatt acccccatga acagaaattc   5640
ccccttacac ggaggcatca agtgaccaaa caggaaaaaa ccgcccttaa catggcccgc   5700
tttatcagaa gccagacatt aacgcttctg gagaaactca acgagctgga cgcggatgaa   5760
caggcagaca tctgtgaatc gcttcacgac cacgctgatg agctttaccg cagctgcctc   5820
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca   5880
gcttgtctgt aagcggtgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg   5940
gcgggtgtcg gggcgcagcc atgacccagt cacgtagcga tagcggagtg tatactggct   6000
taactatgcg gcatcagagc agattgtact gagagtgcac catatgcggt gtgaaatacc   6060
gcacagatgc gtaaggagaa aataccgcat caggcgctct tccgcttcct cgctcactga   6120
ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat   6180
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca   6240
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc   6300
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata   6360
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc   6420
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc   6480
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga   6540
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc   6600
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag   6660
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag   6720
gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag   6780
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca   6840
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga   6900
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat   6960
cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga   7020
gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg   7080
tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga   7140
gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc   7200
agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac   7260
tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc   7320
agttaatagt ttgcgcaacg ttgttgccat tgctgcaggc atcgtggtgt cacgctcgtc   7380
gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc   7440
catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt   7500
ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc   7560
atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg   7620
tatgcggcga ccgagttgct cttgcccggc gtcaacacgg gataataccg cgccacatag   7680
cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat   7740
cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc   7800
atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa   7860
aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta   7920
ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa   7980
aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga   8040
aaccattatt atcatgacat taacctataa aaaataggcg tatcacgagg ccctttcgtc   8100
ttcaagaatt ctcatgtttg acagcttatc atcgatccac ttgtatattt ggatgaattt   8160
ttgaggaatt ctgaaccagt cctaaaacga gtaaatagga ccggcaattc ttcaagcaat   8220
aaacaggaat accaattatt aaaagataac ttagtcagat cgtacaataa agctttgaag   8280
aaaaatgcgc cttattcaat ctttgcataa aaaaatggcc caaaatctca cattggaaga   8340
catttgatga cctcatttct ttcaatgaag ggcctaacgg agttgactaa tgttgtggga   8400
aattggaccg ataagcgtgc ttctgccgtg gccaggacaa cgtatactca tcagataaca   8460
gcaatacctg atcactactt cgcactagtt tctcggtact atgcatatga tccaatatca   8520
aaggaaatga tagcattgaa ggatgagact aatccaattg aggagtggca gcatatagaa   8580
cagctaaagg gtagtgctga aggaagcata cgataccccg catggaatgg gataatatca   8640
caggaggtac tagactacct ttcatcctac ataaatagac gcatataagt acgcatttaa   8700
gcataaacac gcactatgcc gttcttctca tgtatatata tatacaggca acacgcagat   8760
ataggtgcga cgtgaacagt gagctgtatg tgcgcagctc gcgttgcatt ttcggaagcg   8820
ctcgttttcg gaaacgcttt gaagttccta ttccgaagtt cctattctct agaaagtata   8880
ggaacttcag agcgcttttg aaaaccaaaa gcgctctgaa gacgcacttt caaaaaacca   8940
aaaacgcacc ggactgtaac gagctactaa aatattgcga ataccgcttc cacaaacatt   9000
gctcaaaagt atctctttgc tatatatctc tgtgctatat ccctatataa ccatcccatc   9060
cacctttcgc tccttgaact tgcatctaaa ctcgacctct acatttttta tgtttatctc   9120
tagtattacc tcttagacaa aaaaattgta gtaagaacta ttcatagagt taatcgaaaa   9180
caatacgaaa atgtaaacat ttcctatacg tagtatatag agacaaaata gaagaaaccg   9240
ttcataattt tctgaccaat gaagaatcat caacgctatc actttctgtt cacaaagtat   9300
gcgcaatcca catcggtata gaatataatc ggggatgcct ttatcttgaa aaaatgcacc   9360
cgcagcttcg ctagtaatca gtaaacgcgg gaagtggagt caggcttttt ttatggaaga   9420
gaaaatagac accaaagtag ccttcttcta accttaacgg acctacagtg caaaaagtta   9480
tcaagagact gcattataga gcgcacaaag gagaaaaaaa gtaatctaag atgctttgtt   9540
agaaaaatag cgctctcggg atgcattttt gtagaacaaa aaagaagtat agattcttgt   9600
tggtaaaata gcgctctcgc gttgcatttc tgttctgtaa aaatgcagct cagattcttt   9660
gtttgaaaaa ttagcgctct cgcgttgcat ttttgtttta caaaaatgaa gcacagattc   9720
ttcgttggta aaatagcgct ttcgcgttgc atttctgttc tgtaaaaatg cagctcagat   9780
tctttgtttg aaaaattagc gctctcgcgt tgcatttttg ttctacaaaa tgaagcacag   9840
atgcttcgtt aacaaagata tgctattgaa gtgcaagatg gaaacgcaga aaatgaaccg   9900
gggatgcgac gtgcaagatt acctatgcaa tagatgcaat agtttctcca ggaaccgaaa   9960
tacatacatt gtcttccgta aagcgctaga ctatatatta ttatacaggt tcaaatatac  10020
tatctgtttc agggaaaact cccaggttcg gatgttcaaa attcaatgat gggtaacaag  10080
tacgatcgta aatctgtaaa acagtttgtc ggatattagg ctgtatctcc tcaaagcgta  10140
ttcgaatatc attgagaagc tgcatttttt tttttttttt tttttttttt ttttttatat  10200
atatttcaag gatataccat tgtaatgtct gcccctaaga agatcgtcgt tttgccaggt  10260
gaccacgttg gtcaagaaat cacagccgaa gccattaagg ttcttaaagc tatttctgat  10320
gttcgttcca atgtcaagtt cgatttcgaa aatcatttaa ttggtggtgc tgctatcgat  10380
gctacaggtg tcccacttcc agatgaggcg ctggaagcct ccaagaaggt tgatgccgtt  10440
ttgttaggtg ctgtgggtgg tcctaaatgg ggtaccggta gtgttagacc tgaacaaggt  10500
ttactaaaaa tccgtaaaga acttcaattg tacgccaact taagaccatg taactttgca  10560
tccgactctc ttttagactt atctccaatc aagccacaat ttgctaaagg tactgacttc  10620
gttgttgtca gagaattagt gggaggtatt tactttggta agagaaagga agacgatggt  10680
gatggtgtcg cttgggatag tgaacaatac accgttccag aagtgcaaag aatcacaaga  10740
atggccgctt tcatggccct acaacatgag ccaccattgc ctatttggtc cttggataaa  10800
gctaatgttt tggcctcttc aagattatgg agaaaaactg tggaggaaac catcaagaac  10860
gaattcccta cattgaaggt tcaacatcaa ttgattgatt ctgccgccat gatcctagtt  10920
aagaacccaa cccacctaaa tggtattata atcaccagca acatgtttgg tgatatcatc  10980
tccgatgaag cctccgttat cccaggttcc ttgggtttgt tgccatctgc gtccttggcc  11040
tctttgccag acaagaacac cgcatttggt ttgtacgaac catgccacgg ttctgctcca  11100
gatttgccaa agaataaggt tgaccctatc gccactatct tgtctgctgc aatgatgttg  11160
aaattgtcat tgaacttgcc tgaagaaggt aaggccattg aagatgcagt taaaaaggtt  11220
ttggatgcag gtatcagaac tggtgattta ggtggttcca acagtaccac cgaagtcggt  11280
gatgctgtcg ccgaagaagt taagaaaatc cttgcttaaa aagattctct ttttttatga  11340
tatttgtaca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaatgcag  11400
cgtcacatcg gataataatg atggcagcca ttgtagaagt gccttttgca tttctagtct  11460
ctttctcggt ctagctagtt ttactacatc gcgaagatag aatcttagat cacactgcct  11520
ttgctgagct ggatcatatg agtaacaaaa gagtggtaag gcctcgttaa aggacaagga  11580
cctgagcgga agtgtatcgt aaagtagacg gagtatacta gtatagtcta tagtccgtgg  11640
aattctaagt gccagcttta taatgtcatt ctccttacta cagacccgcc tgaaagtaga  11700
cacatcatca tcagtaagct ttgacaaaaa gcattgagta gctaactctt ctatgcaatc  11760
tatagctgtt ttataaggca ttcaatggac agattgaggt ttttgaaaca tactagtgaa  11820
attagcctta atcccttctc gaagttaatc atgcattatg gtgtaaaaaa tgcaactcgc  11880
gttgctctac tttttcccga atttccaaat acgcagctgg ggtgattgct cgatttcgta  11940
acgaaagttt tgtttataaa aaccgcgaaa accttctgta acagatagat ttttacagcg  12000
ctgatataca atgacatcag ctgtaatgga aaataactga aatatgaatg gcgagagact  12060
gcttgcttgt attaagcaat gtattatgca gcacttccaa cctatggtgt acgatgaaag  12120
taggtgtgta atcgagacga caagggggac ttttccagtt cctgatcatt ataagaaata  12180
caaaacgtta gcatttgcat ttgttggaca tgtactgaat acagacgaca caccggtaat  12240
tgaaaaagaa ctggattggc ctgatcctgc actagtgtac aatacaattg tcgatcgaat  12300
cataaatcac ccagaattat cacagtttat atcggttgca tttattagtc agttaaaggc  12360
caccatcgga gagggtttag atattaatgt aaaaggcacg ctaaaccgca ggggaaaggg  12420
tatcagaagg cctaaaggcg tattttttag atacatggaa tctccatttg tcaatacaaa  12480
ggtcactgca ttcttctctt atcttcgaga ttataataaa attgcctcag aatatcacaa  12540
taatactaaa ttcattctca cgttttcatg tcaagcatat tgggcatctg gcccaaactt  12600
ctccgccttg aagaatgtta tttggtgctc cataattcat gaatacattt ctaagtttgt  12660
ggaaagagaa caggataaag gtcatatagg agattaggag ctaccgcctg aagaggaccc  12720
ttctcgtgaa ctaaacaatg tacaacatga agtcaatagt ttaacggaac aagatgcgga  12780
ggcggatgaa ggattgtggg gtgaaataga ttcattatgt gaaaaatggc agtctgaagc  12840
ggagagtcaa actgaggcgg agataatagc cgacaggata attggaaata gccagaggat  12900
ggcgaacctc aaaattcgtc gtacaaagtt caaaagtgtc ttgtatcata tactaaagga  12960
actaattcaa tctcagggaa ccgtaaaggt ttatcgcggt agtagttttt cacacgattc  13020
gataaagata agcttacatt atgaagagca gcatattaca gccgtatggg tctacttgat  13080
agtaaaattt gaagagcatt ggaagcctgt tgatgtagag gtcgagttta gatgcaagtt  13140
caaggagcga aaggtggatg ggtaggttat atagggatat agcacagaga tatatagcaa  13200
agagatactt ttgaggcaat gtttgtggaa gcggtattcg caatatttta gtagctcgtt  13260
acagtccggt gcgtttttgg ttttttgaaa gtgcgtcttc agagcgcttt tggttttcaa  13320
aagcgctctg aagttcctat actttctaga gaataggaac ttcggaatag gaacttcaaa  13380
gcgtttccga aaacgagcgc ttccgaaaat gcaacgcgag ctgcgcacat acagctcact  13440
gttcacgtcg cacctatatc tgcgtgttgc ctgtatatat atatacatga gaagaacggc  13500
atagtgcgtg tttatgctta aatgcgtact tatatgcgtc tatttatgta ggatgaaagg  13560
tagtctagta cctcctgtga tattatccca ttccatgcgg ggtatcgtat gcttccttca  13620
gcactaccct ttagctgttc tatatgctgc cactcctcaa ttggattagt ctcatccttc  13680
aatgcattca tttcctttga tattggatca taccctagaa gtattacgtg attttctgcc  13740
ccttaccctc gttgctactc tccttttttt cgtgggaacc gctttagggc cctcagtgat  13800
ggtgttttgt aatttatatg ctcctcttgc atttgtgtct ctacttcttg ttcgcctgga  13860
gggaacttct tcatttgtat tagcatggtt cacttcagtc cttccttcca actcactctt  13920
tttttgctgt aaacgattct ctgccgccag ttcattgaaa ctattgaata tatcctttag  13980
agattccggg atgaataaat cacctattaa agcagcttga cgatctggtg gaactaaagt  14040
aagcaattgg gtaacgacgc ttacgagctt cataacatct tcttccgttg gagctggtgg  14100
gactaataac tgtgtacaat ccatttttct catgagcatt tcggtagctc tcttcttgtc  14160
tttctcgggc aatcttccta ttattatagc aatagatttg tatagttgct ttctattgtc  14220
taacagcttg ttattctgta gcatcaaatc tatggcagcc tgacttgctt cttgtgaaga  14280
gagcatacca tttccaatcg aagatacgct ggaatcttct gcgctagaat caagaccata  14340
cggcctaccg gttgtgagag attccatggg ccttatgaca tatcctggaa agagtagctc  14400
atcagactta cgtttactct ctatatcaat atctacatca ggagcaatca tttcaataaa  14460
cagccgacat acatcccaga cgctataagc tgtacgtgct tttaccgtca gattcttggc  14520
tgtttcaatg tcgtccattt tggttttctt ttaccagtat tgttcgtttg ataatgtatt  14580
cttgcttatt acattataaa atctgtgcag atcacatgtc aaaacaactt tttatcacaa  14640
gatagtaccg caaaacgaac ctgcgggccg tctaaaaatt aaggaaaagc agcaaaggtg  14700
catttttaaa atatgaaatg aagataccgc agtaccaatt attttcgcag tacaaataat  14760
gcgcggccgg tgcatttttc gaaagaacgc gagacaaaca ggacaattaa agttagtttt  14820
tcgagttagc gtgtttgaat actgcaagat acaagataaa tagagtagtt gaaactagat  14880
atcaattgca cacaagatcg gcgctaagca tgccacaatt tggtatatta tgtaaaacac  14940
cacctaaggt gcttgttcgt cagtttgtgg aaaggtttga aagaccttca ggtgagaaaa  15000
tagcattatg tgctgctgaa ctaacctatt tatgttggat gattacacat aacggaacag  15060
caatcaagag agccacattc atgagctata atactatcat aagcaattcg ctgagtttcg  15120
atattgtcaa taaatcactc cagtttaaat acaagacgca aaaagcaaca attctggaag  15180
cctcattaaa gaaattgatt cctgcttggg aatttacaat tattccttac tatggacaaa  15240
aacatcaatc tgatatcact gatattgtaa gtagtttgca attacagttc gaatcatcgg  15300
aagaagcaga taagggaaat agccacagta aaaaaatgct aaagcacttc taagtgaggg  15360
tgaaagcatc tgggagatca ctgagaaaat actaaattcg tttgagtata cttcgagatt  15420
tacaaaaaca aaaactttat accaattcct cttcctagct actttcatca attgtggaag  15480
attcagcgat attaagaacg ttgatccgaa atcatttaaa ttagtccaaa ataagtatct  15540
gggagtaata atccagtgtt tagtgacaga gacaaagaca agcgttagta ggcacatata  15600
cttctttagc gcaaggggta g                                            15621
<210>51
<211>3593
<212>DNA
<213>载体pPICZa1phaA
<400>51
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag     60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt    120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc    180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta    240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta    300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg    360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct    420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg    480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt    540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct    600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct    660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact    720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat    780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt    840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga    900
caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt    960
tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga   1020
agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga   1080
tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa   1140
tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaagagaggc   1200
tgaagctgaa ttcacgtggc ccagccggcc gtctcggatc ggtacctcga gccgcggcgg   1260
ccgccagctt tctagaacaa aaactcatct cagaagagga tctgaatagc gccgtcgacc   1320
atcatcatca tcatcattga gtttgtagcc ttagacatga ctgttcctca gttcaagttg   1380
ggcacttacg agaagaccgg tcttgctaga ttctaatcaa gaggatgtca gaatgccatt   1440
tgcctgagag atgcaggctt catttttgat acttttttat ttgtaaccta tatagtatag   1500
gatttttttt gtcattttgt ttcttctcgt acgagcttgc tcctgatcag cctatctcgc   1560
agctgatgaa tatcttgtgg taggggtttg ggaaaatcat tcgagtttga tgtttttctt   1620
ggtatttccc actcctcttc agagtacaga agattaagtg agaccttcgt ttgtgcggat   1680
cccccacaca ccatagcttc aaaatgtttc tactcctttt ttactcttcc agattttctc   1740
ggactccgcg catcgccgta ccacttcaaa acacccaagc acagcatact aaattttccc   1800
tctttcttcc tctagggtgt cgttaattac ccgtactaaa ggtttggaaa agaaaaaaga   1860
gaccgcctcg tttctttttc ttcgtcgaaa aaggcaataa aaatttttat cacgtttctt   1920
tttcttgaaa tttttttttt tagttttttt ctctttcagt gacctccatt gatatttaag   1980
ttaataaacg gtcttcaatt tctcaagttt cagtttcatt tttcttgttc tattacaact   2040
ttttttactt cttgttcatt agaaagaaag catagcaatc taatctaagg ggcggtgttg   2100
acaattaatc atcggcatag tatatcggca tagtataata cgacaaggtg aggaactaaa   2160
ccatggccaa gttgaccagt gccgttccgg tgctcaccgc gcgcgacgtc gccggagcgg   2220
tcgagttctg gaccgaccgg ctcgggttct cccgggactt cgtggaggac gacttcgccg   2280
gtgtggtccg ggacgacgtg accctgttca tcagcgcggt ccaggaccag gtggtgccgg   2340
acaacaccct ggcctgggtg tgggtgcgcg gcctggacga gctgtacgcc gagtggtcgg   2400
aggtcgtgtc cacgaacttc cgggacgcct ccgggccggc catgaccgag atcggcgagc   2460
agccgtgggg gcgggagttc gccctgcgcg acccggccgg caactgcgtg cacttcgtgg   2520
ccgaggagca ggactgacac gtccgacggc ggcccacggg tcccaggcct cggagatccg   2580
tccccctttt cctttgtcga tatcatgtaa ttagttatgt cacgcttaca ttcacgccct   2640
ccccccacat ccgctctaac cgaaaaggaa ggagttagac aacctgaagt ctaggtccct   2700
atttattttt ttatagttat gttagtatta agaacgttat ttatatttca aatttttctt   2760
ttttttctgt acagacgcgt gtacgcatgt aacattatac tgaaaacctt gcttgagaag   2820
gttttgggac gctcgaaggc tttaatttgc aagctggaga ccaacatgtg agcaaaaggc   2880
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc   2940
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga   3000
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc   3060
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa   3120
tgctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg   3180
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc   3240
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga   3300
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact   3360
agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt   3420
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag   3480
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg   3540
tctcacgctc agtggaacga aaactcacgt taagggattt tggtcatgag atc          3593
<210>52
<211>3547
<212>DNA
<213>载体pPICZa1phaD′
<400>52
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag     60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt    120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc    180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta    240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta    300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg    360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct    420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg    480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt    540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct    600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct    660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact    720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat    780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt    840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga    900
caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt    960
tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga   1020
agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga   1080
tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa   1140
tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaaggggccc   1200
gaattcgcat gcggccgcca gctttctaga acaaaaactc atctcagaag aggatctgaa   1260
tagcgccgtc gaccatcatc atcatcatca ttgagtttgt agccttagac atgactgttc   1320
ctcagttcaa gttgggcact tacgagaaga ccggtcttgc tagattctaa tcaagaggat   1380
gtcagaatgc catttgcctg agagatgcag gcttcatttt tgatactttt ttatttgtaa   1440
cctatatagt ataggatttt ttttgtcatt ttgtttcttc tcgtacgagc ttgctcctga   1500
tcagcctatc tcgcagctga tgaatatctt gtggtagggg tttgggaaaa tcattcgagt   1560
ttgatgtttt tcttggtatt tcccactcct cttcagagta cagaagatta agtgagacct   1620
tcgtttgtgc ggatccccca cacaccatag cttcaaaatg tttctactcc ttttttactc   1680
ttccagattt tctcggactc cgcgcatcgc cgtaccactt caaaacaccc aagcacagca   1740
tactaaattt tccctctttc ttcctctagg gtgtcgttaa ttacccgtac taaaggtttg   1800
gaaaagaaaa aagagaccgc ctcgtttctt tttcttcgtc gaaaaaggca ataaaaattt   1860
ttatcacgtt tctttttctt gaaatttttt tttttagttt ttttctcttt cagtgacctc   1920
cattgatatt taagttaata aacggtcttc aatttctcaa gtttcagttt catttttctt   1980
gttctattac aacttttttt acttcttgtt cattagaaag aaagcatagc aatctaatct   2040
aaggggcggt gttgacaatt aatcatcggc atagtatatc ggcatagtat aatacgacaa   2100
ggtgaggaac taaaccatgg ccaagttgac cagtgccgtt ccggtgctca ccgcgcgcga   2160
cgtcgccgga gcggtcgagt tctggaccga ccggctcggg ttctcccggg acttcgtgga   2220
ggacgacttc gccggtgtgg tccgggacga cgtgaccctg ttcatcagcg cggtccagga   2280
ccaggtggtg ccggacaaca ccctggcctg ggtgtgggtg cgcggcctgg acgagctgta   2340
cgccgagtgg tcggaggtcg tgtccacgaa cttccgggac gcctccgggc cggccatgac   2400
cgagatcggc gagcagccgt gggggcggga gttcgccctg cgcgacccgg ccggcaactg   2460
cgtgcacttc gtggccgagg agcaggactg acacgtccga cggcggccca cgggtcccag   2520
gcctcggaga tccgtccccc ttttcctttg tcgatatcat gtaattagtt atgtcacgct   2580
tacattcacg ccctcccccc acatccgctc taaccgaaaa ggaaggagtt agacaacctg   2640
aagtctaggt ccctatttat ttttttatag ttatgttagt attaagaacg ttatttatat   2700
ttcaaatttt tctttttttt ctgtacagac gcgtgtacgc atgtaacatt atactgaaaa   2760
ccttgcttga gaaggttttg ggacgctcga aggctttaat ttgcaagctg gagaccaaca   2820
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt   2880
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc   2940
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct   3000
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg   3060
tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca   3120
agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact   3180
atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta   3240
acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta   3300
actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct   3360
tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtfgtt   3420
tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga   3480
tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca   3540
tgagatc                                                             3547
<210>53
<211>3558
<212>DNA
<213>载体pPICZa1phaE′
<400>53
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag     60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt    120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc    180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta    240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta    300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg    360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct    420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg    480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt    540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct    600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct    660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact    720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat    780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt    840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga    900
caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt    960
tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga   1020
agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga   1080
tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa   1140
tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaagagaggc   1200
tgaagcctgc agcatatgct cgaggccgcc agctttctag aacaaaaact catctcagaa   1260
gaggatctga atagcgccgt cgaccatcat catcatcatc attgagtttg tagccttaga   1320
catgactgtt cctcagttca agttgggcac ttacgagaag accggtcttg ctagattcta   1380
atcaagagga tgtcagaatg ccatttgcct gagagatgca ggcttcattt ttgatacttt   1440
tttatttgta acctatatag tataggattt tttttgtcat tttgtttctt ctcgtacgag   1500
cttgctcctg atcagcctat ctcgcagctg atgaatatct tgtggtaggg gtttgggaaa   1560
atcattcgag tttgatgttt ttcttggtat ttcccactcc tcttcagagt acagaagatt   1620
aagtgagacc ttcgtttgtg cggatccccc acacaccata gcttcaaaat gtttctactc   1680
cttttttact cttccagatt ttctcggact ccgcgcatcg ccgtaccact tcaaaacacc   1740
caagcacagc atactaaatt ttccctcttt cttcctctag ggtgtcgtta attacccgta   1800
ctaaaggttt ggaaaagaaa aaagagaccg cctcgtttct ttttcttcgt cgaaaaaggc   1860
aataaaaatt tttatcacgt ttctttttct tgaaattttt ttttttagtt tttttctctt   1920
tcagtgacct ccattgatat ttaagttaat aaacggtctt caatttctca agtttcagtt   1980
tcatttttct tgttctatta caactttttt tacttcttgt tcattagaaa gaaagcatag   2040
caatctaatc taaggggcgg tgttgacaat taatcatcgg catagtatat cggcatagta   2100
taatacgaca aggtgaggaa ctaaaccatg gccaagttga ccagtgccgt tccggtgctc   2160
accgcgcgcg acgtcgccgg agcggtcgag ttctggaccg accggctcgg gttctcccgg   2220
gacttcgtgg aggacgactt cgccggtgtg gtccgggacg acgtgaccct gttcatcagc   2280
gcggtccagg accaggtggt gccggacaac accctggcct gggtgtgggt gcgcggcctg   2340
gacgagctgt acgccgagtg gtcggaggtc gtgtccacga acttccggga cgcctccggg   2400
ccggccatga ccgagatcgg cgagcagccg tgggggcggg agttcgccct gcgcgacccg   2460
gccggcaact gcgtgcactt cgtggccgag gagcaggact gacacgtccg acggcggccc   2520
acgggtccca ggcctcggag atccgtcccc cttttccttt gtcgatatca tgtaattagt   2580
tatgtcacgc ttacattcac gccctccccc cacatccgct ctaaccgaaa aggaaggagt   2640
tagacaacct gaagtctagg tccctattta tttttttata gttatgttag tattaagaac   2700
gttatttata tttcaaattt ttcttttttt tctgtacaga cgcgtgtacg catgtaacat   2760
tatactgaaa accttgcttg agaaggtttt gggacgctcg aaggctttaa tttgcaagct   2820
ggagaccaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt   2880
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag   2940
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc   3000
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc   3060
ttcgggaagc gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt   3120
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt   3180
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc   3240
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa   3300
gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa  3360
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg  3420
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga  3480
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg  3540
gattttggtc atgagatc                                                3558
<210>54
<211>28
<212>DNA
<213>合成探针或引物
<400>54
tcgagaaaag gggcccgaat tcgcatgc                                       28
<210>55
<211>28
<212>DNA
<213>合成探针或引物
<400>55
ggccgcatgc gaattcgggc cccttttc                                       28
<210>56
<211>35
<212>DNA
<213>合成探针或引物
<400>56
tcgagaaaag agaggctgaa gcctgcagca tatgc                               35
<210>57
<211>35
<212>DNA
<213>合成探针或引物
<400>57
ggccgcatat gctgcaggct tcagcctctc ttttc                                35
<210>58
<211>3997
<212>DNA
<213>载体pPICZa1phaD′E1sH6
<400>58
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag     60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt    120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc    180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta    240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta    300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg    360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct    420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg    480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt    540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct    600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct    660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact    720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat    780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt    840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga    900
caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt    960
tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga   1020
agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga   1080
tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa   1140
tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaaggtatga   1200
ggtgcgcaac gtgtccggga tgtaccatgt cacgaacgac tgctccaact caagcattgt   1260
gtatgaggca gcggacatga tcatgcacac ccccgggtgc gtgccctgcg ttcgggagaa   1320
caactcttcc cgctgctggg tagcgctcac ccccacgctc gcagctagga acgccagcgt   1380
ccccactacg acaatacgac gccacgtcga tttgctcgtt ggggcggctg ctttctgttc   1440
cgctatgtac gtgggggatc tctgcggatc tgtcttcctc gtctcccagc tgttcaccat   1500
ctcgcctcgc cggcatgaga cggtgcagga ctgcaattgc tcaatctatc ccggccacat   1560
aacaggtcac cgtatggctt gggatatgat gatgaactgg caccaccacc atcaccatta   1620
aagatctaag cttgaatccc gcggccatgc gaattcgcat gcggccgcca gctttctaga   1680
acaaaaactc atctcagaag aggatctgaa tagcgccgtc gaccatcatc atcatcatca   1740
ttgagtttgt agccttagac atgactgttc ctcagttcaa gttgggcact tacgagaaga   1800
ccggtcttgc tagattctaa tcaagaggat gtcagaatgc catttgcctg agagatgcag   1860
gcttcatttt tgatactttt ttatttgtaa cctatatagt ataggatttt ttttgtcatt   1920
ttgtttcttc tcgtacgagc ttgctcctga tcagcctatc tcgcagctga tgaatatctt   1980
gtggtagggg tttgggaaaa tcattcgagt ttgatgtttt tcttggtatt tcccactcct   2040
cttcagagta cagaagatta agtgagacct tcgtttgtgc ggatccccca cacaccatag   2100
cttcaaaatg tttctactcc ttttttactc ttccagattt tctcggactc cgcgcatcgc   2160
cgtaccactt caaaacaccc aagcacagca tactaaattt tccctctttc ttcctctagg   2220
gtgtcgttaa ttacccgtac taaaggtttg gaaaagaaaa aagagaccgc ctcgtttctt   2280
tttcttcgtc gaaaaaggca ataaaaattt ttatcacgtt tctttttctt gaaatttttt   2340
tttttagttt ttttctcttt cagtgacctc cattgatatt taagttaata aacggtcttc   2400
aatttctcaa gtttcagttt catttttctt gttctattac aacttttttt acttcttgtt   2460
cattagaaag aaagcatagc aatctaatct aaggggcggt gttgacaatt aatcatcggc   2520
atagtatatc ggcatagtat aatacgacaa ggtgaggaac taaaccatgg ccaagttgac   2580
cagtgccgtt ccggtgctca ccgcgcgcga cgtcgccgga gcggtcgagt tctggaccga   2640
ccggctcggg ttctcccggg acttcgtgga ggacgacttc gccggtgtgg tccgggacga   2700
cgtgaccctg ttcatcagcg cggtccagga ccaggtggtg ccggacaaca ccctggcctg   2760
ggtgtgggtg cgcggcctgg acgagctgta cgccgagtgg tcggaggtcg tgtccacgaa   2820
cttccgggac gcctccgggc cggccatgac cgagatcggc gagcagccgt gggggcggga   2880
gttcgccctg cgcgacccgg ccggcaactg cgtgcacttc gtggccgagg agcaggactg   2940
acacgtccga cggcggccca cgggtcccag gcctcggaga tccgtccccc ttttcctttg   3000
tcgatatcat gtaattagtt atgtcacgct tacattcacg ccctcccccc acatccgctc   3060
taaccgaaaa ggaaggagtt agacaacctg aagtctaggt ccctatttat ttttttatag   3120
ttatgttagt attaagaacg ttatttatat ttcaaatttt tctttttttt ctgtacagac   3180
gcgtgtacgc atgtaacatt atactgaaaa ccttgcttga gaaggttttg ggacgctcga   3240
aggctttaat ttgcaagctg gagaccaaca tgtgagcaaa aggccagcaa aaggccagga   3300
accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc   3360
acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg   3420
cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat   3480
acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcaatgctca cgctgtaggt   3540
atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc   3600
agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg   3660
acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg   3720
gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg   3780
gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg   3840
gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca   3900
gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga   3960
acgaaaactc acgttaaggg attttggtca tgagatc                            3997
<210>59
<211>4004
<212>DNA
<213>载体pPICZa1phaE′E1sH6
<400>59
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag     60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt    120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc    180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta    240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta    300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg    360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct    420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg    480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt    540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct    600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct    660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact    720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat    780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt    840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga    900
caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt    960
tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga   1020
agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga   1080
tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa   1140
tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaagagaggc   1200
tgaagcctat gaggtgcgca acgtgtccgg gatgtaccat gtcacgaacg actgctccaa   1260
ctcaagcatt gtgtatgagg cagcggacat gatcatgcac acccccgggt gcgtgccctg   1320
cgttcgggag aacaactctt cccgctgctg ggtagcgctc acccccacgc tcgcagctag   1380
gaacgccagc gtccccacta cgacaatacg acgccacgtc gatttgctcg ttggggcggc   1440
tgctttctgt tccgctatgt acgtggggga tctctgcgga tctgtcttcc tcgtctccca   1500
gctgttcacc atctcgcctc gccggcatga gacggtgcag gactgcaatt gctcaatcta   1560
tcccggccac ataacgggtc accgtatggc ttgggatatg atgatgaact ggcaccacca   1620
ccatcaccat taaagatcta agcttgaatc ccgcggccat ggcatatgcg gccgccagct   1680
ttctagaaca aaaactcatc tcagaagagg atctgaatag cgccgtcgac catcatcatc   1740
atcatcattg agtttgtagc cttagacatg actgttcctc agttcaagtt gggcacttac   1800
gagaagaccg gtcttgctag attctaatca agaggatgtc agaatgccat ttgcctgaga   1860
gatgcaggct tcatttttga tactttttta tttgtaacct atatagtata ggattttttt   1920
tgtcattttg tttcttctcg tacgagcttg ctcctgatca gcctatctcg cagctgatga   1980
atatcttgtg gtaggggttt gggaaaatca ttcgagtttg atgtttttct tggtatttcc   2040
cactcctctt cagagtacag aagattaagt gagaccttcg tttgtgcgga tcccccacac   2100
accatagctt caaaatgttt ctactccttt tttactcttc cagattttct cggactccgc   2160
gcatcgccgt accacttcaa aacacccaag cacagcatac taaattttcc ctctttcttc   2220
ctctagggtg tcgttaatta cccgtactaa aggtttggaa aagaaaaaag agaccgcctc   2280
gtttcttttt cttcgtcgaa aaaggcaata aaaattttta tcacgtttct ttttcttgaa   2340
attttttttt ttagtttttt tctctttcag tgacctccat tgatatttaa gttaataaac   2400
ggtcttcaat ttctcaagtt tcagtttcat ttttcttgtt ctattacaac tttttttact   2460
tcttgttcat tagaaagaaa gcatagcaat ctaatctaag gggcggtgtt gacaattaat   2520
catcggcata gtatatcggc atagtataat acgacaaggt gaggaactaa accatggcca   2580
agttgaccag tgccgttccg gtgctcaccg cgcgcgacgt cgccggagcg gtcgagttct   2640
ggaccgaccg gctcgggttc tcccgggact tcgtggagga cgacttcgcc ggtgtggtcc   2700
gggacgacgt gaccctgttc atcagcgcgg tccaggacca ggtggtgccg gacaacaccc   2760
tggcctgggt gtgggtgcgc ggcctggacg agctgtacgc cgagtggtcg gaggtcgtgt   2820
ccacgaactt ccgggacgcc tccgggccgg ccatgaccga gatcggcgag cagccgtggg   2880
ggcgggagtt cgccctgcgc gacccggccg gcaactgcgt gcacttcgtg gccgaggagc   2940
aggactgaca cgtccgacgg cggcccacgg gtcccaggcc tcggagatcc gtcccccttt   3000
tcctttgtcg atatcatgta attagttatg tcacgcttac attcacgccc tccccccaca   3060
tccgctctaa ccgaaaagga aggagttaga caacctgaag tctaggtccc tatttatttt   3120
tttatagtta tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg   3180
tacagacgcg tgtacgcatg taacattata ctgaaaacct tgcttgagaa ggttttggga   3240
cgctcgaagg ctttaatttg caagctggag accaacatgt gagcaaaagg ccagcaaaag   3300
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac   3360
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga   3420
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt   3480
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc   3540
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc   3600
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta   3660
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat   3720
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca   3780
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct   3840
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt   3900
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct   3960
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gatc                    4004
<210>60
<211>4492
<212>DNA
<213>载体pPICZa1phaD′E2sH6
<400>60
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag     60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt    120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc    180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta    240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta    300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg    360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct    420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg    480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt    540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct    600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct    660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact    720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat    780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt    840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga    900
caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt    960
tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga   1020
agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga   1080
tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa   1140
tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaaggcatac   1200
ccgcgtgtca ggaggggcag cagcctccga taccaggggc cttgtgtccc tctttagccc   1260
cgggtcggct cagaaaatcc agctcgtaaa caccaacggc agttggcaca tcaacaggac   1320
tgccctgaac tgcaacgact ccctccaaac agggttcttt gccgcactat tctacaaaca   1380
caaattcaac tcgtctggat gcccagagcg cttggccagc tgtcgctcca tcgacaagtt   1440
cgctcagggg tggggtcccc tcacttacac tgagcctaac agctcggacc agaggcccta   1500
ctgctggcac tacgcgcctc gaccgtgtgg tattgtaccc gcgtctcagg tgtgcggtcc   1560
agtgtattgc ttcaccccga gccctgttgt ggtggggacg accgatcggt ttggtgtccc   1620
cacgtataac tggggggcga acgactcgga tgtgctgatt ctcaacaaca cgcggccgcc   1680
gcgaggcaac tggttcggct gtacatggat gaatggcact gggttcacca agacgtgtgg   1740
gggccccccg tgcaacatcg ggggggccgg caacaacacc ttgacctgcc ccactgactg   1800
ttttcggaag caccccgagg ccacctacgc cagatgcggt tctgggccct ggctgacacc   1860
taggtgtatg gttcattacc catataggct ctggcactac ccctgcactg tcaacttcac   1920
catcttcaag gttaggatgt acgtgggggg cgtggagcac aggttcgaag ccgcatgcaa   1980
ttggactcga ggagagcgtt gtgacttgga ggacagggat agatcagagc ttagcccgct   2040
gctgctgtct acaacagagt ggcaggtgat cgagggcaga caccatcacc accatcacta   2100
atagttaatt aactgcaggc atgcaagctt atcgataccg tcgacgaatt cgcatgcggc   2160
cgccagcttt ctagaacaaa aactcatctc agaagaggat ctgaatagcg ccgtcgacca   2220
tcatcatcat catcattgag tttgtagcct tagacatgac tgttcctcag ttcaagttgg   2280
gcacttacga gaagaccggt cttgctagat tctaatcaag aggatgtcag aatgccattt   2340
gcctgagaga tgcaggcttc atttttgata cttttttatt tgtaacctat atagtatagg   2400
attttttttg tcattttgtt tcttctcgta cgagcttgct cctgatcagc ctatctcgca   2460
gctgatgaat atcttgtggt aggggtttgg gaaaatcatt cgagtttgat gtttttcttg   2520
gtatttccca ctcctcttca gagtacagaa gattaagtga gaccttcgtt tgtgcggatc   2580
ccccacacac catagcttca aaatgtttct actccttttt tactcttcca gattttctcg   2640
gactccgcgc atcgccgtac cacttcaaaa cacccaagca cagcatacta aattttccct   2700
ctttcttcct ctagggtgtc gttaattacc cgtactaaag gtttggaaaa gaaaaaagag   2760
accgcctcgt ttctttttct tcgtcgaaaa aggcaataaa aatttttatc acgtttcttt   2820
ttcttgaaat tttttttttt agtttttttc tctttcagtg acctccattg atatttaagt   2880
taataaacgg tcttcaattt ctcaagtttc agtttcattt ttcttgttct attacaactt   2940
tttttacttc ttgttcatta gaaagaaagc atagcaatct aatctaaggg gcggtgttga   3000
caattaatca tcggcatagt atatcggcat agtataatac gacaaggtga ggaactaaac   3060
catggccaag ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt   3120
cgagttctgg accgaccggc tcgggttctc ccgggacttc gtggaggacg acttcgccgg   3180
tgtggtccgg gacgacgtga ccctgttcat cagcgcggtc caggaccagg tggtgccgga   3240
caacaccctg gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga   3300
ggtcgtgtcc acgaacttcc gggacgcctc cgggccggcc atgaccgaga tcggcgagca   3360
gccgtggggg cgggagttcg ccctgcgcga cccggccggc aactgcgtgc acttcgtggc   3420
cgaggagcag gactgacacg tccgacggcg gcccacgggt cccaggcctc ggagatccgt   3480
cccccttttc ctttgtcgat atcatgtaat tagttatgtc acgcttacat tcacgccctc   3540
cccccacatc cgctctaacc gaaaaggaag gagttagaca acctgaagtc taggtcccta   3600
tttatttttt tatagttatg ttagtattaa gaacgttatt tatatttcaa atttttcttt   3660
tttttctgta cagacgcgtg tacgcatgta acattatact gaaaaccttg cttgagaagg   3720
ttttgggacg ctcgaaggct ttaatttgca agctggagac caacatgtga gcaaaaggcc   3780
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc   3840
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac   3900
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc   3960
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat   4020
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc   4080
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca   4140
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag   4200
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta   4260
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg   4320
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc   4380
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt   4440
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga tc           4492
<210>61
<211>4431
<212>DNA
<213>载体pPICZa1phaE′E2sH6
<400>61
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag     60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt    120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc    180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta    240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta    300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg    360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct    420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg    480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt    540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct    600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct    660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact    720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat    780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt    840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga    900
caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt    960
tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga   1020
agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga   1080
tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa   1140
tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaagagaggc   1200
tgaagcccat acccgcgtgt caggaggggc agcagcctcc gataccaggg gccttgtgtc   1260
cctctttagc cccgggtcgg ctcagaaaat ccagctcgta aacaccaacg gcagttggca   1320
catcaacagg actgccctga actgcaacga ctccctccaa acagggttct ttgccgcact   1380
attctacaaa cacaaattca actcgtctgg atgcccagag cgcttggcca gctgtcgctc   1440
catcgacaag ttcgctcagg ggtggggtcc cctcacttac actgagccta acagctcgga   1500
ccagaggccc tactgctggc actacgcgcc tcgaccgtgt ggtattgtac ccgcgtctca   1560
ggtgtgcggt ccagtgtatt gcttcacccc gagccctgtt gtggtgggga cgaccgatcg   1620
gtttggtgtc cccacgtata actggggggc gaacgactcg gatgtgctga ttctcaacaa   1680
cacgcggccg ccgcgaggca actggttcgg ctgtacatgg atgaatggca ctgggttcac   1740
caagacgtgt gggggccccc cgtgcaacat cgggggggcc ggcaacaaca ccttgacctg   1800
ccccactgac tgttttcgga agcaccccga ggccacctac gccagatgcg gttctgggcc   1860
ctggctgaca cctaggtgta tggttcatta cccatatagg ctctggcact acccctgcac   1920
tgtcaacttc accatcttca aggttaggat gtacgtgggg ggcgtggagc acaggttcga   1980
agccgcatgc aattggactc gaggagagcg ttgtgacttg gaggacaggg atagatcaga   2040
gcttagcccg ctgctgctgt ctacaacaga gtggcaggtg atcgagggca gacaccatca   2100
ccaccatcac taatagttaa ttaactgcag gcatgcaagc ttatcgatac cgtcgaccat   2160
catcatcatc atcattgagt ttgtagcctt agacatgact gttcctcagt tcaagttggg   2220
cacttacgag aagaccggtc ttgctagatt ctaatcaaga ggatgtcaga atgccatttg   2280
cctgagagat gcaggcttca tttttgatac ttttttattt gtaacctata tagtatagga   2340
ttttttttgt cattttgttt cttctcgtac gagcttgctc ctgatcagcc tatctcgcag   2400
ctgatgaata tcttgtggta ggggtttggg aaaatcattc gagtttgatg tttttcttgg   2460
tatttcccac tcctcttcag agtacagaag attaagtgag accttcgttt gtgcggatcc   2520
cccacacacc atagcttcaa aatgtttcta ctcctttttt actcttccag attttctcgg   2580
actccgcgca tcgccgtacc acttcaaaac acccaagcac agcatactaa attttccctc   2640
tttcttcctc tagggtgtcg ttaattaccc gtactaaagg tttggaaaag aaaaaagaga   2700
ccgcctcgtt tctttttctt cgtcgaaaaa ggcaataaaa atttttatca cgtttctttt   2760
tcttgaaatt ttttttttta gtttttttct ctttcagtga cctccattga tatttaagtt   2820
aataaacggt cttcaatttc tcaagtttca gtttcatttt tcttgttcta ttacaacttt   2880
ttttacttct tgttcattag aaagaaagca tagcaatcta atctaagggg cggtgttgac   2940
aattaatcat cggcatagta tatcggcata gtataatacg acaaggtgag gaactaaacc   3000
atggccaagt tgaccagtgc cgttccggtg ctcaccgcgc gcgacgtcgc cggagcggtc   3060
gagttctgga ccgaccggct cgggttctcc cgggacttcg tggaggacga cttcgccggt   3120
gtggtccggg acgacgtgac cctgttcatc agcgcggtcc aggaccaggt ggtgccggac   3180
aacaccctgg cctgggtgtg ggtgcgcggc ctggacgagc tgtacgccga gtggtcggag   3240
gtcgtgtcca cgaacttccg ggacgcctcc gggccggcca tgaccgagat cggcgagcag   3300
ccgtgggggc gggagttcgc cctgcgcgac ccggccggca actgcgtgca cttcgtggcc   3360
gaggagcagg actgacacgt ccgacggcgg cccacgggtc ccaggcctcg gagatccgtc   3420
ccccttttcc tttgtcgata tcatgtaatt agttatgtca cgcttacatt cacgccctcc   3480
ccccacatcc gctctaaccg aaaaggaagg agttagacaa cctgaagtct aggtccctat   3540
ttattttttt atagttatgt tagtattaag aacgttattt atatttcaaa tttttctttt   3600
ttttctgtac agacgcgtgt acgcatgtaa cattatactg aaaaccttgc ttgagaaggt   3660
tttgggacgc tcgaaggctt taatttgcaa gctggagacc aacatgtgag caaaaggcca   3720
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc   3780
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact   3840
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct   3900
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcaatg   3960
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca   4020
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa   4080
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc   4140
gaggtatgta ggcggtgcta cagagttdtt gaagtggtgg cctaactacg gctacactag   4200
aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg   4260
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca   4320
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc   4380
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat c            4431
<210>62
<211>2880
<212>DNA
<213>载体pUC18MFa
<400>62
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca     60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct    120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat    180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccaagcttac    240
cccttcttct ttagcagcaa tgctggcaat agtagtattt ataaacaata acccgttatt    300
tgtgctgttg gaaaatggca aaacagcaac atcgaaatcc ccttctaaat ctgagtaacc    360
gatgacagct tcagccggaa tttgtgccgt ttcatcttct gttgtagtgt tgactggagc    420
agctaatgcg gaggatgctg cgaataaaac tgcagtaaaa attgaaggaa atctcatgaa    480
ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa    540
tcgccttgca gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga    600
tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg cgcctgatgc ggtattttct    660
ccttacgcat ctgtgcggta tttcacaccg catatggtgc actctcagta caatctgctc    720
tgatgccgca tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg    780
ggcttgtctg ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat    840
gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg    900
cctattttta taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt    960
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta   1020
tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat   1080
gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt   1140
ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg   1200
agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga   1260
agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg   1320
tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt   1380
tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg   1440
cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg   1500
aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga   1560
tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc   1620
tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc   1680
ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc   1740
ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg   1800
cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac   1860
gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc   1920
actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt   1980
aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac   2040
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa   2100
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc   2160
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt   2220
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg   2280
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc   2340
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt   2400
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga   2460
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct   2520
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg   2580
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca   2640
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa   2700
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt   2760
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga  2820
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga  2880
<210>63
<211>6
<212>PRT
<213>接头肽
<400>63
His His His His His His
1               5
<210>64
<211>6
<212>PRT
<213>接头肽
<400>64
Glu Glu Gly Glu Pro Lys
1               5
<210>65
<211>6
<212>PRT
<213>接头肽
<400>65
Glu Glu Ala Glu Pro Lys
1               5
<210>66
<211>5
<212>PRT
<213>加工位点
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>X是任何氨基酸
<400>66
Ile Glu Gly Arg Xaa
1               5
<210>67
<211>5
<212>PRT
<213>加工位点
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>X是任何氨基酸
<400>67
Ile Asp Gly Arg Xaa
1               5
<210>68
<211>5
<212>PRT
<213>加工位点
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>X是任何氨基酸
<400>68
Ala Glu Gly Arg Xaa
1               5
<210>69
<211>5
<212>PRT
<213>接头肽
<400>69
Val Ile Glu Gly Arg
1               5
<210>70
<211>4
<212>PRT
<213>接头肽
<400>70
Ile Glu Gly Arg
1
<210>71
<211>4
<212>PRT
<213>接头肽
<400>71
Ile Asp Gly Arg
1
<210>72
<211>4
<212>PRT
<213>接头肽
<400>72
Ala Glu Gly Arg
1
<210>73
<211>4
<212>PRT
<213>HCV E1
<400>73
Asn Asn Ser Ser
1
<210>74
<211>8
<212>PRT
<213>FLAG表位
<400>74
Asp Tyr Lys Asp Asp Asp Asp Lys
1               5
<210>75
<211>12
<212>PRT
<213>蛋白C表位
<400>75
Glu Asp Gln Val Asp Pro Arg Leu Ile Asp Gly Lys
1               5                   10
<210>76
<211>11
<212>PRT
<213>VSV表位
<400>76
Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys
1               5                   10
<210>77
<211>9
<212>PRT
<213>streptag
<400>77
Ala Trp Arg His Pro Gln Phe Gly Gly
1               5
<210>78
<211>12
<212>PRT
<213>Tag100表位
<400>78
Glu Glu Thr Ala Arg Phe Gln Pro Gly Tyr Arg Ser
1               5                   10
<210>79
<211>10
<212>PRT
<213>c-myc表位
<400>79
Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1               5                   10
<210>80
<211>11
<212>PRT
<213>HA表位
<400>80
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu
1               5                   10
<210>81
<211>9
<212>PRT
<213>HA表位
<400>81
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1               5
<210>82
<211>12
<212>PRT
<213>HA表位
<400>82
Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu
1               5                   10
<210>83
<211>6
<212>PRT
<213>凝血酶切割位点
<400>83
Leu Val Pro Arg Gly Ser
1               5
<210>84
<211>4
<212>PRT
<213>胶原酶识别位点
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>Xaa是任何氨基酸,但最通常是中性氨基酸
<400>84
Pro Xaa Gly Pro
1
<210>85
<211>192
<212>PRT
<213>丙型肝炎病毒
<400>85
Tyr Gln Val Arg Asn Ser Ser Gly Leu Tyr His Val Thr Asn Asp Cys
1               5                   10                  15
Pro Asn Ser Ser Val Val Tyr Glu Ala Ala Asp Ala Ile Leu His Thr
            20                  25                  30
Pro Gly Cys Val Pro Cys Val Arg Glu Gly Asn Ala Ser Arg Cys Trp
        35                  40                  45
Val Ala Val Thr Pro Thr Val Ala Thr Arg Asp Gly Lys Leu Pro Thr
    50                  55                  60
Thr Gln Leu Arg Arg His Ile Asp Leu Leu Val Gly Ser Ala Thr Leu
65                  70                  75                  80
Cys Ser Ala Leu Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val
                85                  90                  95
Gly Gln Leu Phe Thr Phe Ser Pro Arg His His Trp Thr Thr Gln Asp
            100                 105                 110
Cys Asn Cys Ser Ile Tyr Pro Gly His Ile Thr Gly His Arg Met Ala
        115                 120                 125
Trp Asp Met Met Met Asn Trp Ser Pro Thr Ala Ala Leu Val Val Ala
    130                 135                 140
Gln Leu Leu Arg Ile Pro Gln Ala Ile Met Asp Met Ile Ala Gly Ala
145                 150                 155                 160
His Trp Gly Val Leu Ala Gly Ile Ala Tyr Phe Ser Met Val Gly Asn
                165                 170                 175
Trp Ala Glu Val Leu Val Val Leu Leu Leu Phe Ala Gly Val Asp Ala
            180                 185                 190
<210>86
<211>209
<212>PRT
<213>丙型肝炎病毒
<400>86
Met Leu Gly Lys Leu Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1               5                   10                  15
Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Leu Gly Gly Ala Ala Arg
            20                  25                  30
Ala Leu Ala His Gly Ala Arg Val Leu Glu Asp Gly Val Ile Tyr Ala
        35                  40                  45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
    50                  55                  60
Leu Ser Cys Leu Thr Val Pro Ala Ser Ala Tyr Gln Val Arg Asn Ser
65                  70                  75                  80
Ser Gly Leu Tyr His Val Thr Asn Asp Cys Pro Asn Ser Ser Val Val
                85                  90                  95
Tyr Glu Ala Ala Asp Ala Ile Leu His Thr Pro Gly Cys Val Pro Cys
            100                 105                 110
Val Arg Glu Gly Asn Ala Ser Arg Cys Trp Val Ala Val Thr Pro Thr
        115                 120                 125
Val Ala Thr Arg Asp Gly Lys Leu Pro Thr Thr Gln Leu Arg Arg His
    130                 135                 140
Ile Asp Leu Leu Val Gly Ser Ala Thr Leu Cys Ser Ala Leu Tyr Val
145                 150                 155                 160
Gly Asp Leu Cys Gly Ser Val Phe Leu Val Gly Gln Leu Phe Thr Phe
                165                 170                 175
Ser Pro Arg His His Trp Thr Thr Gln Asp Cys Asn Cys Ser Ile Tyr
            180                 185                 190
Pro Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
        195                 200                 205
Trp
<210>87
<211>192
<212>PRT
<213>丙型肝炎病毒
<400>87
Tyr Glu Val Arg Asn Val Ser Gly Met Tyr His Val Thr Asn Asp Cys
1               5                   10                  15
Ser Asn Ser Ser Ile Val Tyr Glu Ala Ala Asp Met Ile Met His Thr
            20                  25                  30
Pro Gly Cys Val Pro Cys Val Arg Glu Asn Asn Ser Ser Arg Cys Trp
        35                  40                  45
Val Ala Leu Thr Pro Thr Leu Ala Ala Arg Asn Ala Ser Val Pro Thr
    50                  55                  60
Thr Thr Ile Arg Arg His Val Asp Leu Leu Val Gly Ala Ala Ala Phe
65                  70                  75                  80
Cys Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val
                85                  90                  95
Ser Gln Leu Phe Thr Ile Ser Pro Arg Arg His Glu Thr Val Gln Asp
            100                 105                 110
Cys Asn Cys Ser Ile Tyr Pro Gly His Ile Thr Gly His Arg Met Ala
        115                 120                 125
Trp Asp Met Met Met Asn Trp Ser Pro Thr Thr Ala Leu Val Val Ser
    130                 135                 140
Gln Leu Leu Arg Ile Pro Gln Ala Val Val Asp Met Val Ala Gly Ala
145                 150                 155                 160
His Trp Gly Val Leu Ala Gly Leu Ala Tyr Tyr Ser Met Val Gly Asn
                165                 170                 175
Trp Ala Lys Val Leu Val Val Met Leu Leu Phe Ala Gly Val Asp Gly
            180                 185                 190
<210>88
<211>209
<212>PRT
<213>丙型肝炎病毒
<400>88
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1               5                   10                  15
Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Leu Gly Gly Ala Ala Arg
            20                  25                  30
Ala Leu Ala His Gly Val Arg Val Leu Glu Asp Gly Val Asn Tyr Ala
        35                  40                  45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
    50                  55                  60
Leu Ser Cys Leu Thr Ile Pro Ala Ser Ala Tyr Glu Val Arg Asn Val
65                  70                  75                  80
Ser Gly Met Tyr His Val Thr Asn Asp Cys Ser Asn Ser Ser Ile Val
                85                  90                  95
Tyr Glu Ala Ala Asp Met Ile Met His Thr Pro Gly Cys Val Pro Cys
            100                 105                 110
Val Arg Glu Asn Asn Ser Ser Arg Cys Trp Val Ala Leu Thr Pro Thr
        115                 120                 125
Leu Ala Ala Arg Asn Ala Ser Val Pro Thr Thr Thr Ile Arg Arg His
    130                 135                 140
Val Asp Leu Leu Val Gly Ala Ala Ala Phe Cys Ser Ala Met Tyr Val
145                 150                 155                 160
Gly Asp Leu Cys Gly Ser Val Phe Leu Val Ser Gln Leu Phe Thr Ile
                165                 170                 175
Ser Pro Arg Arg His Glu Thr Val Gln Asp Cys Asn Cys Ser Ile Tyr
            180                 185                 190
Pro Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
        195                 200                 205
Trp
<210>89
<211>209
<212>PRT
<213>丙型肝炎病毒
<400>89
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1               5                   10                  15
Met Gly Tyr Ile Pro Val Val Gly Ala Pro Val Gly Gly Val Ala Arg
            20                  25                  30
Ala Leu Ala His Gly Val Arg Val Leu Glu Asp Gly Ile Asn Tyr Ala
        35                  40                  45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
    50                  55                  60
Leu Ser Cys Ile Thr Thr Pro Val Ser Ala Val Glu Val Lys Asn Asn
65                  70                  75                  80
Ser Asn Ser Tyr Met Ala Thr Asn Asp Cys Ser Asn Ser Ser Ile Ile
                85                  90                  95
Trp Gln Leu Glu Gly Ala Val Leu His Thr Pro Gly Cys Val Pro Cys
            100                 105                 110
Glu Leu Ala Asp Asn Thr Ser Arg Cys Trp Val Pro Val Thr Pro Asn
        115                 120                 125
Met Ala Ile Arg Gln Pro Gly Glu Leu Thr Lys Gly Leu Arg Ala His
    130                 135                 140
Val Asp Val Ile Val Met Ser Ala Thr Leu Cys Ser Ala Leu Tyr Val
145                 150                 155                 160
Gly Asp Val Cys Gly Ala Leu Met Ile Ala Ala Gln Val Val Val Val
                165                 170                 175
Ser Pro Gln His His His Phe Val Gln Glu Cys Asn Cys Ser Ile Tyr
            180                 185                 190
Pro Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
        195                 200                 205
Trp
<210>90
<211>209
<212>PRT
<213>丙型肝炎病毒
<400>90
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1               5                   10                  15
Met Gly Tyr Ile Pro Val Val Gly Ala Pro Val Gly Gly Val Ala Arg
            20                  25                  30
Ala Leu Ala His Gly Val Arg Val Leu Glu Asp Gly Ile Asn Tyr Ala
        35                  40                  45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
    50                  55                  60
Leu Ser Cys Val Thr Ala Pro Val Ser Ala Val Glu Val Lys Asn Thr
65                  70                  75                  80
Ser Gln Ala Tyr Met Ala Thr Asn Asp Cys Ser Asn Asn Ser Ile Val
                85                  90                  95
Trp Gln Leu Glu Asp Ala Val Leu His Val Pro Gly Cys Val Pro Cys
            100                 105                 110
Glu Asn Ser Ser Gly Arg Phe His Cys Trp Ile Pro Ile Ser Pro Asn
        115                 120                 125
Ile Ala Val Ser Lys Pro Gly Ala Leu Thr Lys Gly Leu Arg Ala Arg
    130                 135                 140
Ile Asp Ala Val Val Met Ser Ala Thr Leu Cys Ser Ala Leu Tyr Val
145                 150                 155                 160
Gly Asp Val Cys Gly Ala Val Met Ile Ala Ala Gln Ala Phe Ile Val
                165                 170                 175
Ala Pro Lys Arg His Tyr Phe Val Gln Glu Cys Asn Cys Ser Ile Tyr
            180                 185                 190
Pro Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
        195                 200                 205
Trp
<210>91
<211>209
<212>PRT
<213>丙型肝炎病毒
<400>91
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1               5                   10                  15
Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Val Gly Gly Val Ala Arg
            20                  25                  30
Ala Leu Ala His Gly Val Arg Ala Leu Glu Asp Gly Ile Asn Phe Ala
        35                  40                  45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
    50                  55                  60
Phe Ser Cys Leu Ile His Pro Ala Ala Ser Leu Glu Trp Arg Asn Thr
65                  70                  75                  80
Ser Gly Leu Tyr Val Leu Thr Asn Asp Cys Ser Asn Ser Ser Ile Val
                85                  90                  95
Tyr Glu Ala Asp Asp Val Ile Leu His Thr Pro Gly Cys Ile Pro Cys
            100                 105                 110
Val Gln Asp Gly Asn Thr Ser Thr Cys Trp Thr Pro Val Thr Pro Thr
        115                 120                 125
Val Ala Val Lys Tyr Val Gly Ala Thr Thr Ala Ser Ile Arg Ser His
    130                 135                 140
Val Asp Leu Leu Val Gly Ala Ala Thr Met Cys Ser Ala Leu Tyr Val
145                 150                 155                 160
Gly Asp Met Cys Gly Ala Val Phe Leu Val Gly Gln Ala Phe Thr Phe
                165                 170                 175
Arg Pro Arg Arg His Gln Thr Val Gln Thr Cys Asn Cys Ser Leu Tyr
            180                 185                 190
Pro Gly His Leu Ser Gly His Arg Met Ala Trp Asp Met Met Met Asn
        195                 200                 205
Trp
<210>92
<211>209
<212>PRT
<213>丙型肝炎病毒
<400>92
Met Ser Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1               5                   10                  15
Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Val Gly Gly Val Ala Arg
            20                  25                  30
Ala Leu Ala His Gly Val Arg Ala Val Glu Asp Gly Ile Asn Tyr Ala
        35                  40                  45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
    50                  55                  60
Leu Ser Cys Leu Thr Val Pro Thr Ser Ala Val Asn Tyr Arg Asn Ala
65                  70                  75                  80
Ser Gly Val Tyr His Ile Thr Asn Asp Cys Pro Asn Ser Ser Ile Val
                85                  90                  95
Tyr Glu Thr Glu His His Ile Leu His Leu Pro Gly Cys Leu Pro Cys
            100                 105                 110
Val Arg Val Gly Asn Gln Ser Arg Cys Trp Val Ala Leu Thr Pro Thr
        115                 120                 125
Val Ala Ala Pro Tyr Ile Gly Ala Pro Leu Glu Ser Leu Arg Ser His
    130                 135                 140
Val Asp Leu Met Val Gly Ala Ala Thr Ala Cys Ser Ala Leu Tyr Ile
145                 150                 155                 160
Gly Asp Leu Cys Gly Gly Val Phe Leu Val Gly Gln Met Phe Ser Phe
                165                 170                 175
Gln Pro Arg Arg His Trp Thr Thr Gln Asp Cys Asn Cys Ser Ile Tyr
            180                 185                 190
Ala Gly His Val Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
        195                 200                 205
Trp
<210>93
<211>209
<212>PRT
<213>丙型肝炎病毒
<400>93
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1               5                   10                  15
Met Gly Tyr Ile Pro Leu Val Gly Gly Pro Ile Gly Gly Val Ala Arg
            20                  25                  30
Ala Leu Ala His Gly Val Arg Val Leu Glu Asp Gly Val Asn Tyr Ala
        35                  40                  45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Ile Leu Ala Leu
    50                  55                  60
Leu Ser Cys Leu Thr Val Pro Ala Ser Ala Val Pro Tyr Arg Asn Ala
65                  70                  75                  80
Ser Gly Ile Tyr His Val Thr Asn Asp Cys Pro Asn Ser Ser Ile Val
                85                  90                  95
Tyr Glu Ala Asp Asn Leu Ile Leu His Ala Pro Gly Cys Val Pro Cys
            100                 105                 110
Val Met Thr Gly Asn Val Ser Arg Cys Trp Val Gln Ile Thr Pro Thr
        115                 120                 125
Leu Ser Ala Pro Ser Leu Gly Ala Val Thr Ala Pro Leu Arg Arg Ala
    130                 135                 140
Val Asp Tyr Leu Ala Gly Gly Ala Ala Leu Cys Ser Ala Leu Tyr Val
145                 150                 155                 160
Gly Asp Ala Cys Gly Ala Leu Phe Leu Val Gly Gln Met Phe Thr Tyr
                165                 170                 175
Arg Pro Arg Gln His Ala Thr Val Gln Asn Cys Asn Cys Ser Ile Tyr
            180                 185                 190
Ser Gly His Val Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
        195                 200                 205
Trp
<210>94
<211>209
<212>PRT
<213>丙型肝炎病毒
<400>94
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1               5                   10                  15
Met Gly Tyr Ile Pro Val Val Gly Ala Pro Leu Gly Gly Val Ala Ala
            20                  25                  30
Ala Phe Ala His Gly Val Arg Ala Leu Glu Asp Gly Ile Asn Tyr Ala
        35                  40                  45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
    50                  55                  60
Leu Ser Cys Leu Thr Thr Pro Ala Ser Ala Leu Thr Tyr Gly Asn Ser
65                  70                  75                  80
Ser Gly Leu Tyr His Leu Thr Asn Asp Cys Pro Asn Ser Ser Ile Val
                85                  90                  95
Leu Glu Ala Asp Ala Met Ile Leu His Leu Pro Gly Cys Leu Pro Cys
            100                 105                 110
Val Arg Val Asn Asn Gln Ser Thr Cys Trp His Ala Val Ser Pro Thr
        115                 120                 125
Leu Ala Ile Pro Asn Ala Ser Thr Pro Ala Thr Gly Phe Arg Arg His
    130                 135                 140
Val Asp Leu Leu Ala Gly Ala Ala Val Val Cys Ser Ser Leu Tyr Ile
145                 150                 155                 160
Gly Asp Leu Cys Gly Ser Leu Phe Leu Ala Gly Gln Leu Phe Thr Phe
                165                 170                 175
Gln Pro Arg Arg His Trp Thr Val Gln Asp Cys Asn Cys Ser Ile Tyr
            180                 185                 190
Thr Gly His Val Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
        195                 200                 205
Trp
<210>95
<211>209
<212>PRT
<213>丙型肝炎病毒
<400>95
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1               5                   10                  15
Met Gly Tyr Ile Pro Val Val Gly Ala Pro Leu Gly Gly Ile Ala Ala
            20                  25                  30
Ala Leu Ala His Gly Val Arg Ala Val Glu Asp Gly Ile Asn Tyr Ala
        35                  40                  45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
    50                  55                  60
Leu Ser Cys Leu Thr Thr Pro Ala Ser Ala Val His Tyr Ala Asn Lys
65                  70                  75                  80
Ser Gly Leu Tyr His Leu Thr Asn Asp Cys Pro Asn Ser Ser Ile Val
                85                  90                  95
Tyr Glu Ala Pro Ala Val Ile Met His Leu Pro Gly Cys Val Pro Cys
            100                 105                 110
Val Lys Val Gly Asn Gln Ser Thr Cys Trp Leu Pro Ala Ser Pro Thr
        115                 120                 125
Leu Ala Val Pro Asn Ala Ser Thr Pro Leu Thr Arg Phe Arg Lys His
    130                 135                 140
Val Asp Leu Met Val Gly Ala Ala Ala Phe Cys Ser Ala Met Tyr Val
145                 150                 155                 160
Gly Asp Ile Cys Gly Gly Leu Phe Leu Leu Gly Gln Val Val Thr Ile
                165                 170                 175
Arg Pro Arg Leu His Gln Thr Val Gln Glu Cys Asn Cys Ser Ile Tyr
            180                 185                 190
Thr Gly Lys Ile Thr Gly His Arg Met Ala Trp Asp Ile Met Met Asn
        195                 200                 205
Trp
<210>96
<211>209
<212>PRT
<213>丙型肝炎病毒
<400>96
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Leu Ala Asp Leu
1               5                   10                  15
Met Gly Tyr Ile Pro Val Leu Gly Gly Pro Leu Gly Gly Val Ala Ala
            20                  25                  30
Ala Leu Ala His Gly Val Arg Ala Ile Glu Asp Gly Val Asn Tyr Ala
        35                  40                  45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Leu Leu Leu Ala Leu
    50                  55                  60
Leu Ser Cys Leu Thr Ile Pro Ala Ser Ala Ile Gln Val Lys Asn Ala
65                  70                  75                  80
Ser Gly Ile Tyr His Leu Thr Asn Asp Cys Ser Asn Asn Ser Ile Val
                85                  90                  95
Phe Glu Ala Glu Thr Met Ile Leu His Leu Pro Gly Cys Val Pro Cys
            100                 105                 110
Ile Lys Ala Gly Asn Glu Ser Arg Cys Trp Leu Pro Val Ser Pro Thr
        115                 120                 125
Leu Ala Val Pro Asn Ser Ser Val Pro Ile His Gly Phe Arg Arg His
    130                 135                 140
Val Asp Leu Leu Val Gly Ala Ala Ala Phe Cys Ser Ala Met Tyr Ile
145                 150                 155                 160
Gly Asp Leu Cys Gly Ser Ile Phe Leu Val Gly Gln Leu Phe Thr Phe
                165                 170                 175
Arg Pro Lys Tyr His Gln Val Thr Gln Asp Cys Asn Cys Ser Ile Tyr
            180                 185                 190
Ala Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
        195                 200                 205
Trp
<210>97
<211>363
<212>PRT
<213>丙型肝炎病毒
<400>97
Glu Thr His Val Thr Gly Gly Asn Ala Gly Arg Thr Thr Ala Gly Pro
1               5                   10                  15
Val Gly Leu Leu Thr Pro Gly Ala Lys Gln Asn Ile Gln Leu Ile Asn
            20                  25                  30
Thr Asn Gly Ser Trp His Ile Asn Ser Thr Ala Leu Asn Cys Asn Glu
        35                  40                  45
Ser Leu Asn Thr Gly Trp Leu Ala Gly Leu Phe Tyr Gln His Lys Phe
    50                  55                  60
Asn Ser Ser Gly Cys Pro Glu Arg Leu Ala Ser Cys Arg Arg Leu Thr
65                  70                  75                  80
Asp Phe Ala Gln Gly Trp Gly Pro Ile Ser Tyr Ala Asn Gly Ser Gly
                85                  90                  95
Leu Asp Glu Arg Pro Tyr Cys Trp His Tyr Pro Pro Arg Pro Cys Gly
            100                 105                 110
Ile Val Pro Ala Lys Ser Val Cys Gly Pro Val Tyr Cys Phe Thr Pro
        115                 120                 125
Ser Pro Val Val Val Gly Thr Thr Asp Arg Ser Gly Ala Pro Thr Tyr
    130                 135                 140
Ser Trp Gly Ala Asn Asp Thr Asp Val Phe Val Leu Asn Asn Thr Arg
145                 150                 155                 160
Pro Pro Leu Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Ser Thr Gly
                165                 170                 175
Phe Thr Lys Val Cys Gly Ala Pro Pro Cys Val Ile Gly Gly Val Gly
            180                 185                 190
Asn Asn Thr Leu Leu Cys Pro Thr Asp Cys Phe Arg Lys His Pro Glu
        195                 200                 205
Ala Thr Tyr Ser Arg Cys Gly Ser Gly Pro Trp Ile Thr Pro Arg Cys
    210                 215                 220
Met Val Asp Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Ile Asn
225                 230                 235                 240
Tyr Thr Ile Phe Lys Val Arg Met Tyr Val Gly Gly Val Glu His Arg
                245                 250                 255
Leu Glu Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu Glu
            260                 265                 270
Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Ser Thr Thr Gln
        275                 280                 285
Trp Gln Val Leu Pro Cys Ser Phe Thr Thr Leu Pro Ala Leu Ser Thr
    290                 295                 300
Gly Leu Ile His Leu His Gln Asn Ile Val Asp Val Gln Tyr Leu Tyr
305                 310                 315                 320
Gly Val Gly Ser Ser Ile Ala Ser Trp Ala Ile Lys Trp Glu Tyr Val
                325                 330                 335
Val Leu Leu Phe Leu Leu Leu Ala Asp Ala Arg Val Cys Ser Glu Phe
            340                 345                 350
Trp Met Met Leu Leu Ile Ser Gln Ala Glu Ala
        355                 360
<210>98
<211>363
<212>PRT
<213>丙型肝炎病毒
<400>98
His Thr Arg Val Ser Gly Gly Ala Ala Ala Ser Asp Thr Arg Gly Leu
1               5                   10                  15
Val Ser Leu Phe Ser Pro Gly Ser Ala Gln Lys Ile Gln Leu Val Asn
            20                  25                  30
Thr Asn Gly Ser Trp His Ile Asn Arg Thr Ala Leu Asn Cys Asn Asp
        35                  40                  45
Ser Leu Gln Thr Gly Phe Phe Ala Ala Leu Phe Tyr Lys His Lys Phe
    50                  55                  60
Asn Ser Ser Gly Cys Pro Glu Arg Leu Ala Ser Cys Arg Ser Ile Asp
65                  70                  75                  80
Lys Phe Ala Gln Gly Trp Gly Pro Leu Thr Tyr Thr Glu Pro Asn Ser
                85                  90                  95
Ser Asp Gln Arg Pro Tyr Cys Trp His Tyr Ala Pro Arg Pro Cys Gly
            100                 105                 110
Ile Val Pro Ala Ser Gln Val Cys Gly Pro Val Tyr Cys Phe Thr Pro
        115                 120                 125
Ser Pro Val Val Val Gly Thr Thr Asp Arg Phe Gly Val Pro Thr Tyr
    130                 135                 140
Asn Trp Gly Ala Asn Asp Ser Asp Val Leu Ile Leu Asn Asn Thr Arg
145                 150                 155                 160
Pro Pro Arg Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Gly Thr Gly
                165                 170                 175
Phe Thr Lys Thr Cys Gly Gly Pro Pro Cys Asn Ile Gly Gly Ala Gly
            180                 185                 190
Asn Asn Thr Leu Thr Cys Pro Thr Asp Cys Phe Arg Lys His Pro Glu
        195                 200                 205
Ala Thr Tyr Ala Arg Cys Gly Ser Gly Pro Trp Leu Thr Pro Arg Cys
    210                 215                 220
Met Val His Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Val Asn
225                 230                 235                 240
Phe Thr Ile Phe Lys Val Arg Met Tyr Val Gly Gly Val Glu His Arg
                245                 250                 255
Phe Glu Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu Glu
            260                 265                 270
Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Ser Thr Thr Glu
        275                 280                 285
Trp Gln Ile Leu Pro Cys Ser Phe Thr Thr Leu Pro Ala Leu Ser Thr
    290                 295                 300
Gly Leu Ile His Leu His Gln Asn Ile Val Asp Val Gln Tyr Leu Tyr
305                 310                 315                 320
Gly Val Gly Ser Ala Val Val Ser Leu Val Ile Lys Trp Glu Tyr Val
                325                 330                 335
Leu Leu Leu Phe Leu Leu Leu Ala Asp Ala Arg Ile Cys Ala Cys Leu
            340                 345                 350
Trp Met Met Leu Leu Ile Ala Gln Ala Glu Ala
        355                 360

Claims (33)

1.一种包含至少一个N-糖基化位点的分离的HCV包膜蛋白或其片段,所述蛋白或其片段的特征在于它是在真核细胞中表达的产物,并且平均高达80%的所述N-糖基化位点受到核心糖基化。
2.依照权利要求1的分离的HCV包膜蛋白或其片段,其中超过70%的所述核心糖基化位点被含8到10个甘露糖的寡甘露糖糖基化。
3.依照权利要求1或2中任一项的分离的HCV包膜蛋白或其片段,其中受到结构为Man(7)-GlcNAc(2)的寡甘露糖核心糖基化的位点与受到结构为Man(8)-GlcNAc(2)的寡甘露糖核心糖基化的位点的比例少于或等于0.45。
4.依照权利要求1到3中任一项的分离的HCV包膜蛋白或其片段,其中所述寡甘露糖包含少于10%的末端α1,3甘露糖。
5.依照权利要求1到4中任一项的分离的HCV包膜蛋白或其部分,所述分离的HCV包膜蛋白或其部分是在酵母细胞中表达的产物。
6.依照权利要求5的分离的HCV包膜蛋白或其部分,其中所述酵母细胞是汉逊酵母属(Hansenula)细胞。
7.依照权利要求1到6中任一项的分离的HCV包膜蛋白或其部分,所述分离的HCV包膜蛋白或其部分得自包含与所述HCV包膜蛋白或其片段连接的鸟溶菌酶前导肽或其功能变异体的蛋白。
8.依照权利要求7的分离的HCV包膜蛋白或其部分,所述分离的HCV包膜蛋白或其部分得自特征在于以下结构的蛋白:
CL-[(A1)a-(PS1)b-(A2)c]-HCVENV-[(A3)d-(PS2)e-(A4)f]
其中:
CL是鸟溶菌酶前导肽或其功能等价物,
A1、A2、A3和A4是可以不同或相同的接头肽,
PS1和PS2是可以不同或相同的加工位点,
HCVENV是一种HCV包膜蛋白或其部分,
a、b、c、d、e和f是0或1,而且
其中任选A1和/或A2是部分PS1和/或其中A3和/或A4是部分PS2。
9.依照权利要求8的分离的HCV包膜蛋白或其片段,其中所述鸟溶菌酶前导肽CL具有SEQ ID NO:1定义的氨基酸序列。
10.依照权利要求8的分离的HCV包膜蛋白或其片段,其中A具有从SEQ ID NO:63-65、70-72和74-82选出的氨基酸序列,其中PS具有从SEQ ID NO:66-68和83-84选出的氨基酸序列或者其中PS是例如Lys-Lys、Arg-Arg、Lys-Arg和Arg-Lys的双碱性位点或例如Lys的单碱性位点,并且其中HCVENV选自SEQ ID NO:85-98或其片段。
11.依照权利要求1到10中任一项的分离的HCV包膜蛋白或其片段,所述分离的HCV包膜蛋白或其片段包含在选自单体、同二聚体、异二聚体、同寡聚体和异寡聚体的结构中。
12.依照权利要求1到10中任一项的分离的HCV包膜蛋白或其片段,所述分离的HCV包膜蛋白或其片段包含在病毒样颗粒中。
13.依照权利要求1到12中任一项的分离的HCV包膜蛋白或其片段,所述分离的HCV包膜蛋白或其片段中的半胱氨酸硫醇基团受到化学修饰。
14.依照权利要求1到13中任一项的分离的HCV包膜蛋白或其片段,所述分离的HCV包膜蛋白或其片段具有抗原性。
15.依照权利要求1到13中任一项的分离的HCV包膜蛋白或其片段,所述分离的HCV包膜蛋白或其片段具有免疫原性。
16.依照权利要求1到13中任一项的分离的HCV包膜蛋白或其片段,所述分离的HCV包膜蛋白或其片段包含T细胞表位。
17.一种组合物,所述组合物包含依照权利要求1到16中任一项的分离的HCV包膜蛋白或其片段。
18.依照权利要求17的组合物,所述组合物还包含药学上可接受的载体,并且所述组合物是一种药物。
19.依照权利要求17的组合物,所述组合物还包含药学上可接受的载体,并且所述组合物是一种疫苗。
  20.一种生产依照权利要求1到16中任一项的分离的HCV包膜蛋白或其片段的方法。
21.一种检测怀疑含有抗HCV抗体的样品中抗HCV抗体存在情况的方法,所述方法包括:
(i)使依照权利要求1到16中任一项的HCV包膜蛋白或其部分与所述样品在允许所述HCV包膜蛋白或其部分与所述抗HCV抗体复合的条件下接触,
(ii)检测(i)中形成的复合物,然后
(iii)根据(ii)推导所述样品中所述抗HCV抗体的存在情况。
22.依照权利要求21的方法,其中步骤(i)中的所述接触在竞争性条件下进行。
23.依照权利要求21的方法,其中所述HCV包膜蛋白或其部分附着在一种固体支持物上。
24.一种用于检测怀疑含有抗HCV抗体的样品中抗HCV抗体存在情况的诊断试剂盒,所述试剂盒包含依照权利要求1到16中任一项的HCV包膜蛋白或其部分。
25.依照权利要求24的诊断试剂盒,其中所述HCV包膜蛋白或其部分附着在一种固体支持物上。
26.一种包含依照权利要求1到16中任一项的HCV包膜蛋白或其部分的药物。
27.一种包含依照权利要求1到16中任一项的HCV包膜蛋白或其部分的疫苗。
28.一种用于在哺乳动物体内诱导HCV特异性免疫反应的药用组合物,所述组合物包含有效量依照权利要求1到16中任一项的HCV包膜蛋白或其部分,以及任选包含药学上可接受的佐剂。
29.一种用于在哺乳动物体内诱导HCV特异性抗体的药用组合物,所述组合物包含有效量依照权利要求1到16中任一项的HCV包膜蛋白或其部分,以及任选包含药学上可接受的佐剂。
30.一种用于在哺乳动物体内诱导T细胞功能的药用组合物,所述组合物包含有效量依照权利要求1到16中任一项的HCV包膜蛋白或其部分,以及任选包含药学上可接受的佐剂。
31.依照权利要求28到30中任一项的药用组合物,所述药用组合物是一种预防性药用组合物。
32.依照权利要求28到30中任一项的药用组合物,所述药用组合物是一种治疗性药用组合物。
33.依照权利要求28到30中任一项的药用组合物,其中所述哺乳动物是人。
CNA028126076A 2001-04-24 2002-04-24 核心糖基化hcv包膜蛋白 Pending CN1636050A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP01870088 2001-04-24
EP01870088.0 2001-04-24
US30560401P 2001-07-17 2001-07-17
US60/305,604 2001-07-17

Publications (1)

Publication Number Publication Date
CN1636050A true CN1636050A (zh) 2005-07-06

Family

ID=34072546

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA028126076A Pending CN1636050A (zh) 2001-04-24 2002-04-24 核心糖基化hcv包膜蛋白

Country Status (20)

Country Link
US (3) US7238356B2 (zh)
EP (3) EP1414942A2 (zh)
JP (2) JP4261195B2 (zh)
KR (1) KR100950104B1 (zh)
CN (1) CN1636050A (zh)
AR (3) AR035867A1 (zh)
AU (3) AU2002257392B2 (zh)
BR (2) BR0209034A (zh)
CA (3) CA2444006A1 (zh)
CZ (1) CZ20032853A3 (zh)
HU (1) HUP0303924A2 (zh)
MX (2) MXPA03009632A (zh)
NZ (2) NZ529324A (zh)
OA (1) OA13092A (zh)
PL (1) PL366621A1 (zh)
RU (1) RU2274643C2 (zh)
SK (1) SK13142003A3 (zh)
WO (3) WO2002085932A2 (zh)
YU (1) YU84103A (zh)
ZA (3) ZA200308274B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106029867A (zh) * 2014-02-28 2016-10-12 拜耳动物保健有限责任公司 免疫刺激性质粒

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040185061A1 (en) * 1994-07-29 2004-09-23 Innogenetics N.V. Redox reversible HCV proteins with native-like conformation
NZ529324A (en) * 2001-04-24 2005-08-26 Innogenetics N Core-glycosylated HCV envelope proteins made in yeast cells
DE10143490C2 (de) * 2001-09-05 2003-12-11 Gsf Forschungszentrum Umwelt Rekombinantes MVA mit der Fähigkeit zur Expression von HCV Struktur-Antigenen
JP2006516955A (ja) * 2002-11-08 2006-07-13 イノジェネティックス・ナムローゼ・フェンノートシャップ E1ペプチド及びns3ペプチドを含むhcvワクチン組成物
US7439042B2 (en) * 2002-12-16 2008-10-21 Globeimmune, Inc. Yeast-based therapeutic for chronic hepatitis C infection
JP4371739B2 (ja) * 2003-09-02 2009-11-25 株式会社東芝 シリアルataインタフェースを持つ電子機器及びシリアルataバスのパワーセーブ方法
EP1602664A1 (en) * 2004-03-08 2005-12-07 Innogenetics N.V. HCV E1 comprising specific disulfide bridges
EP1574517A1 (en) * 2004-03-09 2005-09-14 Innogenetics N.V. HCV E1 comprising specific disulfide bridges
JP4885476B2 (ja) * 2004-05-21 2012-02-29 株式会社日本触媒 タンパク質及び/又はペプチドの細胞内導入方法
AU2011254055B2 (en) * 2004-10-18 2012-12-20 Globeimmune, Inc. Yeast-based therapeutic for chronic hepatitis C infection
MX2007004662A (es) * 2004-10-18 2007-11-23 Globeimmune Inc Terapia basada en levaduras para infeccion cronica por hepatitis c.
US20060234360A1 (en) * 2005-04-13 2006-10-19 Paola Branduardi Ascorbic acid production from D-glucose in yeast
US9216212B2 (en) 2005-08-05 2015-12-22 University Of Massachusetts Virus-like particles as vaccines for paramyxovirus
US7951384B2 (en) * 2005-08-05 2011-05-31 University Of Massachusetts Virus-like particles as vaccines for paramyxovirus
AR058140A1 (es) * 2005-10-24 2008-01-23 Wyeth Corp Metodo de produccion proteica utilizando compuestos anti-senescencia
JP5424871B2 (ja) * 2006-05-19 2014-02-26 グライコフィ, インコーポレイテッド 組換えベクター
AU2015234338C1 (en) * 2006-07-28 2017-07-20 The Trustees Of The University Of Pennsylvania Improved vaccines and methods for using the same
KR101500017B1 (ko) * 2006-08-25 2015-03-09 더 맥파레인 버넷 인스티튜트 포 메디칼 리서치 앤드 퍼블릭 헬스 리미티드 재조합 hcv e2 당단백질
EP2331125A4 (en) 2008-09-19 2013-03-27 Globeimmune Inc IMMUNOTHERAPY FOR CHRONIC HEPATITIS C-VIRUS INFECTIONS
WO2010039224A2 (en) 2008-09-30 2010-04-08 University Of Massachusetts Medical School Respiratory syncytial virus (rsv) sequences for protein expression and vaccines
US20100104555A1 (en) * 2008-10-24 2010-04-29 The Scripps Research Institute HCV neutralizing epitopes
DE102009044224A1 (de) * 2009-10-09 2011-04-28 PomBio Tech GmbH Starterzentrum der Universität des Saarlandes Campus Geb. A1-1 Methode zur Produktion von HCV Virus-ähnlichen Partikeln
TR201906323T4 (tr) 2010-12-22 2019-05-21 Bayer Ip Gmbh Sığır türlerinde artırılmış bağışıklık yanıtı.
WO2012145509A2 (en) 2011-04-19 2012-10-26 The Research Foundation Of State University Of New York Adeno-associated-virus rep sequences, vectors, and viruses
WO2012152823A1 (en) 2011-05-09 2012-11-15 Ablynx Nv Method for the production of immunoglobulin single variable domains
JP2019504638A (ja) * 2015-11-13 2019-02-21 マメドフ、タルラン Endo hとの同時発現によってインビボn−脱グルコシル化組換えタンパク質の産生
DK3184642T3 (da) * 2015-12-22 2019-08-12 Bisy E U Gærcelle
EP3515483A4 (en) 2016-09-21 2020-12-16 The Governors of the University of Alberta HEPATITIS C VIRUS IMMUNOGENIC COMPOSITIONS AND THEIR USE PROCEDURES

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4395395A (en) 1979-05-21 1983-07-26 The United States Of America As Represented By The Department Of Health And Human Services Detection of non-A, non-B hepatitis associated antigen
EP0288198A3 (en) 1987-04-20 1989-03-29 Takeda Chemical Industries, Ltd. Production of peptide
US5135854A (en) * 1987-10-29 1992-08-04 Zymogenetics, Inc. Methods of regulating protein glycosylation
US5698390A (en) 1987-11-18 1997-12-16 Chiron Corporation Hepatitis C immunoassays
US5350671A (en) 1987-11-18 1994-09-27 Chiron Corporation HCV immunoassays employing C domain antigens
US5683864A (en) 1987-11-18 1997-11-04 Chiron Corporation Combinations of hepatitis C virus (HCV) antigens for use in immunoassays for anti-HCV antibodies
JP2791418B2 (ja) * 1987-12-02 1998-08-27 株式会社ミドリ十字 異種蛋白質の製造方法、組換えdna、形質転換体
NO177065C (no) * 1988-09-26 1995-07-12 Labofina Sa Framgangsmåte for framstilling av enzymatisk aktivt humant lysozym
US5747239A (en) 1990-02-16 1998-05-05 United Biomedical, Inc. Synthetic peptides specific for the detection of antibodies to HCV, diagnosis of HCV infection and preventions thereof as vaccines
US5712087A (en) 1990-04-04 1998-01-27 Chiron Corporation Immunoassays for anti-HCV antibodies employing combinations of hepatitis C virus (HCV) antigens
WO1992001800A1 (en) * 1990-07-20 1992-02-06 Chiron Corporation Method for integrative transformation of yeast using dispersed repetitive elements
CA2047792C (en) 1990-07-26 2002-07-02 Chang Y. Wang Synthetic peptides specific for the detection of antibodies to hcv, diagnosis of hcv infection and prevention thereof as vaccines
JP3516681B2 (ja) 1991-06-24 2004-04-05 カイロン コーポレイション C型肝炎ウイルス(hcv)ポリペプチド
WO1994001132A1 (en) 1992-07-07 1994-01-20 Merck & Co., Inc. VACCINE COMPRISING MIXED preS1+preS2+S AND CORE PARTICLE
DK0725824T3 (da) 1993-11-04 2003-08-11 Innogenetics Nv Immunodominante humane T-celleepitoper af hepatitis C virus
US6150134A (en) * 1994-07-29 2000-11-21 Innogenetics, N.V. Purified hepatitis C virus envelope proteins for diagnostic and therapeutic use
ZA9610456B (en) * 1995-12-20 1997-06-20 Novo Nordisk As N-terminally extended proteins expressed in yeast
US5935824A (en) * 1996-01-31 1999-08-10 Technologene, Inc. Protein expression system
DE69735242T2 (de) * 1996-12-20 2006-09-21 Novo Nordisk A/S N-terminal verlängerte proteine exprimiert in hefe
AU752131C (en) 1997-11-06 2003-12-04 Innogenetics N.V. Multi-mer peptides derived from hepatitis C virus envelope proteins for diagnostic use and vaccination purposes
WO1999037793A1 (en) * 1998-01-23 1999-07-29 Novo Nordisk A/S Process for making desired polypeptides in yeast
CA2658218C (en) * 1998-04-17 2014-10-28 Innogenetics N.V. Improved immunodiagnostic assays using reducing agents
ES2237115T5 (es) 1998-06-24 2008-05-16 Innogenetics N.V. Particulas de proteinas de la envoltura del hcv: uso para la vacunacion.
AU1144501A (en) 1999-10-27 2001-05-08 Innogenetics N.V. Redox reversible hcv proteins with native-like conformation
CZ20032164A3 (cs) 2001-01-11 2003-10-15 Innogenetics N. V. Purifikované obalové proteiny viru hepatitidy C pro diagnostické a terapeutické použití
NZ529324A (en) * 2001-04-24 2005-08-26 Innogenetics N Core-glycosylated HCV envelope proteins made in yeast cells
BR0215081A (pt) 2001-12-18 2004-10-19 Innogenetics Nv Proteìnas purificadas do envoltório do vìrus de hepatite c para uso diagnóstico e terapêutico
JP2006516955A (ja) 2002-11-08 2006-07-13 イノジェネティックス・ナムローゼ・フェンノートシャップ E1ペプチド及びns3ペプチドを含むhcvワクチン組成物

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106029867A (zh) * 2014-02-28 2016-10-12 拜耳动物保健有限责任公司 免疫刺激性质粒
CN106029867B (zh) * 2014-02-28 2020-02-14 拜耳动物保健有限责任公司 免疫刺激性质粒

Also Published As

Publication number Publication date
JP4173741B2 (ja) 2008-10-29
WO2002085932A3 (en) 2003-03-13
MXPA03009632A (es) 2004-06-30
WO2002085932A2 (en) 2002-10-31
PL366621A1 (en) 2005-02-07
RU2003130955A (ru) 2005-04-20
CA2443740A1 (en) 2002-10-31
KR20030094359A (ko) 2003-12-11
US7048930B2 (en) 2006-05-23
WO2002086101A3 (en) 2004-02-19
EP1417298A2 (en) 2004-05-12
AR035867A1 (es) 2004-07-21
HUP0303924A2 (hu) 2004-03-01
ZA200308277B (en) 2004-07-08
CA2444006A1 (en) 2002-10-31
JP4261195B2 (ja) 2009-04-30
ZA200308272B (en) 2005-01-24
OA13092A (en) 2006-11-10
BR0209034A (pt) 2005-02-01
RU2274643C2 (ru) 2006-04-20
US7314925B2 (en) 2008-01-01
CZ20032853A3 (cs) 2004-08-18
JP2004536052A (ja) 2004-12-02
EP1381671A2 (en) 2004-01-21
WO2002086100A3 (en) 2004-02-19
AU2002257392B2 (en) 2007-05-10
AR035869A1 (es) 2004-07-21
CA2443781A1 (en) 2002-10-31
MXPA03009626A (es) 2004-06-30
AR035868A1 (es) 2004-07-21
EP1414942A2 (en) 2004-05-06
NZ529324A (en) 2005-08-26
AU2002308449B2 (en) 2008-05-29
KR100950104B1 (ko) 2010-03-30
JP2004532029A (ja) 2004-10-21
BR0209033A (pt) 2005-01-11
US20030211597A1 (en) 2003-11-13
WO2002086101A2 (en) 2002-10-31
US20030108561A1 (en) 2003-06-12
US7238356B2 (en) 2007-07-03
YU84103A (sh) 2006-05-25
SK13142003A3 (en) 2004-11-03
ZA200308274B (en) 2005-01-24
US20030152940A1 (en) 2003-08-14
AU2002252856A1 (en) 2002-11-05
NZ529019A (en) 2004-05-28
WO2002086100A2 (en) 2002-10-31

Similar Documents

Publication Publication Date Title
KR100950104B1 (ko) 코어 글리코실화된 hcv 엔빌로프 단백질
AU2018229561B2 (en) Recombinant adenoviruses and use thereof
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
KR101982360B1 (ko) 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도
DK2718440T3 (en) NUCLEASE ACTIVITY PROTEIN, FUSION PROTEINS AND APPLICATIONS THEREOF
AU2021204620A1 (en) Central nervous system targeting polynucleotides
US6090393A (en) Recombinant canine adenoviruses, method for making and uses thereof
KR20220141332A (ko) 홍역-벡터화된 covid-19 면역원성 조성물 및 백신
US6156567A (en) Truncated transcriptionally active cytomegalovirus promoters
CA2834053C (en) Yeast strains engineered to produce ethanol from glycerol
KR101499750B1 (ko) 가감염성 플라비바이러스 및 이들의 용도
CN113271955A (zh) 用于细胞介导的溶瘤病毒疗法的增强的系统
US20040003420A1 (en) Modified recombinase
AU2016343979A1 (en) Delivery of central nervous system targeting polynucleotides
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
KR102628872B1 (ko) 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법
KR20210080375A (ko) 암 면역요법을 위한 재조합 폭스바이러스
KR20180016722A (ko) 재조합 glut1 아데노-관련 바이러스 벡터 작제물 및 glut1 발현을 회복하기 위한 관련된 방법
ES2900973T3 (es) Constructo genético de vector individual que comprende genes de insulina y glucoquinasa
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
WO2002038613A2 (en) Modified recombinase
CN112203697A (zh) 编码氨基己糖苷酶alpha和beta亚基的双顺反子AAV载体及其用途
CN116323942A (zh) 用于基因组编辑的组合物及其使用方法
RU2812852C2 (ru) Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фактора viii (fviii)
KR20220156462A (ko) Cd133 넉인 형광 리포터 벡터 시스템, 그 형질전환된 세포 및 이를 이용한 암줄기세포 검출방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20050706