首页 > 范文大全 > 正文

拟南芥全长cDNA研究进展

开篇:润墨网以专业的文秘视角,为您筛选了一篇拟南芥全长cDNA研究进展范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

【摘要】全长cDNAs是基因组序列注释和基因及其产物功能分析的基础。目前共分离了155,144个RIKEN拟南芥全长(RAF)cdna克隆。将得到的155,144个RAFL cDNAs进行了3’端表达序列标签聚类成14,668个非冗余cDNA类,其中60%预测到基因。同时已从14,034个非冗余cDNA类中获得了5’ESTs,并构建成启动子文库。RAFL cDNAs序列数据库的建立有助于启动子分析、预测出转录本单元的正确注释和基因产物的注释。而且,全长cDNAs还为表达谱分析、功能分析和植物蛋白结构分析提供了宝贵的资源。

【关键词】拟南芥;cDNA

拟南芥因其具有个体小,世代周期短和转化率高等特点,因此在植物研究中被广泛的作为一种模式生物。为了将拟南芥的小基因组测序,日本、欧洲和美国的科学家共同合作完成了拟南芥基因组测序工程。拟南芥5条染色体中的2条(2号和4号染色体,不包括核仁组织区和着丝点区)在1991年进行了测序,其余3条染色体在2000年进行了测序。

2001年5月,大约127,000个拟南芥表达序列标签(ESTs)被提交到EST数据库(dbEST)。其中的序列来自法国,美国和日本共同合作的大范围EST工程。这些工程已从不同的组织、器官、种子和发育阶段的拟南芥中获得EST数据。然而,这些基于cDNA文库的EST工程中的大部分的插入片段都不是全长的。ESTs有助于为表达基因提供标签,大圣无法进行基因功能的进一步研究。因此,全基因组范围的获得表达基因的全长cDNA,对于在功能基因组学领域中分析基因及其产物的表达标签和功能是十分重要的。

1.拟南芥全长cDNA文库的构建

目前已应用biotinylated CAP trapper法建立了拟南芥的全长cDNA文库。最近,研究人员有将trehalose-ther-moactivated反转录酶应用到CAP trapper法中,构建了不同处理的拟南芥全长cDNA文库。在文库构建中使用了λZAP和λFLC载体。λFLC载体适合较大长度范围的cDNAs,并且有利于较长cDN段的高效率克隆。λFLC载体也可通过Cre-lox-based系统被大量检测,而不受质粒文库的片段大小的限制。在RIKEN拟南芥全长文库(RAFL)12、13、14、15、16、17、18、19和21的构建中,应用单链连接方法用DNA连接酶将双链(ds)cDNA接头连接到单链全长(ss)cDNA上。

通过将5’端单向测序数据定位到基因组序列,研究人员将155,144个RAFL cDNA克隆聚合成14,668个cDNA类。去除掉GC尾巴以便随后的测序和将全长cDNA翻译成蛋白。在构建全长cDNA文库(RAFL11、12、13、14、17、18、19和21) 中,进行了均一化和消减处理,以减少高表达的mRNAs的富集和去除在单向测序中已分类的cDNAs。这种方法建立在全长cDNA的第一条链与若干RNA驱赶子杂交的基础上,包括将起始mRNA作为标准化的驱赶子,将来自重排的克隆中完全转录的转录本作为消减子。这种方法会显著促进新的cDNAs的发现。cDNA 文库制备的整个策略,包括标准化、均一化和消减文库,在之前已。研究人员以处于不同发育阶段的拟南芥各组织为材料,经不同胁迫条件、激素和图同光照条件处理,共构建了19个全长cDNA文库。

2.全长cDNA序列的结构和功能分析

研究人员将cDNA克隆进行了3’端单向测序、将155,144个ESTs进行聚类,并且定位到拟南芥基因组上。最终,鉴定出14,668个非冗余RAFLcDNA克隆,并定位到拟南芥基因组上。这14,668个非冗余RAFL cDNA克隆具体信息在网上可见。如果拟南芥总共有25,00个基因,那么这些RAFL克隆应该可以占拟南芥全部基因的60%。通过单向测序349个RAFLcDNA克隆进行质量评价,表明其中98%的克隆包括起始密码子和终止密码子。因此,研究人员用biotinylated CAP trapper法构建的cDNA文库包括很高比例的全长基因。

通过与拟南芥基因组序列的比较,从5’端测序的mRNA中可以获得启动子序列。从14,034个RAFL cDNA 克隆中获得了5’ESTs,并利用PLACE数据库建立了一个启动子数据库。拟南芥启动子数据库表明,每个RAFLcDNA克隆5’末端上游1000bp的基因组序列是植物中的300顺式作用元件。

从19个全长文库中分离出的155,144个cDNA克隆进行了3’ 端单向测序。用这些单向测序数据进行了两步聚类,在附录方法中有详细描述。在两次聚类之后,选择质量最好的序列作为该类的代表。然后将每个代表性克隆的3’EST定位到拟南芥基因组上,在附录中有描述。共获得14,878条非冗余的代表性3’EST被定位到拟南芥基因组上。然后,对这14,878个cDNA克隆进行5’端单向测序。5’端测序的数据通过BlastN法定位到拟南芥基因组上。最终,定位到14,668个非冗余RAFLcDNA克隆定位在拟南芥基因组上。

得到的结论是有9286个预测的基因需要进一步的数据来确定其是否是表达基因,因为这些未被鉴定出的基因还尚未被任何ESTs所证明,一些预测基因达标假阳性或假基因。当然,这些未被鉴定的基因也可能是因为在特异的组织中表达量过低,这些未被鉴定的基因也可能是因为在特异的组织中表达量过低而尚未被EST检测出。

这些RSFL cDNA克隆的生物学作用和生物化学功能,已经通过BLAST同源比对的方法获知。结果表明,RADFL中包括了很多功能基因,如能量产生,蛋白质合成和离子动态平衡等。在能量产生、蛋白质合成和离子的动态平衡功能基因中80%以上都存在于RAFLcDNA克隆中,并且70%左右的新陈代谢,蛋白质分选,细胞运输和转运机制及细胞组成的基因都存在于RAFL中。据推测,大约1500个转录因子基因和1000种蛋白激酶基因都存在于拟南芥基因组中。RAFLcDNA中包含1087个转录因子和506个蛋白激酶基因。尽管已有很多生物信息学算法用于从基因组数据中推测转录本单元,但是其推测的精确性都很难保证。通过对全长cDNAs进行测序儿鉴别编码序列是更直观有效的方法。RFALcDNA的全测序有助于基因识别和图位克隆。RAFLcDNA克隆已公布在RIKN生物资源中心上。 [科]

【参考文献】

[1]D.W.Meinke et al.,Science 282,662(1998).

[2]The Arabidopsis Genome Initiative,Nature 408,796(2000).

[3]M.Bevan,Plant Cell 9,476(1997).