在真核生物中,一个基因基本都包含可编码的外显子(exon)和不可编码的内含子(intron)。在基因由DNA转录成RNA的过程中,刚被转录出来的前信使核糖核酸(PrecursormRNA)上面的内含子会被剪切掉,然后临近两个外显子会被连接在一起,最后形成成熟的信使核糖核酸(mRNA)。剪接这一步是基因表达和调控的重要步骤。外显子和内含子的剪接缺陷会产生功能改变的甚至失去功能的蛋白质,经常会导致疾病。虽然大多数外显子长度一般都在个核苷酸(nt)以上,但是仍然有相当一部分外显子的长度小于51个核苷酸(nt)的外显子,通常被称为微外显子(microexon)。研究发现,微外显子在许多物种中具有特殊调节作用。例如,在人类和动物的研究中发现,微外显子可以在各种细胞功能、蛋白质-蛋白质相互作用中发挥重要作用,是神经系统发育,行为和自闭症谱系障碍之间的纽带,与多种神经系统疾病有关。对于更短小的微外显子(≤15-nt),由于长度太短,鉴定和功能研究都非常困难,因此在基因组注释和转录组研究中很容易缺失,从而导致错误的信使核糖核酸剪接模型。虽然这些小于15nt的微外显子很重要,但是目前微外显子在植物中的研究很少,其剪接特征、基因功能和进化机制尚不清楚。近日,美国内布拉斯加大学林肯分校张弛教授课题组与其他课题组合作开发了精准鉴定植物微外显子的方法,发现植物基因组中广泛存在非常小的植物微外显子(≤15-nt,甚至小到只有1-nt),但是普遍存在缺失和错误注释的问题,从而导致对应蛋白质功能注释错误。全面系统的分析发现微外显子具有的特殊剪接模式,还揭示了它们在基因功能、系统进化中的重要作用。基于这些发现,研究人员开发了不依赖于转录组数据的植物微外显子预测方法,显著提高了基因组注释的准确性。研究人员开发了精准鉴定植物微外显子的方法。针对10个代表性植物物种,研究人员从公共数据库中找到了个RNA-seq数据,共鉴定出了2,个≤15-nt的微外显子(每个物种–个),占表达基因的0.6–2.6%,大部分位于编码区(59-90%)。这些微外显子大部分都是没有基因组注释的,注释率在不同物种中差别很大,从江南卷柏(S.moellendorffii)的17.41%到罂粟(P.somniferum)的77.75%(图1)。同一个物种不同的注释差异很大,例如水稻(Oryzasativa)中,MSU7的微外显子注释率(16.19%)比IRGSP1.0低(59.05%),但常规的外显子的注释率(85.73%)比IRGSP1.0高(79.66%)。图1.植物微外显子的鉴定。(a)微外显子比对reads的定义。(b)不同鉴定方法的比较。(c)10个植物物种的进化树。(d)植物微外显子大小分布研究人员通过研究微外显子剪接机制发现,微外显子两侧的内含子的剪接比正常的内含子的剪接有延迟。通常大部分的内含子的剪接会伴随基因转录进行,称为共转录剪接(co-transcriptionalsplicing,CTS),而微外显子两侧的内含子剪接,尤其是上游5’端的内含子的剪接,会有显著的延迟,甚至在转录本加了PolyA尾巴之后还有一部分需要进行再剪接,称为转录后剪接(post-transcriptionalsplicing,PTS)。所以,微外显子两侧存在明显的滞留内含子(detainedintron),这些内含子依赖转录后剪接调控,一部分转录本进行转录后修饰完以后,还需要再剪接一次才能从细胞核释放到细胞质,成为成熟的mRNA。为了解决微外显子基因组注释的难题,研究人员通过利用其保守特征预测微外显子在基因组中的位置。由于微外显子很小,研究人员巧妙地利用微外显子标签——微外显子及两侧外显子-nt的编码DNA序列和相应的编码36-aa的蛋白质序列,开发了植物微外显子预测/建模工具包——MEPmodeler[1]。结果显示,微外显子预测结果很可靠,MEPmodeler软件可以大幅度提高基因组注释质量。由于微外显子标签具有相同DNA和蛋白质序列长度,同类微外显子具有相同的大小和phase,在植物中非常保守,很适合用作系统进化研究的标记。与其他标记,如单拷贝基因、转录本、质体相比,微外显子标签用作系统进化研究标记省去了多序列比对这一具有很大挑战的一步,同时还不丢失基因结构信息。研究人员利用MEPmodeler在个陆生植物物种中预测45类微外显子标签然后构建系统发育进化树,得到的结果与之前的结果高度一致,同时还能看出这些微外显子在进化过程中获得和丢失的特征。所以,微外显子有望成为植物系统进化研究中新的有用的标签。内布拉斯加大学林肯分校生物科学学院张弛教授课题组的喻辉辉博士为论文第一作者。张弛、JeffreyP.Mower、于斌教授以及华中农业大学谢为博教授为共同通讯作者。于斌课题组李木博士、HarkamalWalia课题组JaspreetSandhu博士和JamesC.Schnable课题组孙光超博士参与了该工作。该工作还得到了南方科技大学翟继先课题组、内布拉斯加大学林肯分校ThomasClemente课题组和华中农业大学作物遗传改良国家重点实验室生物信息计算平台的支持和帮助。原文(扫描或长按


转载请注明地址:http://www.juanbaia.com/jbzz/10624.html