作者:万蕊雪 白蕊(分别系西湖大学特聘研究员、副研究员,西湖大学徐珊协助整理)
如果把微观生命活动比作一部电影,那么这部精密而复杂的“影片”就是由无数蛋白质各司其职上演的,它们影响着生命体的健康。而“指挥”这些蛋白质、让它们执行各种功能的,就是基因。而在基因塑造生命的过程中,有个隐秘而伟大的遗传“剪辑师”——次要剪接体。
1.每一次剪接,都关乎细胞“命运”
剪接体的故事,要从一条生命体的核心规则——“中心法则”说起。
什么是中心法则呢?我们已经知道,基因控制着生命活动的方方面面,但基因并不能直接对蛋白质发布“指令”,而是需要历经遗传信息的传递。基因是DNA上携带遗传信息的片段,这些遗传信息被传递给RNA,再由RNA转化为有实质性功能的蛋白质。这样一来,基因中的信息就得到了表达。这条标准化的“流水线作业”,就叫作“中心法则”。
我们可以把这个“流水线”想象成多人传话的游戏——一句简单的话,在历经人与人的传递后,很可能会走样。那么,保持其准确、有序、精炼,就成为最关键的一步——形成“正确”的RNA,也就是RNA剪接。
此时,就该剪接体登场了——DNA输送来的“原始影片素材”,也就是遗传信息,实际上是“杂乱无章”的,而剪接体就像一位经验丰富的电影“剪辑师”,它会精确完成以下工作——筛选出包含遗传信息的、需要的片段(即“外显子”)和多余无用的片段(即“内含子”),把无用的片段剪掉后,再把有用的片段按特定的顺序连接起来。由此,正确的RNA就形成了,信息才能进入下一步的蛋白质转化。
剪掉哪段、剪掉多少长度、什么时候剪、如何拼接……电影的剪辑方式和顺序会影响最终呈现效果,剪接体的工作也是如此。通过剪接体的“排列组合”后,有限的基因组能有更多的编码形式,从而形成更多种类的蛋白质——这就解释了,为什么人体只有两万多个基因,但蛋白质却有几十万种。由此可见,剪接体的每一步操作,都关乎细胞的“命运”。
2.次要剪接体,关键的“限速”步骤
你可能已经意识到,剪接体是生物体内不可或缺的存在。从量级上来看,亦是如此,它确实是“大家伙”——它由几十到几百种蛋白质和5条RNA动态组合而成,被教科书称为“细胞里最复杂的超大分子复合物”。
可是,在这样无法忽视的存在中,偏偏就有一个被误读和忽视的身影——次要剪接体。剪接体分为主要剪接体和次要剪接体,因被冠名“次要”,大家往往望文生义,认为它是不重要的剪接体。
事实上,主要剪接体和次要剪接体的功用相似,都是RNA剪接中缺一不可、相互配合的“剪辑师”搭档。从重要性上讲,二者并无差别。
它们的不同之处在以下两个方面。第一,二者所识别的“多余无用片段”内含子不同。主要剪接体识别的是人体内99%以上的内含子,占比较多;次要剪接体瞄准的是在体内含量不足1%的稀有内含子,占比较少。第二,它们的RNA和蛋白质组成存在较大差异。
截至目前,科学家们尚未具体搞清楚它们二者是如何配合的,但它们所主导的两条“剪辑”通路,一定是通力协作的。
说起来,次要剪接体被发现,也比主要剪接体晚得多。1979年,基因剪接现象已经被学界所发现,随之发现了剪接体,可直到20世纪90年代,次要剪接体才“姗姗来迟”,才有了“主要”和“次要”的分别。科学家们发现,有一类“多余无用”的片段(内含子)和以往熟悉的经典序列不同,随之发现它们被一类新的剪接体所剪接。新发现的这类内含子占比稀少,故被称作稀有内含子,相对应的剪接体,即被命名为次要剪接体。
尽管“露面”较晚,次要剪接体却隐秘而伟大。它所剪辑的内含子,分布在许多重要基因之中,因此这条次要剪接体通路,在许多基本的生命活动中起到重要作用。此外,越来越多的研究表明,次要剪接体“剪”的速度,决定了RNA能不能,以及何时能往下转化为蛋白质,是中心法则中关键的“限速”步骤。
3.剪接体出错,引发癌症及罕见病
如果电影剪辑师生病了,或者不在状态,会怎么样?电影可能会成片错乱无章、没有美感。要是遗传信息“剪辑师”—剪接体出了问题,麻烦就大了。
剪接体出错,不外乎两种原因。其一,剪接体作为大分子机器,自己身上出了问题;其二,剪接体的行为出了问题,“剪”错了。无论是哪一种情况都很棘手,因为遗传信息将无法正确传递、不能合成准确的蛋白质、更无从完成生命活动……这些情况都是引发疾病的隐患。
研究表明,尽管占比较少,但次要剪接体的异常与许多人类疾病息息相关,主要是癌症和罕见病。在癌症中,典型的情况是骨髓增生异常综合征,这是白血病的前期。它在中国每年新发病例有30多万,通过基因测序发现,50%的案例是次要剪接体上的蛋白发生突变导致,也就是剪接体本身出了问题了。此外,有35%的人类遗传紊乱疾病被发现与剪接体相关,这些遗传病中有一大部分是罕见病。其中,生长激素缺乏症、早发型小脑共济失调、小头畸形骨发育不良原始侏儒症、迟发性脊柱骨骺发育不良、肌萎缩侧索硬化……这些罕见病都和次要剪接体异常相关。
遗憾的是,次要剪接体对人类来说,依然是一个神秘的存在。尽管它在上世纪已被发现,但随后的研究却陷入停滞。自剪接体发现以来,科学家们一直在探索其中的分子奥秘,期待揭示背后的机理,但也陷入了长年累月的僵局。
这种困境实属事出有因,事实上,研究剪接体从来并非易事。
剪接体是一个庞大且永远处在动态中的“大分子机器”,它的机理非常复杂。所谓“大分子机器”,指的是那些像机器般运作、分子量较大的物质,蛋白质、核酸、多糖等生物物质也属于这个类别。说是“机器”,剪接体远比我们生活中见到的机器复杂得多。如果想要让一台机器发挥功能,只需要把它组装好,然后放在合适的位置,让它运转起来就行了。
但对剪接体来说,并不是这样——假设眼前有一个由8个部分组成的剪接体。在找到需要“剪辑”的“片段”后,这些部分并不是一起组装完成的——可能有一两个先抵达工作地,开始忙碌,其他部分在这个过程中可能会陆续加入、各司其职,也可能会在不同的时间离开,也就是说,这样的结合是动态的。当剪辑完成后,所有8个部分会被释放,等下一次有工作任务了,再进行新一轮的结合。
近年的科学研究证实,剪接体这个大分子机器,每完成一次“剪辑”,期间存在10种不同的状态。
即便应用倍数很高的电子显微镜,也难以清晰地详细观察剪接体这样精密又复杂的工作过程。可以想象,既然主要剪接体的研究已经举步维艰了,对次要剪接体的探索,必然是难上加难。原因非常明了:次要剪接体的含量占比稀少,发出的“信号”弱,科学家们更难获得样本。
4.破译剪接体“真身”,向免于病痛迈进一步
次要剪接体就存在于人体内,伴随着每一刻的呼吸。难道就这样放弃对它的研究吗?既然它是存在的,就不应该毫无新发现,对不对?抱着这样朴素的想法,我国的研究团队决定跟它“死磕”。
眼下,我们希望能够从生物化学和结构生物学的角度,去理解次要剪接体。换句话说,我们想要破译这类“剪辑师”,搞清楚它到底是谁,由什么构成,究竟具体在做什么,是怎么做到的,和主要剪接体如何协作等。
在研究次要剪接体之前,西湖大学施一公院士研究组在过去的十多年间,都在致力于剪接体的三维结构解析与分子机理研究。这个研究组是世界上首个,也是目前唯一一个成功捕获并解析了RNA剪接过程中所有完全组装剪接体高分辨率三维结构系列成果的团队。换句话说,这项研究让人类看清楚了主要剪接体这位“剪辑师”的完整通路,覆盖了“剪辑”的全过程。
我们的研究团队也曾参与其中,在进行了大约四五年的主要剪接体研究工作,有了主要剪接体的研究经验和成果积累后,我们开始对“被忽视”的次要剪接体进行研究。
如何把这1%的次要剪接体捕获出来,跟主要的剪接体分开,是领域内公认的难题。这个空白领域中,没有任何文献和经验可供参考。经过长期研究与实验,我们设计了一个高效的“诱饵”(pre-mRNA),也就是用一段需要“剪辑师”处理的素材,用它“钓”出了含量极少、被视为很难分离的次要剪接体。可以把这个过程想象为针对次要剪接体“喜好”而特别人工设计了它感兴趣的“片段”,投入细胞之中,当次要剪接体找到这个片段、开始工作时,科研人员就能把它连同片段一起提取出来。同时,科研人员改进了后续的纯化方式,使获得的次要剪接体更加稳定、更易被研究。
通过冷冻电镜技术,科研人员重构了这个次要剪接体的结构,整体分辨率高达2.9埃,搭建了它的原子模型,包含了4条RNA和45个蛋白。这是世界上首个被解析的次要剪接体,相关工作已发表在国际学术期刊《科学》上。
对次要剪接体的研究,才刚刚开始,未来需要做的工作还有很多。
一方面,科研人员需要获取更完整的次要剪接体“全景图”。2021年的研究成果“破译”的仅仅是激活状态下的次要剪接体,还需要逐步完成所有10种状态的解析,进一步探究其分子机理、调控通路及功能意义等。与破译主要剪接体的“剪辑”类似,科研人员还需要更深度了解,次要剪接体究竟长什么样、如何工作,怎样和主要剪接体“配合”,完成遗传信息递送中赋予它的使命。
了解这些原理后,科研人员和医药研发人员将能有针对性地设计靶向次要剪接体药物。无论是这个大分子机器自身出了毛病,还是它剪错了,都能被及时纠正,从而使人类免于次要剪接体相关的癌症和罕见病之苦。我们的科研团队希望能够把次要剪接体的成果,更多地应用到维护人类健康之中,目前已经在进行与药物研发、疾病相关的研究。
与此同时,次要剪接体的版图依然是“人迹罕至”的真空地带,我们希望世界上更多的科研工作者能够加入这一研究。为此,我们科研团队想先替大家解决最困难的部分——发明一种次要剪接体的体外研究活性体系,能方便地对次要剪接体开展实验,让结构、细胞、生化、分子等领域的科学家都参与到对次要剪接体的探索中来。
道长且阻,这是基础研究的常态,从0到1的开拓,没有捷径。基础研究的成果要迈入技术应用,也还需要经年累月的不懈努力。但基础研究取得创新性的点滴突破,人类对世界的认知便向前跃进了一步,期待这样的突破奔涌而来。