张勇研究组关于逆转座子所介导的复制突变过程的工作在Genome Res.和Scientific Rep.发表
基因既可以通过DNA水平的复制,也可以通过RNA水平的复制来产生新的拷贝,后者又称为逆转录基因,产生的过程称为逆转录。有实验证明在哺乳动物中,逆转录基因由一种non-LTR(long terminal repeat,长末端重复序列)类型的逆转座子即LINE-1(long interspersed nuclear element,或称L1)介导产生,但是在其他动物中却并不明确。
该研究首先在黑腹果蝇中鉴定出15个多态性的逆转录基因,发现它们都具有一种相同的结构,即中间为逆转录基因,两侧为LTR逆转座子的嵌合结构。这些逆转录基因与逆转座子的融合点存在微同源序列,说明它们与LINE-1介导产生的逆转录基因不同,而是由一种模板跳转的机制产生的。在进一步对蚊子、斑马鱼、鸡、老鼠和人进行同样的研究时发现,这些物种中都含有同样嵌合结构的逆转录基因。由此研究首次提出一个模型来解释上述现象(图1):逆转录基因是由LTR逆转座子在复制过程中,借助微同源序列发生模板跳转而产生的。这是一种全新的外显子重排机制,即多个逆转录基因可以融合在一起,进而形成更复杂的嵌合基因发挥功能。逆转录基因可与两侧的LTR逆转座子序列共表达,说明嵌合基因产生之后可以立刻转录表达。此外,嵌合基因的转录本与母基因具有相同的翻译读码框,即它们极有可能进而翻译蛋白发挥功能。总之,研究组通过大尺度跨物种分析,鉴定了一种跨越无脊椎和脊椎动物的高度保守的基因复制机制,它将持续地改变动物体的基因构成。
这项研究以“LTR retrotransposons create transcribed retrocopies in metazoans”为题,于2016年10月20日在线发表于基因组学领域的知名期刊 Genome Research (doi:10.1101/gr.204925.116)。研究组谭生军助理研究员为第一作者,张勇研究员为通讯作者。瑞士洛桑大学的Margarida Cardoso-Moreira博士、中国科学院遗传与发育生物学研究所的刘忠华博士和黄勋研究员、美国芝加哥大学龙漫远教授为该项目提供了大力支持。
图1 LTR介导的转座子模板跳转模型示意图
VLP表示病毒颗粒;RT表示反转录酶;PR表示蛋白酶;IN表示整合酶;在LTR逆转座子结构中,黑色长方框代表LTR重复序列,浅绿色代表开放阅读框。蓝色长方框代表宿主基因组编码的外显子,白色长方框代表内含子。在类病毒颗粒中两条模板发生模板转换,产生了一条嵌合体cDNA(也可能发生多次转换)。整合之后,嵌合体序列可被翻译为类LTR转座子,并进入下一轮逆转录循环中发挥作用。
如上所述,在哺乳动物中,逆转录基因主要是由LINE-1逆转座子介导产生的。在植物中,逆转录则认为主要是由LTR转座子介导产生的,但也有LINE-1可以介导产生逆转录基因的假说。研究通过寻找年轻的逆转录基因拷贝,这些基因仍然保留与逆转录产生机制相关的序列特点,来验证上述假说。通过分析公共拟南芥(Arabidopsis thaliana)测序数据,研究组鉴定出了一些多态性的逆转录拷贝(逆转录CNV),和在拟南芥和木薯参考基因组中最近固定的逆转录拷贝。在这两个数据集中,发现了有些逆转录基因具有LINE-1的特征序列,即所期待的靶位点序列,polyA尾巴和同向重复序列。这些结果表明了类似于LINE-1的逆转录机制同样可以在植物中,尤其是双子叶植物中起作用。这项研究成果以“LINE-1-like retrotransposons contribute to RNA-based gene duplication in dicots”为题,在2016年4月21日发表于 Scientific Report (2016, 6: 24755)。重庆大学朱政霖博士(合作)、中国科学院动物研究所谭生军助理研究员为共同第一作者,朱政霖博士和张勇研究员为共同通讯作者。
以上研究得到了中国科学院B类先导专项“动物复杂性状的进化解析与调控”、973等项目的资助。在计算方面,得到了中国科学院北京基因组研究所基因组测序与数据分析中心和中国科学院动物研究所高性能平台的支持。