2024年8月,中国热科学院方永军联合海南大学唐朝荣、兰州大学刘建全等团队在Nature Communications期刊上以“Pan-genome and phylogenomic analyses highlight Hevea species delineation and rubber trait evolution”为题发表了研究论文。该研究组装注释了8个代表性橡胶树属种质高质量基因组,其中4个达到了染色体水平。利用94个橡胶树种质的重测序数据,基于群体进化、基因流等分析,阐明了物种进化过程中的群体分化事件、自然基因流动与不同种间杂交事件。同时证明了橡胶延伸因子/小橡胶粒子蛋白(REF/SRPP)大基因簇的产生和其在乳胶管中的特异性功能分化是植物形成产胶这种抗虫性状的一个关键性进化事件。

导读
巴西橡胶树(Hevea brasiliensis)是世界上唯一的天然橡胶商业来源,是一种重要的工业原料。然而,该作物狭窄的遗传多样性给橡胶育种带来了挑战。本文完成了高质量的新基因组组装,包括3个H. brasiliensis品种, 2个H. brasiliensis野生品种和3个其他橡胶树物种(H. nitida、H. pauciflora和H. benthamiana)。通过分析94个橡胶树品种的基因组,本文确定了5个不同的谱系,这些谱系与以前的物种描述不一致。在这些谱系之间发现了多个杂交起源,表明它们之间的生殖隔离不完全。只有四分之二的野生品种被引入到商业橡胶品种中。此外,还发现,橡胶生产性状是在该属产胶乳汁管中一个大REF/SRPP基因簇的发展及其功能特化之后出现的。这些发现极大地促进了橡胶育种。

一、 8个橡胶属基因组的组装与注释
为了探索橡胶树属(Hevea spp.)基因组的遗传多样性,本研究选取了八个具有代表性的种质资源进行基因组测序和组装。这些种质资源包括三个高产的巴西橡胶树(Hevea brasiliensis)栽培品种:RY879、RY73397(Hb)和RRIM600;两个巴西橡胶树的野生种质:XJA868(中等产量)和XJA968(低产量);以及三个其他种质资源:光叶橡胶树(H. nitida,Hn)、少花橡胶树(H. pauciflora,Hp)和本氏橡胶树(H. benthamiana,Hbe)。特别值得注意的是,Hn和Hp对南美叶枯病(SALB)具有高度的抗性。
在基因组组装过程中,首先使用Canu软件对ONT(Oxford Nanopore Technologies)测序数据进行校正,随后应用SMARTdenovo软件进行基因组组装。经过校正和去冗余步骤后,得到的八个基因组大小介于1.48至1.58Gb之间,这表明不同橡胶树种质资源的基因组大小具有高度的一致性。利用四个种质的Hi-C数据,结合Lachesis软件将序列锚定至18条染色体上,锚定成功率超过95%。对于缺乏Hi-C数据的剩余四个种质,本研究采用RY73397基因组作为参考,利用RagTag软件将序列锚定至染色体上,并运用3D-DNA软件构建染色体。这些步骤共同确保了高质量的基因组组装结果。此外,通过对同一种质使用不同挂载软件得到的基因组版本进行共线性分析,结果显示不同版本的组装结果具有高度的一致性。

本文利用ONT PromethION上的长读测序和HiSeq上的短读Illumina测序(HiSeq)重新组装了这8个Hevea的基因组,平均覆盖深度分别为95x和12x。图d为Hb RY73397体细胞染色体图片。


二、橡胶树属的进化历程
利用代表性物种O. sativa、V. vinifera、C. papaya、A. thaliana、P. trichocarpa、R. communis、J. curcas、M.eaculenta与8个橡胶树属物种,利用PAML80软件包中的MCMCTree程序并基于199个单拷贝直系同源基因估算了分歧时间。系统进化树结果表明橡胶树品种都是在距今约377万年前开始分化的。

为了构建橡胶树核型进化模型,将A. thaliana、P. trichocarpa、M. esculenta和橡胶树基因组与V. vinifera的基因组进行了比较,并根据它们之间的共线关系推断了各物种的染色体组成。结果表明大戟科植物橡胶树与其近亲M. esculenta的核型高度相似。

基于94个橡胶树种质的重测序数据群体进化分析与PCA分析,可分为5个主要品系,并观察到许多个体出现了五个品系杂交的基因组混杂现象。同时,基于基因流分析(图4e)发现了五个品系之间广泛的基因流动,并揭示了 栽培品系Cul接受了来自其他两个野生品系的基因导入,同时也表明了野生品系之间的自然基因交流。

三、橡胶树属泛基因组构建
基于gene-based进行泛基因组分析,使用 OrthoFinder对8个橡胶树属基因组的蛋白质序列进行了分析,以界定不同类型的基因类别。橡胶树属泛基因组所需的基因组数量要少得多,这可能反映了橡胶树属的分化速度较慢,或迄今为止用于从头组装基因组的取样有限。
在乳胶、叶片和树皮这三种受检组织中,四种基因组成的表达排名大致相同:核心基因 > 次核心基因 > 特有基因 > 非核心基因。核心基因主要富集在初级代谢中,而非核心基因主要富集在次级代谢中。相比之下,非核心基因、非核心基因和特有基因之间存在大量重叠,在次生代谢中都表现出很大的富集比例。这些结果表明,核心基因可能在基础代谢中发挥了重要作用,而其他基因则可能导致了橡胶树品种间环境适应性的差异。

四、REF/SRPP扩增和分化对橡胶性状进化至关重要
为了实现种子植物的整体代表性,下载了152个高质量基因组,其中~80%在过去五年中发布,涵盖被子植物和裸子植物的48个目和97个科,并检索REF/SRPP基因。在大戟科中,REF/SRPP基因家族似乎仅在橡胶树属中扩展,具有 14 个或更高的基因拷贝,而其他物种只有2-7个拷贝。此外,橡胶树属基因组中REF/SRPP基因的数量明显高于大多数被子植物或裸子植物中的基因数量。
橡胶生产植物特有的大型REF/SRPP基因簇促使我们进一步探索这种串联复制引发的事件在橡胶性状进化中的作用。系统发育树和基因组位置使我们能够推断橡胶树-木薯分裂后REF/SRPP基因簇基因的进化路径,揭示13个基因簇可能是由REF/SRPP祖先的12轮串联基因复制产生的。
在本研究中,利用三个橡胶树品种的成熟原始树木来研究乳胶科为主的REF/SRPP基因在刺激乳胶输出中的作用。三个品种的乳胶产量在连续采摘后逐渐增加,在第七次采摘时达到高峰,此后乳胶产量相对稳定。四个乳胶为主的REF/SRPP基因REF1、REF3、REF7和SRPP1的表达受到敲击处理的刺激 。此外,在所有三个品种中,前两个REF/SRPP基因(REF1 和 SRPP1)与乳胶产量之间存在显著相关性。

结束
在橡胶树属中,迄今为止只对巴西橡胶树(H. brasiliensis)一个物种的基因组进行了从头组装,其中2个采用短读测序技术,2个采用短读与长读杂交测序技术,3个采用长读测序技术。之前的研究表明REF/SRPP(橡胶伸长因子/小橡胶颗粒蛋白)串联基因簇在橡胶生产中的重要性。
研究从三个巴西橡胶树品种、两个野生橡胶树和三个其他橡胶树物种(H. nitida, H. pauciflora和H. benthamiana)中生成了8个高质量的从头基因组组合。随后,研究利用94份橡胶树重测序数据、大量RNAseq和橡胶产量数据以及多种高质量被子植物和裸子植物基因组的整合分析,对橡胶树进行了泛基因组分析。研究为Hevea属的物种划分以及REF/SRPP基因群与控制橡胶生产的性状进化的关联提供了有力的证据。