游戏百科

文献分享|Nature|豇豆驯化与改良的基因组选择印迹

浙江大学合作团队在国际遗传学顶尖期刊《自然·遗传学》(Nature Genetics)发表了题为“Differentia

浙江大学合作团队在国际遗传学顶尖期刊《自然·遗传学》(Nature Genetics)发表了题为“Differential selection of yield and quality traits has shaped genomic signatures of cowpea domestication and improvement”的研究论文。该论文为豇豆在全基因组选择下的驯化与改良提供了见解。产量性状和品质性状的差异基因组选择将有助于建立粮用豇豆和菜用豇豆双向改良的遗传资源。

豆类作物的营养丰富,具有重要价值。豇豆(Vigna unguiculata L. Walp.,2n=2x=22)原产于撒哈拉以南的非洲地区,在全球范围内广泛种植。野生亚种V. unguiculata ssp. dekindtiana var. spontanea被认为是其祖先。驯化豇豆形成了两个主要亚种:非洲的粮用豇豆(V. unguiculata L. Walp. ssp. unguiculata)和亚洲的菜用豇豆(V. unguiculata L. Walp. ssp. sesquipedalis)。全球粮用豇豆的年产量约为8.9百万吨,其中85%产自西非。这一亚种在发展中国家提供了淀粉、膳食蛋白质、纤维和微量营养素的优良来源,是人类粮食的重要替代品和家畜饲料。菜用豇豆因其长的未成熟豆荚(长度为40-100厘米)而被广泛栽培。菜用豇豆主要分布在东亚和东南亚地区,是亚洲十大蔬菜之一。

粮用豇豆和菜用豇豆在许多重要的农艺性状上存在显著差异,如豆荚长度(PL)、每豆荚粒数(GNP)和营养成分等。豇豆亚种的性状差异被推测是由于人类选择的结果。先前的研究已经报道了一些控制豇豆驯化和改良性状的数量性状位点(QTLs),涉及豆荚裂开性(PS)、豆荚长度(PL)、豆荚质量和种子大小等。然而,与亚种分化相关的全基因组遗传变异仍然大部分未知。尽管已发布了高质量的粮用豇豆基因组,但菜用豇豆基因组的匮乏仍然阻碍了阐明塑造亚种差异和关键性状改良的基因组基础。

在这项研究中,作者结合二代和三代测序技术组装了菜用豇豆和粮用豇豆的参考基因组,并对344份材料进行了全基因组重测序,以阐明豇豆的系统进化。此外,作者进行了GWAS以识别与重要农艺性状相关的基因。本文揭示了两个亚种之间基因组结构变异,并在基因组水平解析了两者的差异选择。

基因组组装及注释

该研究选择了长荚菜用豇豆(G98)和抗病性强的粮用豇豆(G323)进行基因组Denovo。K-mer预估G98和G323的基因组大小分别为623.16Mb和597.42Mb,最终组装的基因组大小分别为568.24Mb(scaffold N50 = 49.41Mb)和552.66Mb(scaffold N50 = 49.35Mb)。二代回比率(G98:99.19%;G323:99.69%)、CEGMA(98%)、BUSCO(95%)和Merquery(G98:44.48;G323:47.17)评估表明本次构建了2个高质量的染色体水平豇豆基因组。

G98和G323分别预测到33,159和33,222个蛋白编码基因,重复序列占基因组的56.97%(G98)和55.25%(G323),以Gypsy的长末端重复反转录转座子(LTRs)为主,分别占基因组的17.19%(G98)和18.72(G323)。

豇豆的系统进化与SVs

对25个物种进行系统进化树分析显示豇豆与赤小豆(V. angularis)和绿豆(V. radiata)亲缘关系较近,它们的分化时间大约在6-27百万年前(图2a),这与之前的报道一致。基因家族分析发现G98中有512个家族发生了显著扩张,这些扩张的基因家族在参与膜组织的鞘糖脂代谢途径显著富集,可能与菜用豇豆的豆荚发育相关。相反,G323扩张基因在氨基酸糖和核苷酸糖代谢、硫代葡萄糖苷-谷氨酰水解酶和半乳糖代谢等能量产生和转化途径中显著富集(图2b, c),这可能与粮用豇豆更高的碳水化合物积累和防御反应有关。

作者以G323为参考基因组,对2个基因组进行变异检测,在G98上共发现2,219,947个SNPs,其中38,420个SNPs可能引起基因功能的改变;发现407,119个InDels,其中62.50%的可能引起蛋白编码的改变;另外,发现13,541个SVs(包括963个TRANS,74个INVS,3,701个DUPs,7,112个PAVs和1,691个CNVs)。

值得注意的是,作者发现了5个较大的SV区域(> Mb)(图2d, f)。Chr1包含一个7.5 Mb的INV和多个相邻的TRANS,分别包含61个和31个基因(图2d)。Chr6包含一个4.73 Mb的INV区和一个5.14 Mb的INV区,包含两个INVs,两个DUPs和两个TRANS。这两个区域分别包含42和52个基因(图2e)。Chr10含有最大的一个INV,共包含224个基因(图2f)。在其余染色体上共检测到13个其它SV区域。

豇豆亚种的种群结构与分化

作者进一步对全世界收集的344份豇豆核心种质进行重测序,PCA分析将其划分为2个聚类(图3a),主要由粮用豇豆(cluster I)和菜用豇豆(cluster II)组成。利用菜豆作为外群,系统发育树将其划分为以粮用豇豆(G)、菜用豇豆地方品种(VL)和菜用豇豆育成品种(VC)为中心的3个类群(图3b)。群体结构分析也支持了PCA和系统发育树的结果(图3b)。

对三个亚群的核苷酸多样性(π)和群体差异(Fst)进行分析(图3c)。G组(π = 0.0007)核苷酸多样性显著高于VL组(π = 0.00047)和VC组(π = 0.00024)。G-VC(0.1903)和G- VL(0.0924)的FST值均高于VC-VL(0.0498)。此外,与VL和VC组相比,该组的连锁不平衡衰减更快,表明粮用豇豆的遗传重组程度更高(图3d)。

豇豆驯化与改良的基因组特征

为了研究自然或人工选择对豇豆分化的影响,作者通过选择清除分析比较了三个豇豆亚群之间的基因组选择特征,鉴定出239个与豇豆驯化和改良相关基因。进一步结合GWAS分析,共鉴定出与嫩荚总淀粉含量(PTS)、籽粒总淀粉含量(STS)、单荚籽粒数(GNP)、嫩荚可溶性糖含量(PSS)和荚长(PL)相关的18个受选择的区域。裂荚性(PS)是最显著的驯化性状之一,在SNP-GWAS和InDel-GWAS中均监测到相关位点。其中一个PS位点(PS-3.2)在344份材料中存在2个单倍型,Hapll材料的裂荚率更高(48%)(图4b);另外3个PS位点(PS-3.3, PS-4.2, PS-10.3)的不同单倍型之间的裂荚率差异很小。在G和VL的驯化扫描中发现了6个PS相关位点 (图4a),解释了这两个亚种之间PS抗性的差异。基因表达分析发现,大多数裂荚相关候选基因在G型豇豆和V型豇豆荚间的表达模式不同,表明基因的表达可能与PS呈正相关。该发现将为提高豇豆耐裂荚性提供理论基础。

豇豆的产量与品质变异

产量相关基因和品质相关基因在3个亚群体(G、VL和VC)中的多态性和分布揭示了豇豆表型分化的遗传基础。荚长(PL)、单荚粒数(GNP)和千粒重(TSW)是影响豇豆产量的重要因素,G亚群的PL通常比VL和VC亚群的PL短得多(图5a)。GWAS分析挖掘到与这3个性状相关的位点和候选基因,并对候选基因单倍型及其表达分析,发现PL差异可能是由于VuPL1-HapII 和 VuPL4-HapI (图5b) 在豇豆驯化和改良过程中强烈选择引起的。在重组自交系(RIL)群体中进一步验证了VuPL1和VuPL4的功能,发现VuPL1似乎比VuPL4在该群体中具有更强的作用。同时基因表达分析发现WAKs基因可能以剂量/转录依赖的方式导致PL差异。粮用豇豆的GNP也通常比菜用豇豆的低,可能是VuGNP2-HapIII这一有利单倍型引起的(图5e)。TSW则可能与VuTSW1和VuTSW2基因的有利单倍型有关(图5f),其功能也分别在RIL群体和F2群体中得到进一步验证。

这项研究全面解析了豇豆驯化与改良中重要性状相关的基因组选择特征,阐明了豇豆产量和品质协同提升的遗传机制,为粮用豇豆和菜用豇豆的双向改良提供了基因组工具,为豇豆品质、产量、抗逆、抗病性状的协同改良提供了有力的基因组育种策略,研究成果有望为缓解地球人口持续增加导致非洲等地区发展中国家食物安全问题和改善人类膳食营养结构提供基因组育种新策略。