基于DArTseq的SNP标记的西瓜核心 种质遗传多样性和群体结构分析

    羊杏平 任润生 徐锦华 李苹芳 张曼 刘 广 姚协丰

    目的与意义: 亲本材料是进行育种工作的基础,遗传基础狭窄导致难以培育出突破性品种,因此亟需加强遗传资源的引进及其农艺性状特征和遗传基础的了解与掌握,对现有优良西瓜品种和育种亲本材料进行遗传多样性研究,可有效减少相似遗传背景的组合,减少育种的工作量。同时,随着分子生物学技术的发展,分子标记种类及检测手段日趋完善,利用分子标记技术对植物进行聚类分析,可以快速了解植物的遗传多样性、亲缘关系和品种鉴定等。本研究对37份核心西瓜种质进行遗传多样性分析,确定这些西瓜核心种质材料间的遗传背景差异,为后期育种工作中的亲本组配、等位基因发掘和标记辅助选择等提供参考。

    材料与方法: (1)所用的西瓜核心种质材料共37份,主要包括优良国内西瓜品种和国外引进品种、高代育种自交系、以及野生西瓜种质材料。这些材料由于来源不同,存在一定的遗传差异,各种表型性状差异明显。(2)温室内取幼嫩叶片,抽真空干燥保存,采用CTAB法提取基因组DNA,用紫外分光光度计法检测其质量和浓度,稀释至50~100 ng·μL-1,-20 ℃保存备用。(3)采用DArT标记结合第二代短序列测序技术获得相应材料的SNP基因型。(4)利用软件PowerMarker Version 3.25计算主基于位点频率(major allele frequency),基因多样性(gene diversity),多态性信息含量(polymorphic information content)等。利用软件Darwin Version 5.0,采用基于遗传相似系数(genetic similarity,GS),并以非加权数据分析法(Unweighted Pair-Group Method Using Arithmetic Average,UPGMA)进行聚类,构建聚类树状图。软件Darwin Version 5.0也用来进行主成分分析。(5)以Structure v2.3软件进行群体遗传结构的分析,该方法利用每个个体多位点基因型数据(multilocus genotype)的差异进行聚类,对个体的来源进行推断,并估计最佳群体组群数K,其取值范围为1~8,将马尔可夫链(Markov Chain Monie Carlo,MCMC)开始时的不作数迭代(length of burn-in period)设为 10 000次,再将不作数迭代后的MCMC设为10 000次,迭代次数(number of iterations)设置为8。

    结果与分析: (1)本实验采用DArT标记结合第二代测序方法对37份西瓜核心种质进行基因型分析,对测序数据结果采用重复率为99.7%和call rate 为98.8%的标准,共获得了4 808个在37个西瓜核心种质间具有多态性的SNP标记。为了使后续分析结果更加可靠,对4 808个SNP标记在37个西瓜核心种质中的缺失率大于5%的标记剔除,最后共获得了3 882个SNP标记用于后续进一步的分析。同时以西瓜品种‘97103的基因组序列为参考基因组序列对每一个SNP在染色体上的物理位置进行了确定(最小碱基相似度为大于90%,E值为小于10-5),平均每条染色体上含有352个SNP标记。②根据对37份西瓜核心种质SNP基因型分析,基因多态性(gene diversity)的范围为0.03~0.5;标记的多态性信息含量(PIC :polymorphism information content)值为0.02~0.38。平均基因多态性和PIC值分别为0.14和0.13。对两者值的分析,共有91%的基因多态性值和93%的多态性信息含量(PIC)值位于0.05~0.20之间。(3)根据3 882个SNP标记计算得到遗传相似系数,按Neighbor-joining (N-J)法構建了37份西瓜核心种质材料之间的遗传关系聚类图,其中2个西瓜野生种质明显地和其他35分西瓜栽培种分开。为了使聚类图显示的效果更加清晰,进一步对35个栽培西瓜种质又进行了聚类分析,结果显示35个栽培西瓜种质可以被区分为3类。第一类包括了11份材料:Au-RS,Au-GSC,All Sweet,Smokylee,Charleston Gray,Sugarlee,LW023,SSD,Crimson Sweet,9 Jiu, LW022。第二类包含了20份材料:Calhoun Gray,P4,P1-3,P3-1,Sugar baby,Hong 5-2,SW055-1,MW097,MW099,K3,Fuxing F8,MW095,MW096,SW057,Red Flesh 8424,Furong F8,MW026,MW089,J2,MW022,其中2份来自美国,1份来自中国台湾,剩余为来自中国大陆。第三类包含4份材料,R-1-3,R-1-2,R-2-1-2,SW043,其中3份为江苏省选育的育种系,1份来自中国台湾的育种系。(4)为了更加直观地观察到各个西瓜种质材料之间的关系,我们根据遗传相似系数进行了主成分分析。结果显示37个西瓜核心种质也是被明显地分为2大类,即野生西瓜类和栽培西瓜类。同样,和聚类结果一样的是,剩下的35份西瓜栽培品种也主要分为3类,第一主成分和第二主成分分别介绍变异的25.9%和11.2%。(5)同样用3 882个SNP标记分别对37份和35份西瓜种质进行了群体遗传结构分析。对37份西瓜种质来说,LnP(D)和ΔK的峰值都出现在当K值等于2时,说明这37份西瓜种质也主要划分为野生类和栽培类2个大类。当对35个西瓜种质材料进行群体遗传结构分析时,LnP(D)值随着K值从1到8连续递增时,LnP(D)值的拐点出现在当K值从2到3时。同样ΔK值的峰值出现在当K值等于3的时候。这些结果说明35份西瓜种质主要被分为3个类群,结果和聚类分析和主成分分析的结果完全一致。

    结? ? ?论: 为了将一些核心西瓜种质材料有效地在西瓜育种中加以利用,本研究利用3 882个SNP标记,对37个西瓜核心种质进行了遗传多样性分析,结果显示2个野生西瓜种明显区别于西瓜栽培种,而剩下的35个西瓜栽培种则主要划分为3个主要的类群。