西瓜高密度遗传图谱的构建及基因组Scaffolds定位

    任毅 赵泓 寇青禾 江姣 张海英 侯文菊 邹小花 孙宏贺 宫国义 许勇

    

    目的与意义:现代西瓜品种的遗传基础较窄,然而西瓜中有几个亚种具有广泛遗传多样性,它们可以成为改良西瓜品种的有用种质资源。当前西瓜基因组资源和遗传图谱有限,并需要开发一种可用于鉴定西瓜染色体的细胞遗传学图谱,其能够划定栽培西瓜与其它相关的西瓜属植物之间存在的结构差异。现如今,还没有任何关于西瓜基因组序列的高密度遗传连锁图谱的报道,致使西瓜在不同品种之间遗传多样性较低。所以,构建高密度的西瓜遗传连锁图谱成为当下之需。

    材料与方法:使用栽培种‘97103和野生种‘PI 296341-FR杂交单粒传构建的103株系重组自交系(RILs)选择96株。从栽培种‘97103基因组组装scaffolds和野生种‘PI 296341-FR的基因组序列读取来开发SSR(简单重复序列),InDel(插入缺失)和SV(结构变异)标记。利用栽培种‘97103和野生种‘PI 296341-FR構建的103株RIL群体进行遗传作图。使用JoinMap进行图谱的构建,计算片段的重组率。利用细菌人工染色体(BAC),5S和45S rDNA探针,用于荧光原位杂交(FISH)。

    结果与分析:SSR、InDel和SV标记是基于栽培种‘97103组装的353 M基因组scaffolds 序列和野生种‘PI 296341-FR的重测序数据开发的。研究中共鉴定了13 744个假设的SSR位点。在消除多种同源性的SSR基因后,选择具有长重复基序的1 877个特有SSR用于与RIL群体的亲本系(‘97103和‘PI 296341-FR)的多态性分析。在1 877个SSR中,787个(41.9%)在PCR扩增后显示出栽培种‘97103和野生种‘PI 296341-FR之间的多态性。在仅选择5~10 bp内的InDel和120 bp至1 500 bp的SV,获得3 759个InDel和584个SV。选择InDels标记303个和SV标记54个用于2个RIL亲本之间的多态性分析,结果显示303个InDel标记中的290个标记和所有54个SV标记在父母本之间是多态的。

    偏分离普遍存在于遗传作图中,偏分离在植物基因组进化中起着主导作用。在第1、2、3、4、5、7、8、9号和10号连锁群(LGs)中分别检测到9个偏分离热点区域。在11个LGs中发现了11个重组抑制区域,染色体末端的区域具有更高的重组率。热点区域的重组率为3.0~8.3 cM·Mb-1,而抑制区域的重组率为0~0.9 cM·Mb-1,整个基因组的遗传距离与物理距离的平均比值为2.3 cM·Mb-1。

    成功锚定了234个scaffolds,总共330 Mb,占栽培种‘97103基因组被拼接的353 Mb的93.5%,而且,195个scaffolds至少被2个标记所锚定。平均每个scaffolds 被4个标记所定位,具有一个以上标记的94个scaffolds可以在遗传图谱上确定方向。对于仅具有一个遗传标记或具有低重组频率的基因组区域的140个较小scaffolds在图谱上的定位尚不能确定方向,根据连锁组命名编号将11条染色体进行了scaffolds组装。

    测序了947个BAC克隆的两端的序列,并获得了一个共有1 664个高质量的末端序列,这些序列和西瓜基因组scaffolds比对。将86个单拷贝BAC鉴定为FISH的候选探针,其中11个具有染色体特异性。还对有丝分裂染色体上的45S和5S rDNA位点进行了FISH定位,以识别第4号染色体和第8号染色体。结果发现,栽培种‘97103基因组中有2个45S rDNA位点和一个5S rDNA位点。5S rDNA位点与第8号染色体上的一个45S rDNA位点同步,而另一个45S rDNA位点位于第4号染色体上。

    利用来源于包括scaffolds锚定和定位全基因组测序以及重测序多态性SSR标记,InDel标记和SV标记构建了西瓜遗传图谱。这是第1个以组装基因组为基础的高密度西瓜基因图谱。以高密度遗传图谱用作参考图谱,用FISH分配连锁群来匹配染色体,该图谱为锚定和定向基因序列以及确认目前基因组组装的完整性提供了基础。对未来的数量性状基因(QTL)定位、分子标记辅助育种和位置基因克隆很有价值。这些标记被选择出来后均匀分布在scaffolds 中(图3),从而可以对整个基因组重组进行更好地评估。发现9个偏分离热点区域(SDRs)中的8个和Citrullus lanatus var. lanatus亲本相关,这种偏离的可能是栽培亲本中区域基因与果实和种子的产量有关。

    鉴定了位于每个染色体中的基因组区间SNP和InDel数量在减少,表明这些区域可能具有较低的序列多样性。在低SNP和InDels区域,鉴定出50和100个标记,其平均重组率分别为0.6和0.9cM·Mb-1,与重组抑制区域速率(0.4 cM ·Mb-1)相似,低于全基因组重组率(2.3 cM·Mb-1)。这些标记发生在重组抑制区域,意味着低序列多样性区域与遗传图谱中鉴定的低重组区域重叠,它们可能位于着丝粒周边区域。每个标记都是从非重复scaffolds 序列设计的,理论上可以检测整个基因组中的交叉。具有高SNP和InDel密度的区域富含重组活性染色体末端,表明它们位于端粒和富含基因的区域。

    结? ? 论:利用由103株系重组自交系和228.3 Mb组装序列组成的高密度遗传图谱,成功地锚定了234个Scaffords(占353Mb序列的93.5%),绘制出了第一个以基因组组装为基础的西瓜高密度遗传图谱。最近报道的几种作物遗传图谱中组装序列锚定和定位百分比显示,可可(67%锚定,50%定位);苹果(88%,66%);葡萄(69%,61%);草莓(94%锚定);大豆(97%锚定);黄瓜(72.8%锚定),与此相比较,西瓜中scaffolds锚定的比例(93.5%)很高,而定位序列(65%)所占的比例并不高,但与其他作物中所报道的定位程度相似。高密度西瓜遗传图谱反映了整个基因组scaffolds序列的整合,将有助于重要基因的定位克隆、QTL的鉴定和标记辅助选择(MAS),对西瓜育种有很大帮助。