西瓜果实发育过程中转录组的初析

    郭绍贵 刘景安 郑轶 黄明云 张海英 宫国义 何洪巨 任毅 钟思林 费章君 许勇

    目的与意义:目前关于西瓜果实在分子水平上发育和成熟的信息非常少,栽培西瓜是一种非呼吸越变型水果。到目前为止,只有一份报告描述了西瓜果实发育过程中一小部分基因的表达,对西瓜进行了大规模的转录组测序,以期对西瓜果实发育过程中的分子基础有更多了解。

    材料与方法:使用西瓜自交系‘97103作为试验材料,在西瓜成熟过程中的白肉阶段、粉肉、红肉和过熟阶段分别测序cDNA,进行cDNA序列处理、组装、注释和比较基因组学分析,鉴定西瓜差异表达的基因,测定糖、可溶性固形物和类胡萝卜素的含量以及果肉硬度,qRT-PCR分析2个糖代谢基因。

    结果与分析:通过使用焦磷酸测序技术对西瓜果实发育过程中4个阶段的cDNA样品进行测序。4个阶段分别是:白肉阶段(10 DAP),粉色果肉(18 DAP),红色果肉(26 DAP)和过熟(34 DAP),获得了总共577 023个高质量的EST,平均长度为302.8 bp,总长度为174.7 Mb。组装了包括大约8 000个EST,这些ESTs分布在4 616个unigenes中,在454个深度转录组测序后962个unigenes(20.8%)未被捕获。这表明尽管454个深度测序产生了大量新的 unigenes(超过70 000),但是只有将转录组测序到更深度的水平才能发现更多的稀有基因。

    为了注释西瓜转录组,使用BLASTX程序将单基因序列与NCBI非冗余(nr)蛋白质数据库进行比较。分析显示,41 245(54.9%),20 648(27.5%)和4 493(5.9%)的unigenes与已知蛋白质序列匹配。比较了西瓜unigenes与pfam域数据库,总共11 454个水溶性unigenes含有至少一个由unigenes代表的pfam结构域和1 475个不同pfam结构域。发现465个unigenes含有转录因子的结构域,代表性最高的pfam转录因子结构域是PF00319、PF00847、PF00046和PF01486。然后将基因GO注释到它们UniProt数据库中的已知蛋白质,共有33 853个unigenes(45.1%)被分配至少一个GO注释,其中在生物过程类别的28 987个(38.6%)被分配到至少一个GO注释中,28 997个unigenes(38.6%)分配在分子功能类别中,细胞成分类别中有27 036(36%),而在所有3个类别中,21 779(29%)unigenes被指定为GO注释。GO注释揭示了大量基因参与碳水化合物代谢过程(1 807),解剖结构形态发生(1 687),细胞氨基酸和衍生物代谢过程(1 595),以及次级代谢过程(992)。

    筛选了水溶性二烯,三-,四-,五-和六-核苷酸SSR碱基序列,并能够预测4 668个西瓜unigenes的5 195个SSR,其中2 265、2 709、11 557和49个分别是二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸SSR(简单重复序列)基序。最常见的SSR基序是AG / CT(1 616; 31.1%),其次是AAG / CTT(1 300; 25%),AT/AT(519;10%)和AAT/ATT(465; 9%)。在本研究中确定的SSR标记提供给了西瓜重要的分子标记资源。然而,这些SSR的多态性需要在特定的群体中进行测试。

    根据差异表达的基因分类为不同的类别:1)在西瓜成熟的4个阶段中的每个阶段都高度表达的基因; 2)在西瓜成熟早期阶段高度表达的基因; 3)在西瓜成熟晚期高度表达的基因。蔗糖、果糖和葡萄糖,这3种糖类决定了果实的甜度和3种类胡萝卜素(番茄紅素、β-胡萝卜素和叶黄素)含量,这些类胡萝卜素在果实着色中起关键作用(原图5)。另外,通过数据分析发现许多细胞壁相关基因在未成熟的白色果实中有更高的表达,包括PRPs(富含脯氨酸的蛋白),阿拉伯半乳聚糖蛋白(FLAs),木葡聚糖内转糖基酶(XETs)。在未成熟的白肉阶段,由于番茄红素开始的积累,西瓜果肉组织开始变成粉红色。确定了在西瓜果实发育中4个阶段3种主要胡萝卜素、番茄红素、β-胡萝卜素和叶黄素的含量,结果显示,番茄红素是果实中的主要类胡萝卜素。所得数据证实了糖代谢的大致趋势,蔗糖占成熟果实中总可溶性糖的约50%,而未成熟和白粉色果肉中的果实含量为3%~7%。作者鉴定了在西瓜果实发育过程中差异表达的蔗糖合成酶和蔗糖磷酸合成酶,这2个基因参与蔗糖的生物合成,并在红色果肉和过熟阶段在果实中高度表达。

    结? ? 论: 西瓜是一种重要的经济水果作物,而且西瓜是非呼吸越变型水果的研究资源。但是西瓜的遗传资源和基因组资源十分匮乏,这是西瓜研究和育种的主要限制性因素之一。上文中在西瓜4个不同的生长发育阶段中使用焦磷酸测序技术获得了大约50万左右的ESTs,这些ESTs被de novo组装并广泛注释,这代表了西瓜转录本目录的扩展,为将来某些感兴趣基因的功能和表达分析提供了全面的物质基础。这些ESTs也将有助于注释现阶段正在测序的西瓜基因组,基因表达的数字化和代谢谱的综合分析为进一步探索西瓜果实发育的分子机制和西瓜果实品质性状的调控机制提供了新的思路。