本报讯(记者黄明明)近日,3000株水稻基因组测序文章在GigaScience正式发表,且整套水稻基因序列以可引用形式在该杂志的附属开放获取数据库GigaDB中公开。
该项目产生的数据是目前已公开水稻序列数据量的四倍。该成果标志着3000株水稻基因组项目第一阶段的完成,主要由中国农业科学院、国际水稻研究所以及华大基因合作开展。
由华大基因和生物医学中心共同创办的GigaScience是一个开放获取且数据公开的大数据期刊。“3000株水稻基因组项目”所产出和公开的大量遗传信息将最终被应用到智能育种实践中。不同植株间存在自然变异,而了解这些不同性状发生的遗传机制,将有助于成功培育出可高度适应不同环境的杂交品种。
据悉,上述三家单位的合作不仅公开了13.4TB的数据资源,而且还收集了每株水稻的种子(存放于国际水稻研究所的水稻基因资源库中)。储存这些种子对充分利用这些遗传信息已知的水稻品种来开发和验证最适合不同环境的杂交株是十分必要的。然而,实现这一目标的另一条件是这一信息可以使研究人员和育种专家直接将遗传信息(基因型)和不同植株的性状特征(表型)联系起来。这需要仔细评估和管理每株水稻的重要农业性状特征,之后再在可用的基因组序列中与其相应的遗传标记相关联。
现代育种实践延续至今,通常依据表观性状特征来指导候选植株杂交,并期望杂交后代能够表现出结合和改良的预期性状,如抗旱、抗病虫、产量提高和营养价值增加。然而,当两个植株进行杂交后,对应的遗传组成常常使育种学家的期望落空,因为未知的基因相互作用会限制、修饰或改变所选择的性状特征的形成。因此,常常需要试验、发现错误和多个连续的育种阶段。
全面了解一个植物的遗传组成可以使研究人员鉴定与特定性状特征相关联的遗传标记,更好地了解不同的基因相互作用是如何影响植物的表型的,从而实现更加准确、快速的水稻品种培育。
这个过程需要投入大量的精力与人力。因此,这些向全球植物育种学家和科学家免费公开的数据,将极大地推动水稻的基因型/表型之间关联的研究,同时对加深植物生物学的理解提供了丰富的资源。
《中国科学报》 (2014-06-11 第11版 综合)