人类基因组大约有60亿个碱基对长大肠杆菌的基因组大约有500万个碱基对长,洋葱的基因组大约有160亿个碱基对长。洋葱的基因组没有已知的最大的基因组长,这一名称属于日本花巴黎粳稻;它是大约1490亿个碱基对.但是洋葱基因组的长度和特征使得测序非常困难。
“在这项研究中,我们挑战了破译由160亿个碱基对组成的DNA序列的极限,”该研究的作者、山口大学科学与技术创新研究生院教授Masayoshi Shigyo说。
当一个基因组被绘制出来时,科学家们通常可以参照该物种的基因进行研究。不同生物体的基因组片段可以与同一物种的其他部分或密切相关的部分进行比较。但是洋葱的基因组太大了,所以必须用另一种方法来组合。
Shigyo说:“在以前的工作中,我们收集了表达基因的序列信息,确定了25000个表达基因的位置,并成功地开发了世界上第一张高密度基因图谱,该图谱准确地反映了表达基因的顺序。”。
然后,研究人员从实验室种植的洋葱中提取DNA,以创建更多的基因序列数据。这些序列与用来表示洋葱染色体的遗传图谱进行了比较。这相当于洋葱植株遗传物质的一半。染色体序列被用来预测洋葱基因组中的基因数量,
Shigyo说:“这种预测方法检测到了540925种推测的可能基因。”“这一数字远高于预期,表明基因组中存在许多伪基因。”Shigyo说,假基因是一种非编码或“垃圾”DNA。
功能明确的基因均匀分布在整个基因组中。
“简而言之,由于基因组中有大量的垃圾DNA,计算机序列组装无法完成,”Shigyo说。“然而,在这些困难的情况下,我们高密度的基因图谱信息作为一个模型,我们首次成功地开始解码洋葱基因组。”
Shigyo说,这项工作可以帮助洋葱种植者创造出更好的种植方法。
Shigyo说:“人类种植洋葱的历史很悠久,可以追溯到公元前2300年的埃及,从那时起,洋葱就被认为对我们的健康和社会做出了贡献。”然而,洋葱往往被认为适合用于高中的生物实验,而不是更严肃的研究。我希望这项工作的结果能让科学界更多地关注洋葱,以及更好地了解这种作物的潜在好处。”