亚里士多德说,良好的开端是成功的一半。2003年宣布最终发布的人类基因组计划无疑是研究我们遗传指令的一个坚实开端——而且完成了远超一半的工作。研究人员绘制了近30亿碱基对的样本人类基因组的92%。它为近20年的研究奠定了基础,使得其他团队能够突出人类基因组之间的差异。这项工作此后已扩展到其他动物、植物甚至微生物。
虽然研究人员受到当时技术条件的限制,但近3000人的庞大团队成功绘制了DNA的常染色质区域,这些区域是染色体中相对富含基因且松散的部分。与异染色质区域相比,这些区域更容易绘制,并且(理论上)更有价值,而异染色质区域则超出了他们的能力范围。
直到现在。由Telomere-to-Telomere Consortium的科学家领导的一项近期基层努力,正如3月份《科学》杂志上的一篇论文报道的,成功填补了这些缺失的空白。据该联盟联合负责人Adam Phillipy和Karen Miga称,他们的结果可能与最初的人类基因组计划一样具有革命性。
攻克最棘手的目标
最近的项目确定了其样本基因组的三个主要测绘目标:着丝粒卫星序列;近期片段重复;以及五个近端着丝粒染色体(未被均匀切割成两半的染色体)的短臂。它们的序列不仅纠正了先前参考中的错误,还揭示了这些缺失的部分可能比之前想象的更为重要——它们可能在我们的基因组中,以及在理解癌症等疾病方面发挥着比预期更大的作用。Phillipy说:“我认为我们会发现,这8%的变异性比我们一直在研究的92%还要大。”
这些基因组的碎片以前之所以没有被调查,是因为它们难以测绘,而且人们认为它们不包含基因。然而,Miga说,我们现在知道这些区域“是我们人类物种中最具变异性的序列”。最新的项目产生了2000多个基因预测,其中近100个预计会编码蛋白质,不像所谓的垃圾DNA。
Telomere-to-Telomere Consortium的研究人员填补的基因组的8%由重复序列组成——要么是碱基对模式一个接一个地重复,要么是整个部分被复制和粘贴。然而,这部分仍然至关重要。Phillipy说:“作为一个领域,我们有点集体地互相欺骗,认为这8%是垃圾。”“如果你从任何基因组中删除这8%,你就无法生存。这是一个相当容易的定义,说明它正在做一些有用的事情。”
一个有趣的特征是着丝粒,它们在确保细胞正常分裂方面起着重要作用。Miga补充说,这些非基因区域的排列可以让我们洞察细胞分裂中的错误,例如癌症。
个性化医疗新时代
虽然测绘基因组额外的8%听起来更像一项清理工作而不是范式转变,但研究人员一致认为,事实远非如此。Miga说:“我们遗漏的区域是真正特殊的区域,我们以前从未能够如此深入地研究它们。”
第一个人类基因组计划被认为是革命性的,并开启了个性化医疗的新兴领域。现在,最新的迭代反映了测绘技术及其应用方式的重大变化。虽然Phillipy及其同事目前正在解决一些技术难题,但他们预计将取得重大成果。
Miga说:“将会有这样一个时刻,我们将创建一个新的遗传学和基因组学标准,届时每个基因组都需要达到这个水平。”“我们发现的新信息量将是惊人的。”














