广告

你不会错过那 8,000 个基因吧?

探索人类基因组项目及其揭示的未知基因和至今仍令科学家困惑的复杂基因功能。

作者:Carl Zimmer
Google NewsGoogle News Preferred Source

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

广告

科学是通过流动前进的。一个实验引出另一个实验。观察结果不断累积。看似弯路甚至死胡同的探索,也可能使模糊的图景更加清晰。然而,科学的进步常常给人一种“一次一个重磅炸弹”的感觉,以科学论文和新闻发布会为标志。我找不到比 2000 年克林顿总统在白宫草坪上宣布人类基因组初稿完成的那一天,更能体现“重磅炸弹的幻觉”与科学“流动现实”之间巨大反差的例子了。他宣布这是一项“科学和理性的划时代胜利”。然而,正如詹姆斯·什里夫在他的书 《基因组战争》中所描述的那样,这次宣布并非标志着一个明确的里程碑,而更多地是两个相互竞争的基因组测序团队之间的最后妥协。新闻发布会后,每个人都回去完善那些初稿,而事实证明,这些初稿确实非常粗糙。事实上,在许多人可能已经认为它们已经完成多年之后,他们仍在进行润色。2001 年,当克雷格·文特及其同事发表了他们的人类基因组 粗稿时,他们识别出了 26,588 个基因。然后,他们按功能对这些基因进行了分类。有些基因参与构建 DNA,有些负责传递信号,等等。然而,令人惊讶的是,他们将 12809 个基因——近一半——归类为“分子功能未知”。上周,我想知道这些数字是否仍然成立。我一直在写一本关于 大肠杆菌的书,我想通过对比科学家对这种微生物的了解程度和我们对自身(在此案例中是生物学上)的了解程度来提出我的论点。我需要一些数字来支持我的观点。但这些数字并不容易找到。2003 年,一些报道称基因组已缩减 至 21,000 个基因。但我过去四年里找不到太多相关消息。我想知道,我需要等待什么样的“人为里程碑”,才能获得一些新的数据。幸运的是,现在已经有一些“里程碑模式”科学的竞争者出现了。有一些网站可以让你观察进行中的工作,比如人类基因组。其中一个网站叫做 PANTHER。我联系了该网站的首席科学家 保罗·D·托马斯,并向他提出了我的问题,他给我发了 一个链接。当我点击链接时,我看到了我在这里发布的饼图(如果不易阅读,请点击图片进入原页面)。这个饼图显示,我们现在只剩下 18,308 个基因。这比六年前少了 8000 多个基因。许多曾经看起来是完整的基因,能够产生蛋白质,现在已不再符合标准。一些基因被发现是假基因——曾经起作用但后来因突变而损坏的基因残余。在其他情况下,看起来是不同基因一部分的 DNA 片段,实际上却是同一个基因的一部分。如今,科学家仍然不知道人类基因组中 5898 个基因的功能。换句话说,在过去的六年里,大约有 7000 个基因要么被弄清楚了,要么就消失得无影无踪了。这是一种进步。但未知基因仍然占据人类基因组的很大一部分,因为基因的总数也减少了。上面饼图中的蓝色部分占我们所有已知基因的 32.2%。尽管在基因组研究上付出了巨大的努力,尽管有那么多盛大的宣布,我们仍然对大约三分之一的基因是做什么的毫无头绪。事实上,我们甚至对“已知”基因了解也不多。许多分配给人类基因的功能实际上是来自于对其他物种的研究。我们与老鼠、果蝇和其他被科学家仔细研究过的生物有着共同的进化历史。我们都 descended from a common ancestor,但当我们的谱系分化时,那些祖先基因发生了复制和分化。有些消失了,有些承担了新的角色。现在可以将许多物种的基因进行家族分组。在这些家族中,科学家可以将基因分为亚家族。来自同一亚家族的基因往往会做同样的事情,即使它们存在于不同的物种中。因此,PANTHER 将人类基因的功能分配给通过对其他生物进行的仔细实验而确定的、来自同一亚家族的基因。这是一个好的策略,但事实是,很少有人类基因在人类中有实验证据证明其功能。在一项对 35329 种蛋白质的研究中,科学家估计只有 2784 种符合这个黄金标准。这个 35,329 的数字可能令人困惑,因为我们只有 18,308 个基因。一个单一的人类基因可以制造不止一种蛋白质。人类基因是由碎片组成的,被非编码的 DNA 块隔开,这些片段可以以不同的组合方式进行剪接。科学家将发现更多的剪接变体。每次剪接都可能与同一个基因产生的其他蛋白质具有显著不同的功能。这个饼图没有捕捉到我们知识(或无知)的这个维度。然后还有所有不编码蛋白质的 DNA(总共占基因组的 98.5%)。其中大部分很可能是损坏的基因和病毒 DNA 的混合物。有可能从老鼠基因组中移除大量这些 DNA 而没有明显的负面影响。但在这个荒野中也隐藏着许多重要的参与者——蛋白质可以用来开启和关闭基因的开关,不产生蛋白质而是产生 RNA 分子的序列,这些 RNA 分子会为细胞创造自己的控制系统。在所有这些复杂性中,科学家们可能会找到“为什么大致相同数量的基因能编码如此不同种类的动物”这个问题的答案。复杂性不仅仅取决于你拥有多少基因。也取决于你如何使用它们。了解人类基因组的最新情况本身很有趣,但我获取它的方式也很有趣。我无需遵循传统的程序,等待高度保密的文件最终出版并被报道。人类基因组的最新统计数据现在已经公开,任何人只要愿意都可以查看。但要获取这些信息,你需要相当多的洞察力。如果没有托马斯的帮助,我将无法创建这个饼图。也许一些科学作家将变得更像调查性政治记者,他们知道如何从联邦选举数据库中筛选出真实新闻。如果这能让我们摆脱“重磅炸弹的幻觉”,那将是一件好事。

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章