广告

新的基因组数据库有望带来重大突破

这些项目有望为人类基因多样性提供前所未有的见解,并改善疾病治疗。

Google NewsGoogle News Preferred Source
新的基因组数据库能够让科学家以前所未有的方式比较 DNA,从而揭示人类疾病的根源。图片来源:Kellie Jaeger/Discover

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

2023 年,基因组学领域迎来了许多关键的进展。三个大型数据库——一个关于人类,一个更广泛地关于哺乳动物,还有一个关于灵长类动物(见第 54 页侧边栏)——有望为生命密码(尤其是与我们人类相关的部分)带来全新的发现。一个独一无二的古代 DNA 存储库也可能带来我们祖先的类似见解,这是一个值得注意的里程碑。

广告

什么是基因组数据库?

这些庞大的基因组存储库将为科学家提供新的工具,用于比较人类之间、人类与动物之间,以及我们与我们祖先近亲之间的 DNA。虽然基因组测序已经存在了几十年,但基因组学的大部分价值在于比较不同的基因组,以了解它们的差异以及这些差异为何重要。过去在比较基因组学方面的工作已经揭示了自闭症等疾病的潜在遗传原因,甚至发现了全新的人类谱系。这些发现可能只是一个开始。

通过将数十个基因组集中在一起,新的数据库开启了以前无法提出的关键问题——从“人类基因多样性到底是什么样的?”到“人类和西伯利亚哈士奇有多大的不同?”

总而言之,这些项目表明,尽管基因组学领域已经存在了几十年,但它仍然非常年轻。“那里有大片未被探索的原始森林,我们还没有去过,”加州大学圣克鲁斯分校基因组学研究所的遗传学家兼副所长 Benedict Paten 说。

图中是 1925 年的雪橇犬巴尔托和它的驾手 Gunnar Kaasen。巴尔托是 Zoonomia 项目中对 240 种哺乳动物的 DNA 进行测序和比较的动物之一。(图片来源:Bettmann 收藏,通过 Getty Images)

Bettmann 收藏,通过 Getty Images

构建数据库

第一个项目于 5 月发表在《自然》杂志上,介绍了人类泛基因组。它由数十个高度精确测序的人类基因组组成——汇集在一个数据库中——这将为未来所有人类基因组学工作提供信息。值得注意的是,它更新了科学家目前仍用作指导的参考基因组,该参考基因组基于 2003 年首次完成全基因组测序的人类基因组。

先前参考基因组有一个很大的缺陷:它主要来自一个人,这意味着它无法捕捉人类基因多样性的全部范围。“基因变异是我们基因上独一无二的定义,”新数据库的组建者之一、人类泛基因组参考联盟(HPRC)的成员 Paten 说。

尽管数百万人的基因组已被读取,但很少有人经过足够详细的测序,能够作为全面的科学参考。HPRC 的研究人员通过从五大洲的 47 人中获取完整测序的基因组,然后将它们并排放置进行审查和比较,改变了这种情况。Paten 说,最终结果就像一张地图——为长期以来未被注意到的关键变异添加了坐标。

Paten 说,新泛基因组将允许研究人员发现和研究世界各地人类的基因变异,可能有助于阐明 1 型糖尿病和多发性硬化症等疾病的根源。这仅仅是起点:HPRC 的目标是最终测序并添加数百,甚至数千个人类基因组,以扩大所包含的基因变异范围。这项工作还可以帮助回答许多目前仍困扰研究人员的关于我们基因的基本问题。

“我们在 DNA 测序方面做得越来越好,但我们仍然很难准确地说出哪些变化 realmente 重要……以及哪些只是随机噪音,”麻省大学医学院以及麻省理工学院和哈佛大学博德研究所的遗传学家 Elinor Karlsson 说。

来自世界各地的科学家创建了一个新的“泛基因组”,它填补了先前人类参考基因组中缺失的测序空白,捕获了比以往任何时候都多的基因多样性。(图片来源:Darryl Leja/NHGRI)

Darryl Leja/NHGRI

我们如何利用哺乳动物的 DNA?

要弄清楚这一点,科学家需要更多的基因组——不仅仅是人类的。这就是 Karlsson 帮助领导的 Zoonomia 项目的用武之地。该项目的科学家比较了 240 种现存哺乳动物的 DNA 序列,包括马、人、地松鼠,甚至还有雪橇犬巴尔托(1925 年在阿拉斯加运送救命药物而闻名)。然后,使用 Paten 和他的团队率先开发的比对方法,他们将某些区域进行了比较。

广告

与人类泛基因组一样,将所有这些基因组并排放置可以提供启发。Karlsson 说,一个优先事项是确定基因组中哪些区域容易发生进化变化,哪些不容易,以及哪些基因组区域对生存至关重要以至于很少发生进化变化。

为此,Zoonomia 项目于 4 月在《科学》杂志上发表了其最全面的研究论文集,研究人员正在针对在许多或所有哺乳动物中看起来相同的基因组区域进行研究。这有力地表明,基因组的这些区域编码的性状,如果发生改变,可能会导致严重的副作用。

广告

这些进化保守的区域可以帮助研究遗传疾病的科学家找到关键的突变。这是因为,确定基因组中一个通常不会改变的区域发生了改变,很有可能与疾病有关。

突出物种差异

参与该项目的科学家还在探索其他关于物种之间差异的基本问题。例如,该项目突出了人类基因组中控制 DNA 在细胞中如何折叠的基因中存在的独特变异,这会影响基因表达。Karlsson 说,这些变化可能解释了为什么人类大脑比我们亲近的黑猩猩亲戚要大得多。

2023 年的基因组学热潮也涵盖了我们的祖先。今年,世界上最大的古代人类 DNA 数据库 Allen Ancient DNA Resource (AADR) 中的基因组数量突破了 10,000 个。该数据库不仅包括现代人的基因组,还包括我们进化上的近亲,如尼安德特人和丹尼索瓦人。

AADR 是哈佛大学古代 DNA 研究者 David Reich 和他的实验室的创意,其中包括从几百年前到超过十万年前的基因组。他说,随着该资源的数量达到五位数,它为考古学和人类学开辟了新的可能性。

广告

拥有数千个古代基因组,科学家们可以超越仅询问一到几个个体的问题,而是研究整个墓地——甚至整个种群——来了解这些早期人类之间的差异。例如,最近在古代基因组学方面的研究揭示了数千年前横跨欧亚大陆的大规模人口变迁,新的古代人类群体迁入,描绘了一个比科学家们以前想象的更复杂的我们进化历史的图景。

Reich 估计,仍有数万个古代基因组等待正式发布,这意味着 AADR 将像人类泛基因组和 Zoonomia 项目一样,在未来几年内继续增长。大规模基因组学才刚刚开始。


本文最初发表于我们 2024 年 1 月/2 月刊。点击此处订阅以阅读更多此类故事。

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章