自人类基因组计划完成以来的12年里,生物学家已经将一千多个基因组区域与疾病联系起来。“但在大多数情况下,我们并不真正知道它们是如何起作用的,”麻省理工学院的计算生物学家马诺利斯·凯利斯说。
表观基因组登场了。如果说人类基因组是生命之书,那么表观基因组就是一系列书签和高亮标记,告诉细胞要阅读书中的哪些段落。这些标记包括DNA上的化学标签,使基因不可读;以及帮助暴露细胞核内DNA的蛋白质上的化学标签,使基因可读。它们是肝脏、心脏或大脑细胞差异巨大的原因。国家卫生研究院路线图表观基因组学联盟(包括凯利斯)于二月份发布了最全面的人类表观基因组图谱。
凯利斯领导了数据分析团队,该团队应用机器学习算法来解码表观基因组的语言。这张图谱提供了关于一个受精卵如何发育成人体多样性组织以及健康组织如何致病的重要线索。例如,联盟中的一个团队报告了转移性癌细胞如何包含一个表观遗传指纹,揭示了它们来自哪个组织,这可能有助于更好地靶向癌症治疗。另一个团队报告称发现了可能引发自身免疫性疾病的DNA序列。

模型显示化学标签围绕着DNA链(粉红色),这些标签可以使基因沉默。(图片来源:Laguna Design/Science Source)
Laguna Design/Science Source
破解突变的疾病代码
数千种突变与疾病相关,但只有少数突变是通过直接破坏蛋白质(细胞的“主力军”)而导致疾病的。科学家们已经弄清了其他几种突变是如何引发疾病的。
利用来自尸体的大量组织样本,基因型-组织表达项目(GTEx)的研究人员从每个样本中分离并测序了DNA和各种编码蛋白质的RNA。事实证明,许多与疾病相关的突变位于不编码蛋白质本身的DNA片段中,而是调节基因组中其他地方的基因,进而破坏组织功能。
基因构成也会影响基因在人体组织中开启或关闭的程度,从而导致疾病,布罗德研究所生物学家克里斯汀·阿德利(Kristin Ardlie)说,她是五月份发表的分析报告的共同领导者。















