广告

细菌全说,人类说很多

基因组测序彻底改变了我们对遗传学的理解,为人类生物学未来的突破铺平了道路。

Google NewsGoogle News Preferred Source

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

对一个生物体进行基因组测序的原理——逐字逐句地解码其所有基因中所包含的信息——是,这将告诉我们很多关于该生物体如何运作的信息。我们将了解其每种蛋白质的基本结构:新陈代谢中的每种酶,在体内流淌的每种信号激素,以及细胞表面准备接收这些信号的每种受体。我们将拥有该生物体——或者至少我们会拥有其使用手册。遗传学家们几十年来一直梦想着这样的知识,并且大约七年来一直将其视为一种真正的可能性。去年,他们第一次获得了这种知识,尽管仅限于一种细菌。并且他们在获得对一个更有趣的生物体——智人——的基因组序列方面取得了巨大进展。

广告

这两项里程碑式的工作都由一家名为马里兰基因组研究所(Institute for Genomic Research)的初创公司完成。该研究所的所长克雷格·文特(Craig Venter)几年前离开了美国国立卫生研究院(National Institutes of Health),因为研究院不资助他新颖的基因组测序方法;审稿人认为这种方法过于激进,不太可能成功。但文特最终获得了胜利。七月份,他和他的团队宣布,他们已经测序完成了构成流感嗜血杆菌(Haemophilus influenzae)——一种在其野生形式下会导致耳部感染和脑膜炎的细菌——的单环染色体的所有180万个碱基对(DNA双螺旋的“横档”,也是遗传字母)。仅仅两个月后,文特及其合作者向《自然》(Nature)杂志发表的一份长达379页的人类基因组图谱贡献了近3万个人类基因的部分序列。

图谱的另一部分是由巴黎人类多态性研究中心(Center for the Study of Human Polymorphism)的一组研究人员创建的基因组物理图谱。该图谱试图将大部分未测序的DNA(占我们基因组的四分之三)的较大片段安排到23对人类染色体上的正确位置。直到现在,人们一直认为在测序基因组之前,你总是需要这样的图谱,这样你才能知道当你找到基因序列时,应该将它们放在哪里。

但是文特对流感嗜血杆菌基因组的处理方法——他称之为“全基因组鸟枪法测序”(whole genome shotgun sequencing)——是完全放弃测序过程。他说,我们取了流感嗜血杆菌整个染色体数百万份副本,然后用声波将其打碎成微小的碎片。我们没有试图对它们进行测序,而是直接对它们进行了测序。

将碎片拼接起来是棘手的部分。但是文特和他的同事们知道,细菌染色体的许多副本不会完全以相同的方式被打碎。这保证了不同副本的片段会有重叠的末端。理论上,一旦所有片段都测序完毕,研究人员就可以像从一系列重叠的画面中拼凑一张全景照片一样,将整个染色体拼接起来。不需要物理图谱。

问题是碎片数量庞大。文特说,对于流感嗜血杆菌,我们有大约26,000个碎片,每个碎片长500个碱基对。你可以想象,比较一个500个字母长的序列的确切顺序与数十万个其他序列的确切顺序,直到找到正确的匹配,然后不断重复这个过程直到所有序列都比较完毕,这不是一项轻而易举的任务。解决方案是文特研究所设计的一种巧妙的软件,通过筛选碎片并仅比较最可能的匹配项,大大减少了计算机时间。文特说,有了这种新方法,我们花了一年时间完成了流感嗜血杆菌的研究,这仅仅是因为我们还在摸索所有的方法。十月份,他的团队发表了第二种细菌——生殖支原体(Mycoplasma genitalium)——的完整基因组,并且到年底他们希望能完成第三种。

当然,人类基因组是完全不同的另一回事:它有30亿个碱基对,而不是几百万个,太大,无法一次性用文特的鸟枪法技术进行测序。幸运的是,其中只有大约3%是实际翻译成蛋白质的遗传信息;其余的是调控序列、旧的、不工作的基因,或者完全是无意义的序列。当细胞需要特定的蛋白质时,它首先将相应的基因转录成一个经过严格编辑的纯信息分子,称为信使RNA(messenger RNA)。文特的团队利用了这一自然过程。他们没有轰炸整个染色体,而是从37个不同的人体器官和组织中提取了mRNA,将其逆转录回DNA,然后对其进行了测序。

然而,实验室的复制过程并不完美——它倾向于在一条代表一个完整基因的mRNA链被完全复制成DNA之前就中止。所以文特的团队大部分得到了基因的碎片,然后使用他们先进的软件尽力将这些碎片组装起来。最后,他们能够组装至少部分地获得了29,599个基因。(据估计,我们总共有大约80,000个基因。)此外,由于他们知道这些基因来自哪些细胞以及哪种基因序列会产生哪种蛋白质,他们能够得出一些关于这些基因的作用的结论。文特估计,其中约16%的基因在我们的新陈代谢中起作用,12%用于细胞间的通讯,4%用于帮助我们和我们的细胞繁殖。他怀疑,多达三分之一的基因最终只在大脑中活跃;他已经发现了其中的3,000个。

文特说,基因组测序的魅力在于,有一天我们不仅能更好地理解某种特定生物体如何运作,而且通过比较它们的基因组,还能理解一个物种如何进化成另一个物种。然而,文特和他的团队也将从他们的研究中获益丰厚。马里兰州罗克维尔市的基因组科学公司(Human Genome Sciences)——一家与文特研究所有关联的生物技术公司——的科学家们已经开始研制一种更有效的流感嗜血杆菌疫苗。(现有的疫苗只对一种特定的脑膜炎菌株有效。)该公司已经申请了对文特团队发现的一百多个基因的专利。如果文特保持他在1995年设定的速度,未来将会有更多的专利。

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章