广告

密码破译者

我们不再耐心地逐个基因地揭开生命的秘密,现在我们可以以惊人的速度阅读它们——这在很大程度上要归功于一位足智多谋、备受赞扬、备受鄙视、曾经漫无目的而如今富有的生物学家克雷格·文特。

作者:James Shreeve
Google NewsGoogle News Preferred Source

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

克雷格·文特正在掀起波澜。他正站在他的200马力舷外机的舵手位置,目光凝视着船头,一顶棒球帽紧紧地压在头上以抵挡风。舷外机沿着海岸向海恩尼斯港疾驰,身后激起愤怒的金黄色浪花。当他靠近另一艘船时,他稍微加大了油门,让那艘更大的船在他的航迹中晕眩摇晃,像一个旋转到末尾的陀螺。八月的科德角,文特如鱼得水。

广告

“有些人认为对水有一种亲和力的基因,”当他放慢速度让低沉的声音能被发动机盖过时,他说道,“也许我就是有这种基因。”

如果存在对快速行动并在过程中制造大量骚动有遗传亲和力,那么文特可能也具备这些。在不到十年的时间里,他从美国国立卫生研究院受人尊敬的默默无闻,一跃成为——仅凭纯粹的产出——也许是世界上最多产的生物学家。他的冲刺始于大胆地绕过科学界最大的定向研究项目;接着建立了自己研究所并赚取了不菲的财富;激起了科学精英的愤怒、不满和勉强的尊重;最终,为21世纪生命研究设定了节奏。

这项研究的重点是基因组——一个生物体(无论是人类还是微生物)的完整遗传密码。传统上,它被视为一个神秘的黑盒子,其内容必须一个一个地通过基因被细致地剥离出来。但在马里兰州罗克维尔的基因组研究所(文特,其负责人,大部分时间都在陆地上度过),基因组正像熟透的无花果一样被掰开,从里到外翻转,其最内在的内容展现在所有人面前,任由他们探索。文特的生物学研究既不优美也不浪漫,他的一些同事甚至会把他本人描述为一个投机主义者而非远见者。但没有人怀疑他的贡献。根据追踪研究论文被其他论文引用次数的科学信息研究所的数据,克雷格·文特是去年世界上被引用次数第二多的生物学家。如果你好奇的话,被引用次数最多的那位生物学家是他的下属。

“我们第一次能够从内到外地审视生物体,”他说,“现在是成为一名生物学家的绝佳时机。”

成为一名生物学家——或者任何特别的职业——似乎并非文特的命运。高中毕业后,他从旧金山一路漂泊到纽波特海滩,晚上工作以便白天冲浪。接着,越南战争打破了他的加州梦想。尽管最初被陆军征召,但文特被海军招募到其游泳队,并设法转服役,这似乎确保了他的制服不会比Speedo泳裤更大。然而,当文特还在新兵训练营时,林登·约翰逊总统宣布将升级战争。结果,军队运动队被解散。文特随后选择加入医疗队,因为这比海军其他部门的服役时间更短。没有人告诉他,在越南的医疗兵,无论服役时间多短,都预计无法活过他们的任务期。在圣地亚哥驻扎一段时间后,文特被派往岘港的一家医院,在那里他每天分类伤员,努力缝合撕裂的身体,同时躲避飞来的炮弹。

“等我服役期满时,”他说,“冲浪似乎不再是一个选择。”

在文特治疗的数百名伤兵中,有两个人对他的人生方向产生了持久的影响。

“第一个是一个头部中了一颗小口径子弹的年轻人,他死了。我被要求协助尸检。入口伤口非常小,就像一把点22口径的枪造成的。我取出他的大脑,发现子弹只留下了一条微小的轨迹,没有明显的损伤,尽管它肯定击中了某个关键部位。我完全震惊了,这足以杀死一个人。另一名士兵是一个刚满18岁的年轻人。他们把他送进来时,他的腹部有多处伤口。他的肠子都被炸开了。我们估计他最多只能活12个小时。但他不仅恢复了意识,还多活了几周,整个过程中都在谈论他想回家打篮球。按照任何生物医学标准,他都不应该活着。所以一个人几乎没有明显的原因就立即死亡,而另一个人在没有内脏的情况下却凭借纯粹的决心坚持了数周。我当时也只有21岁。我开始问自己一些宏大而天真的问题。生命究竟是什么?它如何运作?两个细胞可以由完全相同的组成部分构成,但一个是死的,另一个是活的。区别在哪里?我仍然无法解释为什么第一个士兵死了,或者是什么让另一个活了那么久。我仍然在问这些宏大而天真的问题。”

为了追寻这些重大问题,文特从越南回来后学习了生物化学,仅用了六年时间就在加州大学圣地亚哥分校获得了学士和博士学位。之后,他开始在纽约州立大学布法罗分校工作,在那里他与妻子兼同事克莱尔·弗雷泽一起研究人类脑细胞中作为肾上腺素受体的蛋白质。1984年,他们搬到了美国国立卫生研究院,继续研究该受体,并最终成功找到了包含其蓝图的基因。文特资金充足,发表了大量论文,地位稳固。但他却渐渐失去了对这些重大问题的关注。

广告

“克莱尔、我和一个研究团队花费了十年时间试图理解一个分子,”他说,“我觉得我没有丰富任何人对生命的理解。”

随后,文特开始阅读一项更合他心意的计划——人类基因组计划,这是一项旨在阐明智人全部遗传密码的提议。生物学家们对这个想法产生了激烈的意见分歧。支持者们吹捧了解人类生命完整基因图谱的不可估量的价值,以及治愈遗传疾病的希望。而学术界和国会的批评者则抨击该项目是一项巨大的浪费,会耗尽美国国立卫生研究院的资源,使其无法用于更有价值、更有针对性的研究。文特坚定地站在项目支持者一边。

广告

“我无法理解这场争议,”他说,“我们有成千上万的问题,却没有答案。而这是我们第一次获得这些答案的途径。”

答案隐藏在DNA螺旋梯级精确的排列顺序中,这些梯级由四种碱基——腺嘌呤和胸腺嘧啶,鸟嘌呤和胞嘧啶(或A、T、G和C)——的配对组合构成。在人类基因组计划提出时,对基因进行测序——逐个字母拼写碱基对的连接——是一个繁琐的过程。给定DNA样本中的四种碱基首先必须彼此分离,并按顺序排列在称为凝胶的实验室平板上的不同列中。研究人员随后必须同时横向和纵向查看凝胶,以获取序列线索——这项任务既容易出错又缓慢费力。生物学家们预计,整理人类基因组中所有30亿个碱基对的排列将需要几十年。许多批评者认为根本无法完成。

随着勒罗伊·胡德(Leroy Hood)实验室发明了一种自动化测序方法,成功的可能性大大增加。胡德当时在加州理工学院,现在在西雅图华盛顿大学。胡德的想法是给四种碱基分别标记上彩色荧光染料,这样一台连接电脑的激光束就可以沿着单一色谱读取它们的顺序。如果这个设备真的有效,人类基因组计划测序人类基因组的希望可能就并非遥不可及了。

文特预感到胡德的想法可能蕴藏巨大潜力,于是他自己的实验室被选定为美国国立卫生研究院新机器原型机的测试地点。文特和他的同事们使用传统方法测序肾上腺素受体基因花了一整年;而使用自动化设备,他们在短短六个月内就测序了两个相关基因。尽管这是一种有希望的加速,但在文特看来,这还不足以回答那些重大问题。然而,在一次从日本会议返回的长途飞行中,他表达了对基因组研究进展缓慢的不满,这时他有了一个想法。

广告

“我意识到,”文特说,“我的实验室拥有完成整个人类基因组计划的技术。”

只有文特那不张扬的语气才使得这句话听起来不像纯粹的傲慢。(尽管对于他的一些同事来说,无论怎么说都可能听起来像傲慢。)事实上,世界上没有一个实验室——包括文特自己的——拥有能够在合理时间内测序整个基因组的技术。但文特的说法也不是纯粹的夸大其词:他想出了一种方法,可以专注于基因组中最重要的部分。

由于缺乏足够的计算能力来完整测序基因组,文特转而依赖概念上的灵活性。1990年,这个由美国国立卫生研究院初步资助的项目开始进入第一阶段,生物学家将在此阶段确定标记物的位置——即已知碱基对序列的DNA片段。一旦这些标记物被定位,生物学家就可以缓慢地填补它们之间巨大的缺失片段。该项目的最终目标——一项耗资预计30亿美元的庞大国际合作——是在2005年之前填补标记物之间的整个序列。

文特决定尝试一种不同的方法。“我想到,我们身体里的每个细胞在DNA测序方面都比我们最快的计算机做得更好,”他解释道。一个细胞通过首先将基因逐字转录到称为信使RNA的单链分子上,来制造蛋白质。但在这一过程中,基因组的大部分序列实际上被编辑掉了。(这些被忽略的DNA——通常被误导性地称为“垃圾DNA”——可能在细胞中扮演某种角色,但具体是什么尚不清楚。)一旦形成,信使RNA会离开细胞核,寻找漂浮在细胞内部的分子工厂;在那里,它的密码被读取并用于构建蛋白质。因此,信使RNA代表了一个生物体基因组书籍的高度缩略版本,仅由特定细胞中积极制造蛋白质的基因的DNA序列组成。信使RNA本身化学性质脆弱。但借助某些酶的帮助,生物学家可以很容易地将单链RNA转化为一种耐用的双链合成分子,称为互补DNA。

广告

20世纪80年代,许多科学家意识到对互补DNA进行测序将是一项有价值的尝试。但文特却想出了如何让这种方法奏效。他知道DNA具有与具有相应碱基序列的其他DNA结合的天然特性,他意识到基因互补DNA的一小片段——文特称之为表达序列标签(Expressed Sequence Tag,简称EST)——可以作为分子诱饵,从互补DNA库中“钓出”基因的完整序列。最棒的是,EST方法可以迅速完成所有这些工作。

要理解EST方法的工作原理,可以将上面段落中的字母视为基因的DNA序列(请记住遗传字母表只有4个字母而不是26个)。EST方法的第一步是克隆大量互补DNA基因副本,并将其切割成随机片段,因此想象有人制作了该段落的数千份影印件,将其切割成短文本片段,然后递给你,挑战你找出该段落的实际阅读方式。

广告

为此,你可以取一个短序列——比如说“glomming”这个词。复制许多G-L-O-M-M-I-N-G的字母序列,然后将它们扔回未知的随机词片段池中。这些副本将与任何包含该序列部分内容的随机片段结合——例如,部分句子“property of glom”。将这两个片段结合起来,现在你就得到了较大片段“property of glomming”的正确字母序列。借助一个能够快速搜索更多匹配项的优秀计算机程序,你可以轻松地从头到尾拼凑出整个段落。

文特对这种方法寄予厚望,但其他科学家则持怀疑态度。普遍认为,任何时候只有少数基因会开启。你可以随意在互补DNA库中搜寻,但几乎总是会捕获到相同种类的“鱼”。

文特和他的同事们(包括马克·亚当斯,即当年被引用次数最多的生物学家)不理会怀疑者,继续前进。他们组建了一个由各种脑细胞产生的市售互补DNA库。当他们测序神经元库时,他们发现了一个比任何人想象的都要丰富的基因宝藏。“1991年,已知的人类基因不到2,000个,”文特说,“我们在几个月内就使这个数字翻了一番。我们几乎在任何地方都找到了新基因。”

文特相信他可以在四五年内,以仅1000万美元的成本揭示大部分基因组——这与人类基因组计划30亿美元的完整基因组(包括“垃圾DNA”)测序费用形成鲜明对比。然而,当文特试图为大规模使用EST获得资助时,他遭到了拒绝。根据当时负责该项目的NIH咨询委员会主席诺顿·辛德尔(Norton Zinder)的说法,这个决定更多是出于政治而非科学考量。“克雷格当时要求我们预算的一大笔款项,”辛德尔说,“将如此大笔预算投入给一位NIH科学家,会激怒其他在自己实验室从事该项目的遗传学家。”

遭到拒绝后,文特继续独自研究他的EST方法,几个月后,他发现自己陷入了一个更深层次的政治泥沼:基因专利争议。本世纪科学知识的探索一直由智力好奇心和金钱这两种相互交织的力量驱动。像文特这样的生物学家可能会为了热爱而花费十年时间重建一个蛋白质,但一家生物技术公司却投入数亿美元进行研究以创造一种新药,因为他们预感到这可能会带来数十亿美元的销售额。这种预感的核心是专利制度,它赋予公司对新发现的专有权利——这一制度与行业外科学家所倡导的开放精神背道而驰。随着生物学研究深入到单个基因层面,专利制度也随之而来——伴随着巨大的争议。公司是否有权掌控生命的代码本身?

多年来,政府一直试图在这两个阵营之间充当中间人。它资助了大量的生物学研究,但也希望鼓励生物技术公司进一步开展工作,创造新的药物和疗法来对抗疾病。为此,政府有时会对其自身的工作申请专利,然后将其独家授权给私营公司。1991年,当时NIH技术转让办公室主任里德·阿德勒(Reid Adler)建议文特,NIH应该对他迄今发现的基因的表达序列标签(EST)提交专利申请。阿德勒的理由是,在没有专利的情况下发布这些标签,就等同于将整个基因序列置于公共领域。毕竟,一旦你有了EST和互补DNA文库,你就可以毫不费力地获得基因序列。这将阻止制药公司花费时间利用这些序列开发商业药物,因为它们无法获得独家权利。

广告
广告

最初文特对这个想法有些犹豫。“马克和我都决定绝对不申请专利,”他回忆道,“我希望这种新方法能对科学产生最大影响,我以为专利会抑制这种影响。但里德提出了一个令人信服的论点。如果没有权利,没有任何一家制药公司会投资5亿美元来开发一种药物。将序列置于公共领域最终可能会减缓而非加速医疗进步。所以我们同意了,条件是NIH必须首先征求公众意见。”

他得到的评论比他预想的要多得多。科学界的反应从不相信到勃然大怒。科学家们认为NIH在不了解其所标记基因的完整序列,更不用说这些基因在人体中的功能的情况下,计划申请EST专利是不可容忍的。更令人恼火的是,文特的方法是基于已经存在多年的基本知识。

“文特从未发明过任何东西,”勒罗伊·胡德后来对《商业周刊》评论说,“而且EST方法也没有提供任何深刻的见解。”

文特最严厉的批评者同时也是地位最高的人——人类基因组计划主任、诺贝尔奖获得者、DNA结构共同发现者詹姆斯·沃森。在参议院关于专利问题的听证会上,他宣称专利想法“纯属荒谬”,同时还作证说文特的方法“猴子也能操作”。

“我震惊了,”文特说,“他表现得好像是第一次听说这件事。他曾是我的英雄之一,但因为我朝着与他相反的方向前进,他却利用自己的地位来人身攻击我。尽管他已经道歉了,但那件事仍然让我心痛。如今他回到了我的英雄之列。但这并不能让我停止感受到那些攻击带来的刺痛。”

第二年,沃森辞去了他在美国国立卫生研究院的职务,据报道很大程度上是因为他与当时研究院主任伯纳丁·希利(Bernadine Healy)在专利问题上的长期冲突。那时文特也已经离开了,但那时那场让他成为学术科学界弃儿的公开风波,却讽刺地为他在圈外赢得了许多仰慕者。

广告

“我接到了数百个商人的电话,都让我拿着他们的钱去开公司,”他说,“我一直说不,他们以为我是在抬价,于是他们出价更高。当时,克莱尔和我的银行里可能只有2000美元。这很诱人。但我不想把一生都用来赚钱。我知道我们所做工作的内在价值,以及它将如何改变一切。我们离开NIH的唯一原因将是建立自己的研究所,在那里我们可以掌控我们正在做的事情。”

1992年,已故的风险投资家华莱士·斯坦伯格(Wallace Steinberg)达成了一项协议,文特可以 возглавляет 一家非营利性研究所,该研究所被命名为基因组研究所(TIGR)。最初的资金是7000万美元,这对于基础研究来说是一个惊人的支持水平。作为回报,TIGR 将其任何重大发现的专有商业权利授予一家将成立并命名为人类基因组科学公司(Human Genome Sciences)的营利性企业。斯坦伯格请来了著名的哈佛大学艾滋病研究员和企业家威廉·哈塞尔廷(William Haseltine)担任HGS的负责人。文特获得了HGS 10%的股份,价值数百万。这似乎是一笔好得令人难以置信的交易。也许事实就是如此。

广告

“我将拥有我的研究所,投资者承诺他们只会对有限数量的基因申请专利,”他轻声说道。这是他声音中第一次带着一丝锋利。“后来我才知道,投资者会撒谎。”

TIGR在罗克维尔的总部由两座米色建筑组成,它们栖身于华盛顿特区20英里外一条医疗大道旁的草地上,窗户高高地藏在浅浅的宝塔屋顶下。在一个圆形庭院外,木制大门一触即开。大厅里的空气显得安静而昂贵。一位接待员在池塘大小的东方地毯的另一端等待访客,递给他们预先打印好的姓名牌,并安排他们上楼。在楼梯间里,一幅气势宏伟的挂毯用彩色羊毛表现了人类DNA序列。在楼梯顶部,就在文特玻璃幕墙的套房外,一只青铜老虎带着永恒的咆哮等待着,肌肉绷紧,爪子深深地插入厚实的地毯中。

文特办公室前厅的一面墙上挂满了他的各种奖项、奖牌和成就勋章。“克雷格做的每件事似乎都成功了,”他的助理耸耸肩说。另一面墙上,一幅1995年《商业周刊》的封面标题为“基因之王”,文特和哈塞尔廷穿着白色实验服,以标志性的DNA螺旋为背景摆姿势。但有人用一张黄色便利贴贴住了哈塞尔廷的脸。如今在TIGR,只有一位“基因之王”。

文特很快就意识到TIGR和HGS之间的关系并非他所设想的完美共生。尽管资金充足,可以自由指导研究方向,但他对研究成果的命运控制权却少得多。HGS有六个月的时间审查TIGR测序的任何基因,然后才能发表,对于HGS或其合作伙伴正在进行研究以确定其是否可用于制药的基因,审查期可延长至18个月。数据延迟的目的是让HGS比其他公司抢占先机,但学术科学家如果同意不将其用于商业用途,则可以查看数据。然而,根据文特的说法,HGS经常利用延期条款和其他策略来保护其对TIGR几乎所有产出的权利。哈塞尔廷对此提出异议,称他记不起曾援引过延期条款。无论如何,他说,学术科学家在此期间可以通过签署发布协议轻松访问数据。

广告

然而,许多习惯于自由、不受限制地获取新数据的基础研究人员,对这种似乎是将人类生命配方商业化的尝试感到愤怒。这种不满情绪再次指向了克雷格·文特。压力,特别是与哈塞尔廷的争斗,开始造成影响。1994年,文特从法国的一次商务旅行中被紧急召回,接受憩室炎的紧急手术,这是一种可能致命的结肠疾病,常与高度焦虑有关。

“那是一段压力很大的时期,”他说,“我失去了几英尺长的肠子。”

当文特坐在办公室沙发上谈论这些烦恼时,他几乎没有表现出那种紧张。他秃顶,手势不多,穿着随意,显得沉着而自在。他的办公室宽敞,点缀着航海装饰。壁炉一侧,一艘船头上的女性雕像仰望天空,祈求顺风,或者也许是清晰的数据。他办公桌旁的一个玻璃柜下,矗立着他那艘82英尺赛艇“魔法师号”(Sorcerer)(舷外机名为“学徒号”Apprentice)的精美模型,几周前他刚刚驾驶它参加了一场跨大西洋比赛。这是文特的首次尝试。自然地,他赢了。他的策略之一是寻找大浪,他可以利用游艇冲浪,达到20多节的速度。

“我的冲浪经验在科学上也很有帮助,”他说,“优秀的冲浪者会提前观察多达十个浪头。他们早在浪头到来之前就选择好了要驾驭哪一个。”

广告

到1994年,TIGR和HGS之间的联盟已经解码了在各种人体器官和组织中活跃的大约35,000个基因的序列。次年,这些数据——减去HGS希望保留其潜在商业价值的基因——发表在科学期刊《自然》的一个特刊中:8300万个核苷酸逐页拼写出来,以使人类生命成为可能的顺序排列。EST方法迅速成为世界上最广泛使用的测序技术。但文特开始焦躁不安——他不想只是机械地生产更多人类基因。幸运的是,大约在同一时间,他看到地平线上正在形成一个新的浪潮,一个拥有将基因组学推向下一个世纪力量的巨浪。

在西班牙的一次生物伦理学会议上,文特偶然遇到了约翰·霍普金斯大学的汉密尔顿·史密斯。史密斯因发现一类新的限制性酶而于1978年获得诺贝尔奖,这些酶是切割DNA链成更小片段的蛋白质“剪刀”,现在已成为重要的生物技术工具。他从一种名为流感嗜血杆菌(Haemophilus influenzae)的细菌中分离出这些酶,这是一种人类病原体(与流感病毒无关),会导致儿童耳部和呼吸道感染,偶尔还会引起脑膜炎。

广告

“像学术界的其他人一样,我对克雷格的看法相当负面,”史密斯回忆道,“但当他展示他的工作时,我看到这家伙正在以惊人的速度发现基因,把所有人都甩在了后面。”

史密斯对文特最近开发的名为TIGR Assembler的软件程序描述印象深刻,该程序可以处理数十万个DNA片段。在晚餐时,两位科学家构思了一个激进的想法。为什么不看看TIGR Assembler能否一次性重构流感嗜血杆菌的整个200万个碱基对基因组呢?征服这样的领域并不是一个新想法。一些病毒基因组已经测序,包括TIGR的天花病毒。但病毒依赖于宿主DNA才能生存,其基因组即使与细菌相比也微不足道。文特说,正在进行的细菌项目效率低下得令人难以置信,还有许多年才能完成。

文特和史密斯申请了NIH资助,在等待申请审查期间,他们用私人资金开始了工作。首先,史密斯通过复制数千份流感嗜血杆菌的DNA,并将其中的每一份切成一百多万个片段,每个片段长1000到2000个碱基对,从而构建了一个流感嗜血杆菌基因片段库。然后史密斯和文特对大约25000个片段的500个碱基对序列进行了测序,这些序列随后被输入到TIGR Assembler中,并在重叠区域进行拼接。但与只能寻找活性基因的EST方法不同,史密斯和文特现在可以组装整个基因组,将基因拼接成完整的编码。渐渐地,连接起来的片段凝结成几个大的DNA片段,称为重叠群(contigs),而重叠群之间的空隙则通过回到原始DNA库,并利用空隙两侧已知序列来“钓出”缺失的片段,从而一个接一个地弥合。

项目进行数月后,史密斯和文特收到了美国国立卫生研究院的消息。他们被拒绝了,理由是这种方法“不可能奏效”。没关系:当时这项工作已经完成了90%。仅仅几周后,即1995年5月,文特在一次令微生物学家目瞪口呆的会议上宣布,TIGR已经破译了第一个完整的活生物体基因组。两个月后,《科学》杂志上的一份精美插页让世界首次一睹活生生的裸基因组。一系列彩色小条纹横跨四页,每条代表一个独立的基因,总共有1749个。

那幅图像中蕴含着一种内敛的壮丽,即使是门外汉也能感受到。史密斯、文特和他们的同事们不仅仅是将基因及其碱基对排列成一个完整的序列。他们还针对已在其他生物体中发现的数千个基因,逐一核对了新发现的流感嗜血杆菌基因。由于这些基因的发现者通常也已弄清了这些基因的功能,文特的研究团队现在可以将相似的功能分配给在流感嗜血杆菌中发现的一半以上的基因。有些参与能量代谢,有些参与复制,还有些参与细胞内物质运输。令人惊讶的是,大量基因在其他生物体中没有类似物,但至少它们在基因组中的存在是确定的。这幅图像就像一份彩色编码的“作弊条”,解答了是什么让这种微小微生物得以运作的问题。这不是猜测或理论。如果它是一幅画,它可能会被称为《假设的终结》。

“我认为这是科学上的一个伟大时刻,”文特的前仇敌詹姆斯·沃森在《纽约时报》上说。

广告
广告

也许最令人兴奋的是,这暗示着更多这样的时刻即将到来。仅仅三个月后,由克莱尔·弗雷泽领导的TIGR团队发表了生殖支原体(Mycoplasma genitalium)的基因组,这种寄生虫栖息在包括人类在内的各种动物的生殖道中。生殖支原体只有470个基因,使其成为地球上已知最小的基因组,因此是理解生命与非生命之间区别的关键线索。到1996年中期,文特的研究团队还完成了詹氏甲烷球菌(Methanococcus jannaschii)的基因组测序,这是一种深海热液微生物,代表着古菌界,伊利诺伊大学的进化生物学家卡尔·沃斯(Carl Woese)曾假定它是与细菌和真核生物(如植物和动物)分离的第三个生命超界,而细菌和真核生物构成了地球上其他所有生命。沃斯争论了20年,认为传统上将细菌和古菌归入单一的原核生物界是一个严重的分类错误,而且由于这个缺陷存在于生命之树的最底层,因此对理解进化造成了更大的损害。詹氏甲烷球菌的基因组阐明了沃斯观点的真相:它的一些基因与真核生物共享,另一些与细菌共享,而一半以上是前所未见的。与此同时,一个由1000多名科学家组成的联盟完成了对一种酵母基因组的解读,就整体而言,这种酵母的DNA实际上与我们自身的DNA非常相似。

接着,去年初夏,TIGR在同一天发布了两份新闻稿。第一份宣布了遗传学界期待已久的消息:TIGR和HGS已同意解除合作关系。HGS解除了对TIGR剩余的3800万美元支持义务。这是为自由付出的高昂代价,但文特所获得的独立性在第二份新闻稿中得到了炫耀,那是一份简单的声明,宣布TIGR正在向互联网发布大量新的基因序列,其中包括几乎完整的幽门螺杆菌基因组,这种导致溃疡的细菌栖息在地球上一半以上人口的胃中。同时发布的这些声明的含义显而易见。TIGR可以自由地向任何它愿意的人提供数据,而且它乐意向所有人提供。这一举动极大地修复了文特在学术科学家中的声誉。

“有些人认为克雷格是一个想攫取一切的人,”马萨诸塞州伍兹霍尔海洋生物实验室的分子进化论者米奇·索金(Mitch Sogin)说,“但最终,他完成了有史以来最大规模的数据发布。他必须因解除合作关系并冒着研究所福祉的风险而受到赞扬。”

TIGR如今似乎没有什么危险。在政府研究拨款、私人募资以及与生物技术公司偶尔合作——文特称之为“承接洗衣业务”——的健康滋养下,该研究所的发现速度只增不减。去年夏天以来,除了正在进行的人类基因组计划工作之外,其研究人员还完成了幽门螺杆菌基因组的测序,并完成了另外两个微生物基因组:导致莱姆病的伯氏疏螺旋体(Borrelia burgdorferi),以及已知通过使油井酸化造成工业破坏的硫代谢古菌——深海硫化嗜热球菌(Archaeoglobus fulgidus)。

这项知识的潜在价值巨大。首先,定位和识别基因的繁琐工作很快将成为过去。生物学家将能够立即跳到更宏大的问题上,即特定基因如何运作以及与其他基因如何相互作用。了解一个生物体全部的遗传指令也揭示了它在某种代谢过程中投入了多少。了解疟疾、梅毒、霍乱和结核病等病原体的基因组——所有这些基因组都由TIGR进行测序——的优势同样巨大。传染性微生物依赖于它们进化出的诡计来逃避宿主的天然抗体并抵抗人造抗生素。测序它们的基因组就像窃取它们的攻击计划。

“坏细菌”并不是基因组科学的唯一目标。地球上绝大多数微生物要么无害,要么至关重要,它们加速生态系统中营养物质的循环,帮助动物消化,并提供许多其他活动,以维持生物圈的健康。完整的基因组也将揭示这些“好细菌”的秘密,然后可以对其进行操纵,以执行诸如制造新型肥料和清理环境污染等任务。放射迪诺球菌(Deinococcus radiodurans)是另一种最近由TIGR科学家测序的微生物,它具有惊人的能力,可以承受150万拉德的辐射——这是杀死人类所需辐射量的3000倍。

广告

“这东西能承受的辐射比绿巨人还要多,”TIGR的欧文·怀特(Owen White)说,他领导了放射迪诺球菌项目,“一剂辐射会把基因组炸成碎片,但几个小时后它就会像原来一样自行拼接回来。将负责这种基因修复的基因插入到另一种天然吞噬重金属的细菌基因组中,这种微生物就可以清理核废料场。”

全基因组带来的潜在回报,例如生物修复和药物开发,很可能使TIGR自身保持良好的财务状况。但对于包括文特本人在内的许多科学家来说,这种新型生物学最诱人的前景是它为进化研究,特别是生命之树最早的分支,带来了复兴的力量。传统的谱系是通过比较生物体的解剖结构和化石来构建的,这些都充满了进化的模糊性。对于那些对生命早期进化感兴趣的人来说,这个问题变得更加严峻,因为当时除了细菌和古菌之外别无他物——这些生物的可见解剖结构很少,不足以帮助生物学家区分它们。另一方面,通过比较生物体的蛋白质或基因,研究人员可以构建分子树。但这些可能具有欺骗性,因为远缘微生物有时会交换DNA。相比之下,完整的基因组提供了数百万个碱基对,它们以一种遗传构成排列,这种构成不仅反映了一个物种的本质,而且体现了它。

广告

“几年之内,我们将拥有50到100个基因组,”文特说,“你可以把每一个基因组都看作是一部古代文献的发现。一旦我们拥有足够多的这些文献,我们就能破译生命的史诗。”

然而,仅仅增加文本数量,甚至还不足以开始理解其中蕴含的智慧。仅TIGR已完成的六个基因组就包含数千个基因,由超过900万个独立的碱基对组成。五年内还将有数百万个基因组可供研究。但如此大量的原始数据意味着什么?许多未知基因的功能是什么?基因如何相互作用以及与环境相互作用,从而使生命得以存在?从某种意义上说,文特对生命进行全球性理解的希望现在似乎比以往任何时候都更加难以捉摸。

“当我们第一次组装基因组时,奇怪的是我只感到难以置信的挫败感和不足,”文特承认,“我希望能从观察这个东西中获得即时的启示。但我们还无法理解它告诉我们的更高层次的东西。至少现在还不行。”

尽管如此,拥有太多关于生命分子核心的数据总比不够好。欧文·怀特提供了一个很好的比喻:把测序的基因组想象成一座无人居住的豪宅,宏伟但尚未装修。在TIGR,研究人员已经开始搬进一些家具。在一个房间里,物理学家约翰·夸肯布什正在使用所谓的基因芯片,拍摄基因组在响应环境变化时被激活的特定基因的快照。走廊的尽头,克莱德·哈奇森正在拆解生殖支原体的微小基因组,逐个敲除其天然的470个基因。他的首要目标是确定维持生命所需的最小基因组。最终,这种基本结构可以被人工染色体取代,创造出人工生物体——文特称之为“从头开始的生命”。这些微生物弗兰肯斯坦可以被植入特定的基因,用于清理漏油或对抗感染,然后投入工作。

广告

在其他地方,其他TIGR研究人员俯身于屏幕前,挖掘植物基因组,梳理病原体狡猾计划中的零散线索,或者将每日新发现的人类基因序列上传到互联网。在明亮的房间里,玻璃箱中的机器人一丝不苟地将准备物吐入等待的托盘中。一排排测序机用红色、蓝色、黄色和绿色刻画着它们的文本。在TIGR网站的标志上,一只咆哮的老虎将它巨大的四肢环绕在一块彩色的双螺旋结构上。这只猫的姿态模棱两可:它可能是在与更强大的对手嬉戏摔跤,也可能正要将牙齿刺入猎物的脖子。

“生命的秘密都写在基因组里了,”文特说,“我们只需要学会如何解读它。”

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章