新兴技术

插画：John Hersey

1988年，日本化学公司昭和电工推出了一种新版L-色氨酸。L-色氨酸是一种必需氨基酸，在美国作为非处方药出售，用于缓解失眠、经前期综合征和抑郁症。为提高产量，昭和电工改变了生产工艺，并开始使用基因工程细菌来生产该产品。近两年后，美国食品药品监督管理局才确定，这些改变添加了微量毒素，这种毒素会引起一系列肌肉和神经系统问题，统称为嗜酸性粒细胞增多-肌痛综合征。当FDA将有毒的L-色氨酸下架时，已有30多人因摄入该产品死亡，1500多人永久残疾。

尽管死亡的主要责任在于昭和电工的技术，但有毒药物之所以长时间流通，是因为FDA未能发现一个显而易见的模式。当一种极其罕见的疾病爆发，所有患者都摄入了特定公司生产的特定药丸时，公共卫生专家应该能立刻察觉到其中的联系。但花了几个月时间才建立起这种联系，因为相关信息过于分散，难以检测到这种模式。

在医疗保健方面，模式识别可能关乎生死。这就是为什么梅奥诊所和IBM最近宣布了一项雄心勃勃的多年合作计划，将IBM的计算能力应用于梅奥诊所庞大的患者数据库，创建一个名为“梅奥临床生命科学系统”的综合电子病历。

关于医生和医院近期争相数字化患者记录是否有利，意见分歧很大。支持者认为，与塞在牛皮纸文件夹里的手写患者记录相比，数字文件 far more reliable—not to mention more legible（更可靠——而且更清晰）。反对者则担心，当医疗数据库存储在互联网上时，隐私如何得到维护。有一点很清楚：患者护理将永远不同。未来几年，互联的健康记录数据库可能会彻底改变医生与患者的互动方式，以及研究人员研究疾病和寻求治愈方法的方式。

梅奥-IBM的合作与其说是关于数字化记录，不如说是关于建立新的方法来全面了解数千甚至数百万条记录。近十年来，梅奥诊所的患者记录一直以数字形式存储；该诊所目前已有超过440万份记录。“在任何时候，我都可以纵向查看一名患者的所有信息，这样我就可以看到他们的手术报告、实验室结果、X光片，”诊所信息技术委员会主席、医生Nina Schwenk说。“但梅奥诊所的优势之一在于我们进行跨患者研究，研究患有某种疾病的人对特定治疗的反应。而我们记录中数据的结构使得这种横向分析并不容易。我们可以做到，但这更加费力，而且耗时。”

横向分析是在海量数据库中寻找统计上相关的模式。例如，假设一名研究人员想查看同时患有糖尿病和白血病的患者，他们正在接受泼尼松龙治疗，以确定继发性癌症的风险。15年前，这样的研究“需要访问我们的登记数据库，找到符合该特征的患者的诊断信息，从我们的存储设施中提取数百份病历，让数据分析师审查所有病历，确保我们获得所需的一切，然后最终确定一份供医生审查的名单，以了解患者的预后，”Schwenk说。“这可能需要几个月，甚至一年。用我们目前的计算机系统，可能需要几个月，但时间更短——也许两到三个月。有了IBM数据库，我们可以在几秒钟或几分钟内完成。”

这种加速仅仅是处理时间的数量上的转变，但在实践中却带来了研究的质量上的改变。如果需要一年的细致的档案整理和分析才能获得结果，研究人员就必须确信他们的查询是有价值的。但如果查询生命科学数据库就像使用谷歌一样容易，那么无数的可能性就将随之而来：研究人员可以追随直觉，或者输入“通配符”。数据库将成为他们即时实验的对象，而“白费力气”的代价几乎为零。“这将产生新知识，”Schwenk说，“而不是用于验证我们已经寻找的东西。”

此次合作不仅仅是跨患者记录的横向搜索；它还包括将下一代基因和蛋白质检测整合到梅奥诊所的数据库中。梅奥诊所寻求帮助是因为基因组信息的复杂程度远超传统患者记录中包含的标准项目。“很多数据需要解读，”Schwenk解释说。“每次检测都会产生数千个信息点——这些信息需要被分析和理解。不像‘你的血糖水平是92或105’。”

IBM按需业务副总裁John Lutz表示，解读基因检测所涉及的计算问题，其难度比扫描440万份传统记录数据库要大几个数量级。“这些新检测中的一些信息量，比你出生以来所有创建的财务记录的总和还要多。”想象一下40年的信用报告、银行对账单和抵押贷款文件的堆积，这大约是一份检测所包含的信息量。现在想象一下审查其中一百万份这样的检测，寻找有趣的关联。梅奥诊所和IBM合作的其他领域还包括蛋白质建模，这将利用IBM的Blue Gene超级计算机，这是目前地球上最快的机器。

能够访问全面的基因数据库，为研究和治疗开辟了新途径。那个研究白血病和糖尿病患者继发性癌症的研究人员，可以指示生命科学系统分析该亚组患者可用的基因检测，并搜索任何不寻常的基因序列。基因数据和按需信息的结合，有望消除治疗和预后中的大量猜测。

“当我看到一个高血压患者时，我可以从20到30种药物中选择，”Schwenk说。“有一些文献会说，‘如果你是糖尿病患者，这种药物比另一种更好。’但大多数时候，唯一确定的方法就是让患者开始服用该药物。这几乎是试错法，来了解它对个体患者的效果如何以及是否有副作用。在不久的将来，我们将知道导致人们代谢药物方式不同的各种基因差异。所以我知道，如果你尝试药物X，它对你不会起作用，而药物Y的效果会增强，而药物Z会有副作用。我们将能够提前知道所有这些。”

缺点是，个人病史的详细信息可能会暴露在窥探者眼中。如果你将一个人的医疗保健信息从一个存储在文件柜里的手写文件堆，转换为存储在线数据库中的一串零和一，那么更多的人可以访问这些信息，包括未来的雇主和保险公司。Schwenk说，研究人员和医生需要特殊的授权才能访问梅奥诊所的数据库，并且在横向查询时会非常小心地保护特定患者的身份。但是，没有任何数据库是完全安全的，滥用事件很可能会出现。

社会面临的问题是，隐私受到侵犯的风险是否值得挽救生命的收益。许多死于有毒L-色氨酸的人，如果他们完整的用药史被存储在IBM和

梅奥诊所正在构建的系统中，今天可能还活着。也有可能，健康保险公司或潜在雇主可能以不当方式访问了这些数据。但我怀疑，我们大多数人会乐意用我们私生活的一小部分来换取更长的预期寿命。