对像我这样的人来说,现在应该是最好的时代。我是一名专业的风险评估员——美国职业安全与健康管理局(OSHA)健康标准主管——而风险评估员如今备受需求。其中一个原因是,我们所面临的健康和环境危害的性质已经改变。当河流像1969年克利夫兰的凯霍加河那样起火燃烧,或者当烟雾严重到让人流泪时,我们不需要 elaborate 的风险评估来告诉我们必须采取行动。新一代的环境威胁则不同:它们往往同样严重,但更难测量,也更难消除。当有毒化学品在一个开放的场地上泄漏数十年,并且一个居民区围绕着这个场地发展起来,而其中一些化学品似乎正在进入用于饮用的地下水时,这个场地是否应该清理?如果应该,清理到什么程度?当工厂的空气中含有潜在的致癌物质时,业主是否应该被迫进行改造,可能代价高昂?定量风险评估(QRA)试图为政策制定者提供所需的信息,以理性地回答这些问题。它试图确定有多少人可能因特定危害而生病或死亡,以及挽救其中至少一些人需要花费多少钱。
QRA是一门年轻的学科。我从事这项工作已有15年,这几乎是它的开端。早些年,我们风险评估员受到了政治光谱左翼的许多批评。长期以来,将拯救人类生命的价值量化并与法规成本进行比较的观念,对许多公共利益倡导者来说是禁忌。近年来,这种情况有所改变;环保团体已经开始意识到,设定这些价值并非不道德(尽管设定得过低可能是不道德的)。
但最近最引人注目的发展是QRA获得了右翼的青睐——实际上更像是一种熊抱。监管改革是共和党“与美国有约”的关键条款之一,众议院去年通过并正在参议院审议的立法将要求以前所未有的规模进行风险评估。实际上,每项新的健康和环境法规都必须基于QRA,证明该法规的益处(它降低的风险)证明了其成本的合理性。我当然赞成创造更多对风险评估员的需求,前提是国会也提供资源来资助他们的工作。
那么,为什么我认为现在实际上是风险评估师最糟糕的时代呢?首先,国会实际上正在试图削减进行QRA的机构的预算——例如OSHA和环境保护局(EPA)。但更重要的是,国会、学术界和媒体中的许多人所接受的QRA版本,是对该领域许多既有成果的否定。这项改革是建立在一个神话之上的——即,当前评估方法通常会夸大风险,给社会带来巨大成本的神话。在我看来,风险评估正面临被颠覆的危险,而它正作为一门科学学科崭露头角。有时我觉得自己就像一个化学家,以为自己的领域终于要腾飞了,却发现政府正准备将炼金术定为官方国策。
风险评估严重保守的观点首次出现在十年前的学术文章中,标题诸如《审慎的危险:保守的风险估算如何扭曲监管》。此后,许多有影响力的公众人物都采纳了这一观点。斯蒂芬·布雷耶(现为最高法院大法官)在他1993年的著作《打破恶性循环》中指出,公众非理性地渴望担忧最坏的情况,而风险评估师则助长了这种恐惧。他得出结论,许多政府认为需要监管的巨大风险实际上微不足道。例如,在一个段落中,布雷耶讲述了一个新罕布什尔州公司的故事,该公司因EPA的行动被勒令额外支付900万美元清理一个垃圾场,以便孩子们每年可以在那里安全地吃土245天——尽管该垃圾场是一个沼泽。
国会中的许多人显然相信这些轶事既准确又具有代表性。在为他与参议员鲍勃·多尔共同发起的监管改革法案发言时,参议员 J. 本内特·约翰斯顿(路易斯安那州民主党人)声称,联邦机构今天……没有使用良好的科学,他们的法规是一场灾难。多尔-约翰斯顿法案,就像众议院早些时候通过的法案一样,将通过告诉风险评估人员如何评估风险来解决这个所谓的“问题”。我们现在使用的据称保守的程序将被旨在得出“最佳估算”的程序取代。这些法案没有精确定义这个诱人的乐观术语,但据我所知,“最佳”意味着“平均”:它意味着监管机构应该关注普通人面临的风险。并且,当不同的科学理论导致不同的评估时,我们应该将结果平均化——尽管该法案还指示我们选择“最合理”的单一理论,即使它得出的风险估算低于平均水平。
得出“最佳”或“最合理”的风险估计听起来像是一个常识性的目标。但这真的正确吗?要决定,你需要回答两个问题,而当前的QRA批评者往往回避这两个问题。首先,除了像布雷耶那样的偶尔轶事之外,有什么证据表明今天的风险估计通常以过于保守的方式倾斜?其次,如果风险估计确实倾斜,这是一个严重的社会问题吗?“最佳估计”是解决这个问题的良药吗?
首先回答第二个问题,让我们想想保护普通人免受平均风险意味着什么。就风险而言,大多数人并非普通人;他们在接触污染和对污染的敏感性方面差异很大,就像他们在体重方面差异很大一样。假设政府为木梯设定了标准。你会说一个只能支撑140磅重的人的梯子是最好的,而一个也能支撑200磅重的人的梯子是一个浪费的例子,是不合理的偏向安全而非抱歉吗?可能不会。然而,当OSHA为在同一行业工作并呼吸相同污染物40年的工人(可能是全国平均水平的两倍)计算风险时,它被指控进行“糟糕的科学”。当EPA在假设儿童(可能比成年人更脆弱)每天可能喝三杯苹果汁(尽管人口平均水平不到一杯)的情况下评估苹果汁中农药残留的风险时,它也被指控。风险评估员认为,如果我们制定法规来保护普通人,我们可能无法充分保护大部分人口。那真的会是好的科学吗?
那么,估算平均风险意味着什么呢?所有风险估算都涉及不确定性。例如,当你试图从实验室和流行病学研究中估算某种致癌物的效力时,你永远无法得到一个确切的数字;如果你对自己诚实,你会得到一个范围的答案。选择该范围的平均值并不比任何其他选择更科学;所有选择都是价值判断,因为它们在低估风险的健康和经济成本与高估风险的成本之间取得某种平衡。选择平均值,无论听起来多么无偏,仅仅意味着这些成本是完全相等的——这确实是一种强烈的偏见。
让我用另一个类比来解释。假设有人告诉你,从你家到机场平均需要20分钟,但行程可能只需5分钟,也可能长达80分钟。如果你宁愿晚点4分钟赶飞机,也不愿早到5分钟,那么平均估算就是适合你的。但对于我们这些认为错过飞机(或任由污染造成一些不必要的死亡)比等待几分钟(或浪费一些钱在结果过于严格的污染控制上)更严重的人来说,更谨慎的估算才是必要的。风险评估师传统上将目光投向“合理的糟糕情况”——也就是说,他们试图给自己一个大于50%的机会来高估风险,以便合理地确保他们不会低估风险。这就像,例如,预留40分钟开车去机场。
如果我们不平均各种风险估计,而是简单地选择其中最合理的那个,我们可能会更糟。我们如何决定两个或多个合理但相互竞争的科学理论中哪一个最合理?通过某种专家多数投票吗?假设——如果允许我最后一个类比——一场飓风正在佛罗里达海岸酝酿,两种飓风行为理论相互矛盾。40%的公认专家认为风暴将转向陆地并袭击迈阿密,而60%的人认为它将无害地转向海上。我们是否应该决定后一种理论最合理,因此不向迈阿密发出警告?
从这个角度看,反映的不仅仅是平均风险给普通人的风险评估,并且既合理又保守的评估,开始显得真正符合常识。事实上,这正是我们社会在许多其他领域所应用的常识。我们通过审慎来应对不确定的威胁;这就是为什么在冷战期间,没有自以为是的喧嚣要求对苏联侵略的确切可能性进行最佳估计。相反,我们基于这种威胁足够严重的合理可能性而采取行动,值得付出非常昂贵的应对措施。我们每天都承认个体与平均水平不同,通过建造足够高的门供高个子人通过,以及足够坚固的梯子供胖子人使用——尽管在这里,就像在我所做的风险评估中一样,我们不会走向极端:我们不会为罕见的八英尺高、400磅重的人建造。
关于“最佳估算”自然会产生客观或常识性法规的说法,到此为止。但当前辩论的最大讽刺之处在于,缺乏可信证据表明今天的风险评估实际上确实倾向于过于保守。例如,嘲笑风险评估人员用于评估可疑致癌物的动物研究已司空见惯。批评者说,将高剂量的化学物质泵入大鼠体内,当然会高估接触少量化学物质的人类会患多少癌症。
但事实真的如此吗?1988年,路易斯安那州的一组科学家试图通过系统地比较动物研究结果与现有最佳癌症流行病学研究结果来找出答案,其中大部分研究侧重于工作场所致癌物暴露。研究人员考虑了所有23种已知的致癌物,包括苯、氯乙烯和石棉,并对其进行了定量比较。他们发现,平均而言,动物研究预测的人类死亡人数仅略高于实际死亡人数。更重要的是,在23项动物研究中,低估人类危害和高估人类危害的数量大致相同。
最近又出现了一项第二十四个案例研究,戏剧性地说明了忽视动物试验结果的愚蠢。1990年,OSHA准备监管1,3-丁二烯(BD),这是一种合成橡胶生产中释放的有毒气体。动物研究曾预测,暴露于空气中百万分之一BD的人类,患癌症的几率约为千分之八。OSHA希望将BD的允许限值从1000 ppm降至2 ppm。然而在1990年代初期,一系列期刊文章和社论出现,谴责该计划是过度监管,理由是小鼠的结果与人类无关。值得称赞的是,橡胶行业继续对暴露于BD的工人进行流行病学研究。几个月前,该研究的初步结果公布——它们似乎表明,工人患癌症的病例与从动物数据预测的病例一样多。现在,橡胶行业和工会正在敦促OSHA立即发布法规,并将BD的允许水平降至1 ppm,是我们最初提议的一半。如果我们六年前就听取了动物研究的意见,我们可能已经预防了一些癌症。
当然,风险评估员确实会做出倾向于夸大风险的假设。例如,他们通常假设受试者每天24小时暴露于可疑致癌物,而不是例如8小时。正在审议的立法将允许对使用该假设的任何法规提出法庭质疑,理由是它通常会导致三倍的暴露高估。但风险评估涉及数十种假设,而批评者往往忽略那些相反方向的假设。例如,毒理学家通常在24个月时牺牲他们的实验室小鼠和大鼠,这个年龄大致相当于人类的70岁。英国统计学家理查德·佩托已经表明,如果他们在动物自然死亡后再统计测试物质产生的所有肿瘤,他们对致癌性的估计可能会增加七倍。
总而言之,除了保护非平均人群的愿望(并非总是能实现)之外,目前还没有人成功地在现有风险评估程序中发现系统性偏差。一些关于荒谬夸大风险的耸人听闻的故事无疑是真的;风险评估是困难的,即使是善意的专业人员有时也会感到惊讶。但有些故事甚至不能作为警示轶事成立。以Alar为例,这种苹果种植者使用的生长调节剂于1989年被撤出市场,当时环保局的禁令迫在眉睫。这个案例因过度监管而臭名昭著。但1991年,Alar制造商赞助的一项动物研究发现,它导致的肿瘤数量与环保局假设的一样多——而且在较低剂量下。
或者考虑布雷耶大法官关于新罕布什尔州不存在的吃土儿童的寓言。事实上,那个废物场不在沼泽里;它位于未开发的土地上,但该土地已划定为住宅开发区。布雷耶暗示,环保局也没有假设儿童每年会245天用勺子吃土,才下令进行额外的清理工作。它只是假设微量污染物会不可避免地进入将来可能在该受污染的泥土中玩耍的任何儿童体内。毒性研究表明,这些微量污染物足以使这些儿童面临不可接受的高风险。考虑到目前用于解决各种其他社会问题的资金如此之少,这900万美元的清理工作值得吗?我不敢肯定。但如果存在错误,那在于对风险评估的反应,而不是科学本身。
当然,如果清理费用只需9000美元,布雷耶大法官大概就不会为此而激动——如果看起来要花费90亿美元,环保局就不得不转向其他事情了。显然,要做出明智的成本效益决策,你需要知道你正在考虑的行动的成本和效益。国会目前正在审议的立法规定了几十条风险评估规则,但根本没有提及成本分析问题。然而,计算健康和环境法规给经济带来的真实成本,与风险评估本身一样困难,也充满了不确定性。事实上,成本通常被夸大的证据远比风险被夸大的证据更强。
衡量企业遵守法规的直接成本是成本评估中较容易的部分,但评估人员常常连这一点都弄错。通常,他们被迫在没有需求的情况下估算合规技术的成本——也就是说,在技术供应商面临降低价格的任何激励之前,在用户学会高效使用之前,以及在两组人都有机会开发全新的合规方式之前。更糟糕的是,监管机构往往必须部分依赖受监管公司内部的工程师进行成本估算——而这些员工显然不愿低估遵守规定将给公司带来的成本。有趣的是,监管机构也有同样的厌恶:如果他们高估成本,他们就更不容易因错误地宣布某项法规经济可行而受到法庭挑战。
由于所有这些原因,法规的直接成本在首次实施时往往被高估。例如,环保局最昂贵的项目之一涉及工厂和发电厂氮氧化物排放控制。排放控制设备的制造商最近报告称,其成本现在仅为监管机构最初估计的五分之一到一半。而在去年秋天进行的一项综合研究中,现已解散的国会技术评估办公室审查了OSHA强制执行的七项主要监管项目的成本。在任何情况下,受监管公司都没有花费比OSHA预测的更多——而在七个案例中有五个案例,他们花费的费用明显更少。
此外,遵守法规的直接成本仅仅是故事的开始。当OSHA监管聚氯乙烯(一种用于塑料生产的致癌物)时,控制措施成本高昂,但通过增加回收的有价值产品量而物有所值。当它监管棉尘时,这些控制措施挽救了数十万工人免受褐肺病困扰,同时也帮助美国衰退的纺织业实现了现代化和复兴。Alar案例是又一个报告不实成本估算的例子:尽管对Alar依赖最重的两种苹果品种——“红元帅”和“麦金托什”的许多种植者在停用Alar后确实遭受了数年的经济困难,但其他品种的种植者却迎来了销售热潮。总体而言,自从这种致癌化学物质被停用以来,消费者对苹果的需求和苹果行业的盈利能力几乎翻了一番。一些种植者遭受的损失不应被忽视,但这并非故事的全部。被监管行业某些部分实际上可能从法规中受益——正如其他行业(例如污染控制设备制造商)完全受益一样——这通常不会被经济学家分析成本的方法所捕捉到。
经济学家已有两百多年的时间来发展这些方法,但它们仍然不尽完善。那么,我们为何对风险评估师如此不耐烦呢?最近一项关于风险评估的主要研究——由美国国家科学院挑选的24位专家(包括我)历时三年完成——得出结论,尽管经常听到批评,但风险评估方法从根本上是健全的。如果那些现在试图通过政治法令修改这些方法的国会议员知道这项研究,他们显然没有被打动。
风险评估,正如我一开始所说,是一个年轻的领域。它太年轻了,以至于仍然受到合格从业者匮乏的严重制约。要做好风险评估,你需要了解毒理学、环境化学、统计学、生理学以及其他几个领域的知识。在这些独立的学科中,专家比比皆是,但他们彼此之间沟通困难,而通才则确实稀缺。例如,在美国全境,目前只有一个人拥有风险分析博士学位——他是我的大学同学。我们需要更多像他这样的人。在这一点上我同意布雷耶大法官的观点:他建议建立一支风险专家队伍,在监管机构、司法机构和国会办公室之间轮流任职,在改进个别法规的同时帮助改进整个领域。只有我们现在就开始培养这些专家,风险评估才能有望赶上社会对其日益增长的期望。
与此同时,我们不应要求风险评估提供超出其目前能力的数量或质量。最重要的是,当我们实际上是在推行一种政治意识形态——一种认为至少在健康和环境方面,政府监管越少越好的意识形态时,我们不应假装自己在提倡好的科学。这并非价值判断有什么问题;没有它们就无法进行风险评估。只是这些价值判断应该明确表达,而不应被允许伪装成客观性。这些是我的价值观,是最初让我进入这个行业的价值观:我相信风险评估,以其目前实践的方式和正在稳步改进的方式,可以帮助我们更廉价、更有效地保护健康和环境,并预防不必要的伤害、疾病和死亡。而且我相信,无论社会决定拯救生命或保护生态系统价值多少,真正最佳的风险评估是鼓励决策者对不确定性诚实,并做出明智且人道的应对措施的评估。














