广告

指望计算障碍

探讨健康统计数据如何影响心理健康以及有效理解统计数据的心理障碍。

Google NewsGoogle News Preferred Source

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

健康统计数据可能危害我们的心理健康。我们被声称能预测一切的数字淹没,从死于癌症的可能性到感染艾滋病的几率,我们以一系列奇怪的反应来应对,这些反应很少能反映所谓风险的真实性质。我们忽略了真正的危险,却对虚构的威胁情绪化地做出反应;我们轻信可疑的结论,却不相信明智的结论;或者我们只是(或不那么简单地)误解了这些数字。(国家无可辩驳统计委员会报告称,我们中有88.47%的人每天会发生这五种反应中的一种5.61次,导致该国每年记录了452,888,988,750例计算障碍。)

广告

问题的一部分在于我们心理上无法客观地面对数字或健康危害。问题的另一个方面是数学上的;它源于我们对统计分析本身怪异之处的无知。第三个方面是事实上的:如果我们不知道所讨论的统计数据是如何获得的,那么我们就无法知道它们真正意味着什么。

理解统计数据的心理障碍是最常见的。想想去年在一次全国性脱口秀节目中,一位嘉宾将他妻子最近死于脑癌归咎于她使用手机时造成的恐慌——这个案例在某些方面可以作为许多近期健康恐慌的范例。该男子声称他妻子频繁使用手机与她随后患脑癌之间存在因果关系。他提起诉讼(案件仍在审理中),随之而来的媒体狂热制造了恐惧、混乱,并导致手机制造商的股价下跌。

在这种情况下,一个戏剧性轶事的威力模糊了某种疾病的发病率和绝对病例数之间的常识性区别。脑癌是一种罕见疾病;每年大约每10万人中有7人患病。然而,由于美国人口众多,这个比率每年仍导致大约17,500名新患者。奇怪的是,脑癌与手机之间的真实统计关系似乎表明这些设备实际上抑制了脑肿瘤的形成。论点是:美国约有1000万手机用户。将1000万乘以7/100,000,我们得出每年在这些设备用户中大约会有700例脑肿瘤。由于只有少数病例引起公众关注,我们应该得出结论,手机甚至可能有效地预防脑肿瘤。这当然荒谬,但并不比最初歇斯底里背后的推理更荒谬。

显然,某些统计数据的吸引力与数字本身的有效性关系不大。我们在心理上倾向于相信和记住那些整数,特别是10的倍数的统计数据。这些数字成为统计民俗的一部分,即使在某些情况下它们没有已知来源;即使有,也很少有人(如果说有的话)能准确解释它们的含义。例如,多年来一直有人认为,我们每个人只使用了大脑容量的约10%;安全套失败率为10%;直到去年,美国有10%的人是同性恋。我怀疑,这些统计数据部分是我们十进制系统的产物;在一个12进制系统中,我们无疑会对8.333%的倍数的统计数据表现出类似的偏好。

当我们加入大数字或不熟悉的元素时,这种心理数学的混合物变得更加模糊。毒品无疑是一种祸害,但我们往往忽略最大的杀手——烟草(每年40万死亡)和酒精(每年9万死亡)——却对可卡因和海洛因等更奇特的物质感到恐慌,即使所有非法药物滥用加起来每年导致约2万死亡。同样,许多人害怕核电站,然而旧油漆和管道中的铅这一平淡无奇的问题已经造成了更大的危害。同样,加州生物化学家布鲁斯·艾姆斯估计,我们摄入的天然杀虫剂(蘑菇中的肼、花生中的黄曲霉毒素)是人造残留物的10,000倍,然而没有人会贴着“拒绝花生”的汽车贴纸。

对统计学数学的误解造成了另一组困惑。考虑辛普森悖论,这是一个很容易犯的算术错误,并带来许多现实世界中的后果。这个错误在于,如果一个人对几组数字取平均值,然后再对这些平均值取平均值,得到的数字就是所有数字的平均值。这个看似矛盾的现象也适用于百分比。因此,如果一项研究表明,某个族群(称他们为“绿色人”)中有36%和另一个族群(称他们为“红色人”)中有45%的健康状况通过某种治疗得到改善,而第二项研究表明,绿色人中有60%和红色人中有65%的健康状况得到改善,我们不能因此得出结论说红色人中有更高比例的人健康状况得到改善。例如,第一项研究可能包括100名绿色人和1000名红色人,而在第二项研究中,这些数字可能颠倒了。由于报纸经常用易受某些疾病影响的族群百分比来轰炸我们,辛普森悖论很可能引发一场真正的计算障碍流行病。

一个类似的错误可能出现在一篇关于福利改革的报道中。标题可能是“一半福利受助者是长期受助者”,这是基于以下数据:假设格林先生多年领取福利。一月份,他像往常一样领取了公共援助支票。布鲁夫人也一样。到二月份,布鲁夫人不再领取福利,但奥兰治女士第一次获得了援助。三月份,奥兰治女士找到了一份工作并停止领取救济金,但珀普尔先生申请了援助。与此同时,可怜的格林先生全年都在领取福利。如果查看任何一个月的记录,会发现50%的人——格林先生和另一个人——是长期福利受助者。然而,当年领取福利的人中,只有十三分之一的人长期领取福利。

条件概率的数学概念也常常让人困惑。假设一个人是美国公民,他或她讲英语的概率是95%。一个人是美国公民,前提是他或她讲英语的条件概率则要小得多,比如说20%。误解条件概率会导致我们对关键的医疗保健问题得出不准确的结论。例如,考虑这种情况:你接受了一种可怕疾病D(可能是计算障碍)的检测,你的医生郑重地告诉你检测结果呈阳性。你该有多沮丧呢?

要看到谨慎乐观可能是合适的,假设有一种针对疾病D的测试,在以下意义上是99%准确的:如果一个人患有D,测试99%的时间会呈阳性;如果一个人没有D,测试99%的时间会呈阴性。(为简化起见,我假设阳性测试和阴性测试的百分比相同。)再假设0.1%——每1000人中有一个人——确实患有这种罕见疾病。

广告

现在我们假设进行了100,000次D疾病检测。其中有多少次是阳性?平均而言,这100,000人中有100人(0.1%)会患有D,因此,由于这100人中有99%会检测呈阳性,我们平均会有99次阳性检测。在99,900名健康人中,1%会检测呈阳性,导致总共有999次阳性检测。因此,在总共1,098次阳性检测(999 + 99)中,大部分(999次)是假阳性;所以,鉴于你检测呈阳性,你患有D的条件概率是99/1,098,或者略高于9%,而这还是在一个被假设为99%准确的测试中!重申一下,鉴于你患有D,你检测呈阳性的条件概率是99%,但只有9%检测呈阳性的人会患有D。

整个统计检验、估计和程序中充满了看似量身定制(或许是数学家制作)以迷惑不察者的细微之处。例如,确定特定疾病的聚集是否构成严重问题的证据——或者仅仅是巧合的聚集——并不容易。你可能会注意到,你附近似乎有很多人患有脑癌。但随机分布并非均匀的。也就是说,脑癌患者在所有50个州中完美均匀的分布是极不可能的——远比这里和那里出现的偶然集中更不可能。(一个更熟悉的例子是抛硬币。即使抛掷结果——正面或反面——是完全随机的,你也不会期望得到一个完美的正面、反面、正面、反面序列。你会期望出现一连串的正面或一连串的反面——有时甚至是长串。)

广告

此外,大多数人没有意识到随机样本的关键是其绝对大小,而不是其占总人口的百分比。尽管这似乎与直觉相悖,但从2.5亿美国总人口中抽取500人的随机样本通常比从2500人中抽取50人的随机样本更具预测性。

更基本但也更普遍的是,混淆相关性和因果关系。例如,任何将鞋码与智力相关联的研究都会显示,脚大的孩子比脚小的孩子推理能力更好。但这里没有因果关系。脚大的孩子推理能力更好,因为他们年龄更大。也许这很滑稽,但请考虑一篇报纸文章,宣布瓶装水与更健康的婴儿之间存在联系。读者显然会被邀请推断出因果关系。然而,如果没有进一步的证据,这种邀请应该被拒绝;富裕的父母更有可能饮用瓶装水,也更有可能拥有健康的孩子(因为他们有稳定的经济能力购买好的食物、衣物、住所和便利设施)。在阅读关于这种行为与那种状况之间“联系”时,养成质疑相关性的习惯是一种良好的统计卫生习惯。

通常,统计数据的含义会因为缺乏关于数字如何获得的简单信息而变得模糊。计划生育研究中最初引用的10%的避孕套失败率就是一个例子。似乎它是通过询问夫妇他们主要的避孕方法是什么以及是否曾失败而得出的。在使用避孕套的夫妇中,大约十分之一的人回答“是”。于是产生了一个统计数据,尽管似乎没有其他研究支持这个数字,也没有合理的方法来解释它。例如,避孕套的渗漏率已知非常低。(根据自己的调查和其他调查,《消费者报告》得出结论:“原则上,乳胶避孕套的有效性可以接近100%。”)然而,作为避孕手段的有效性数据因受访者的年龄和婚姻状况而异,这些类别肯定与避孕套渗漏率无关。问题似乎出在使用者身上,而不是设备本身。同样,如果问题是预防性传播疾病,数字再次取决于避孕套使用是否小心,但这些数字很难估计(也许除了偷窥者)。然而,有相当多的间接证据;例如,内华达州的妓女如果总是使用避孕套,几乎不会感染性传播疾病。

同样,最近媒体关注了一些研究,这些研究声称女性吸烟者患肺癌的风险高于男性吸烟者。但是,根据一些研究人员的说法,比较风险的计算方式使得研究结果令人怀疑。这些批评者指出,这些研究分别考察了男性和女性肺癌病例。对于每组,以及等规模的没有肺癌的男性或女性对照组,他们问道:“患这种疾病的风险是多少?”他们发现,女性组中的吸烟者占肺癌患者的比例高于男性组中的吸烟者。但是,女性的比例可能更高,仅仅是因为更多的非吸烟男性因其他原因患上肺癌——例如,接触工作场所的致癌物。起始基线不同,所以这些比较充其量是可疑的。

广告

另一个比较错位的情况出现在《纽约时报》的一组信件中,涉及一个关于国家政治健康的问题:在最近的纽约市市长选举中,是黑人还是白人更多地基于种族投票。第一位作者认为,由于95%的黑人投票给了(黑人)市长大卫·丁金斯,而只有75%的白人投票给了(白人)候选人(和获胜者)鲁道夫·朱利安尼,所以黑人投票比白人投票更受种族动机驱使。第二位作者指出,这没有考虑到大多数黑人选民对任何民主党候选人的偏好,而丁金斯就是其中之一。假设80%的黑人通常投票给民主党,而只有50%的白人投票给共和党,那么只有15%的黑人是基于丁金斯的种族投票,但多达25%的白人是纯粹基于种族投票给朱利安尼。当然还有其他解释。

未能将统计数据置于背景中,使得人们几乎不可能以清晰的眼光评估个人风险。例如,我们经常听到八分之一的女性会患乳腺癌。这个数字具有误导性,原因有几个(其中一个重要原因是人们经常将其误读为死亡风险,而不是终生发病风险;死亡风险是二十八分之一)。但最重要的是,乳腺癌的发病率,像大多数癌症一样,随年龄增长而上升;女性在50岁前患乳腺癌的风险是五十二分之一,但在85岁前是九分之一。而到95岁时,则是八分之一。根据国家癌症研究所的数据,典型的40岁女性在50岁前患此病的几率约为1.5%,在60岁前患此病的几率约为3.8%。相比之下,典型的20岁女性在30岁前患此病的几率为0.04%,在40岁前患此病的几率为0.5%。终生风险在过去20年中有所上升,但这可能有两个因素造成:更频繁的筛查导致更多病例的早期发现,而且,由于女性因其他原因死亡的频率降低,她们活到了患乳腺癌风险更高的年龄。

事实上,大多数疾病的死亡率根据您选择查看的年龄组而差异巨大。大多数人对美国两大杀手是心脏病和癌症的统计数据很熟悉。这总体上是正确的。但是,如果您查看例如二十多岁的人群,主要的杀手是车祸、他杀、自杀、溺水、中毒和火灾。而且由于受害者更年轻,他们的死亡会导致更多潜在生命年(有点随意地计算为65岁之前的年份)的损失。因此,即使死亡人数较少,损失的生命年数却更多。

此外,人们有一种自然倾向,会低估未来到期的数量,无论是涉及死亡和疾病的发病率,还是抵押贷款到期的金额。20年后才遭受痛苦的想法比为了防止其发生而可能需要付出的更迫近的牺牲更容易承受;只有通过这种错误的计算,我们才能得出结论,戴避孕套的不便对生命来说太不值得付出。

广告

最后一点:不合理精确的统计数据通常是假的(当然,本文开头引用的“研究”中提到的那些数字也是如此)。考虑一个为几代父母和医生所熟知的精确数字:正常人体温度为98.6华氏度。最近涉及数百万次测量的调查显示,这个数字过高;正常人体温度实际上在平均98.2华氏度左右波动。然而,错误并非出在原始测量上。36.2到37.5摄氏度之间的测量值被平均,并合理地四舍五入到最接近的整数:37摄氏度。当这个温度转换为华氏度时,四舍五入被遗忘了,98.6被认为是精确到小数点后一位。如果原始温度范围被一一转换,等效的华氏温度将介于97.2到99.5度之间。显然,计算障碍甚至会导致发烧和寒战。请自行接种疫苗。

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章