大型语言模型是一种目前风靡全球的人工智能。它们包括OpenAI的ChatGPT、谷歌的Bard以及其他各种模型。所有这些模型都通过大量的书面文章数据库进行训练,它们在给定前面词语序列的情况下,测量一个词语出现的可能性。
有了这些知识,人工智能通过列出模型建议的最可能词语序列来对给定提示产生响应。计算机科学家进一步完善了这些过程,并微调了这些系统的能力以改进输出。
结果有时令人印象深刻,有时令人困惑,有时又令人恐惧。这些人工智能能够写笑话、创作诗歌和模仿文学风格。但它们也会自信地犯错,有时还会通过一系列错误来加重错误,这种现象被人工智能工程师称为幻觉。
问号
然而,许多观察家预测这些人工智能将有一个光明的未来。微软正在将其功能内置到其Office产品中,以帮助生成书面报告、演示文稿和分析数据。谷歌的Workspace也有类似的方法。这些科技巨头的希望是,这些人工智能系统能够大幅提高员工和雇用他们的公司的生产力。
这就引出了一个问题,人们将如何使用它们,以及哪些工作最可能受到大型语言模型出现的影响。
现在,感谢旧金山人工智能初创公司OpenAI的Tyna Eloundou及其同事的工作,我们得到了一种答案。该团队询问ChatGPT3.5是否可以用于近20,000项任务列表,这些任务与1000多种职业相关,从计算机系统架构师、护士到记者和数学家。
(该数据库名为O*NET,由美国劳工部维护。)
该团队随后确定了ChatGPT3.5将产生的影响。在每种情况下,他们都想知道人工智能是会使任务变得更困难、更容易,还是需要一些额外的软件才能产生积极影响。
例如,急性护理护士必须执行的一项任务是“设置、操作或监控侵入性设备和装置,例如结肠造口或气管切开设备、机械呼吸机、导管、胃肠道管和中心静脉导管”。相比之下,幼儿园教师的一项任务是“让家长志愿者和年龄较大的学生参与儿童活动,以促进他们参与有重点的复杂游戏。”而在线商家的一项任务是“发送已完成交易和发货的电子邮件确认”。
该团队要求一组人类来决定这种影响,并向ChatGPT4(OpenAI大型语言模型最先进的版本)提出了同样的问题。
结果令人玩味。“我们的研究结果表明,大约80%的美国劳动力至少有10%的工作任务会受到GPTs引入的影响,”Eloundou和同事说。“而大约19%的工人可能会看到他们至少50%的任务受到影响。”
但并非所有技能都会以同样的方式受到影响。例如,该团队表示,与科学和批判性思维相关的技能受影响较小,而写作和编程技能受影响较大。
该团队还分析了各行业受到的影响。“我们发现信息处理行业受影响程度高,而制造业、农业和采矿业受影响程度较低,”他们说。
游戏规则改变者
该团队预测,有些工作根本不会受到ChatGPT3.5的影响。这些工作包括:轮胎修理工和更换工、摩托车机械师、快餐厨师以及水泥匠和混凝土修整工。
一般来说,对人类而言进入门槛越高的工作,受ChatGPT影响越大。这些工作需要最高水平的教育、经验和培训。
但这些结论附带一个重要的警告。一个显著的困难在于,要知道ChatGPT3.5对任何给定任务可能产生何种影响。该团队承认这一点,并承认结果完全是主观的。
也不清楚ChatGPT3.5是会取代人类活动还是增强人类活动。这对于预测未来的就业趋势是一个重要的区别。
尽管如此,ChatGPT3.5和其他类似的人工智能系统将继续存在,并可能变得更好。它们也可能对整个社会产生普遍影响,并催生广泛的其他创新。因此,Eloundou和同事得出结论,大型语言模型是一种“通用技术”,就像电力或信息技术一样。
关于这些技术对文明的影响以及它们在日常生活中变得多么关键,没有什么争议。
但是,大型语言模型在未来几个月、几年和几十年内将如何影响社会,也许是我们面临的最重要问题之一。
参考文献:GPTs是GPTs:大型语言模型对劳动力市场潜在影响的早期观察:arxiv.org/abs/2303.10130














