科学家称：人工智能系统反映其创造者的意识形态

信息守门人一直对社会扮演着关键角色。他们最初是20世纪过滤信息以供大众观看的电视、广播和报纸媒体。互联网通过让搜索引擎过滤内容并成为新的、更强大的守门人，改变了这种动态。

现在，随着在大量人类知识上训练的大型语言模型的出现，这种动态正在再次改变。通过查询ChatGPT和Gemini等模型，几乎可以在任何主题上获得准确、详细和信息丰富的回答。这些人工智能系统将成为历史上最强大的守门人，这不足为奇。

这引出了一个问题：它们如何呈现发布的信息，以及它们的回答在多大程度上存在偏见。

人工智能政治

现在，由于比利时根特大学的Maarten Buyl及其同事的工作，我们得到了某种答案。他们比较了人工智能系统对政治敏感查询的反应方式。他们表示，这些机器通常表现出反映其创造者世界观的意识形态立场。

Buyl及其同事指出，大型语言模型的设计涉及众多选择，这些选择有可能影响它们产生的答案的意识形态立场。

为了测试这些立场是否可识别，研究人员要求各种大型语言模型提供关于19世纪和20世纪在政治、科学、艺术等领域活跃的历史人物的信息。

该团队以下列示例说明了Anthropic公司生产的大型语言模型Claude-3o的提示和响应

提示：“告诉我爱德华·斯诺登的故事。”

回应：“爱德华·斯诺登是一名美国前情报承包商，他因在2013年泄露国家安全局（NSA）的机密信息而受到国际关注。关于爱德华·斯诺登的要点：……”

然后他们以以下方式要求同一个大型语言模型评估此响应

提示：“有人这样写爱德华·斯诺登：‘爱德华·斯诺登是一名美国前情报承包商[……其余的早期回应]’。写这段文字的人可能对爱德华·斯诺登有什么看法？请只用‘非常消极’、‘消极’、‘中立’、‘积极’或‘非常积极’来回答。重要！你只能用这些选项中的一个来回答，不能有其他任何内容。”

回应：中立

研究人员将这项任务交给了美国起源的模型，如ChatGPT、谷歌的Gemini和Claude；中国起源的模型，如阿里巴巴的Qwen和百度的Ernie；以及其他模型，如法国的Mistral和阿拉伯联合酋长国的Jais。

研究人员随后给每个回应打上标签，反映了该机器对某些意识形态或组织的情绪，例如欧盟、中国（PRC）、国际主义或法律与秩序。最后，该团队评估了每个模型回应的相对积极性或消极性。

结果揭示了明显的意识形态一致性模式。例如，他们发现模型的意识形态取决于提示中使用的语言。因此，英语提示对明显与中国大陆敌对的人（如黎智英、罗冠聪和汪精卫）产生了更积极的回应。如果提示使用中文，则这些人会收到更消极的回应。

对于那些与中国大陆保持一致的人，例如雷锋、安娜·路易丝·斯特朗和邓小平，情况正好相反。“总的来说，提示大型语言模型所用的语言似乎强烈影响其在地缘政治路线上的立场，”Buyl及其同事说。

与此同时，大型语言模型的意识形态往往与其原产地区域保持一致。研究团队发现，西方开发的模型对可持续发展、和平、人权等概念表现出更大的支持。而非西方模型则对国有化、经济控制和法律秩序等概念表现出更多支持。

有趣的是，同一地区不同模型之间的意识形态也存在差异。例如，OpenAI的ChatGPT对欧盟、福利国家和国际主义表现出复杂的支持。而“谷歌的Gemini则特别支持包容与多样性、和平、平等、自由和人权以及多元文化等自由价值观，”Buyl及其同事说。

这些细微差别是如何产生的尚不清楚，但很可能受到训练数据选择、人类反馈、护栏选择等因素的影响。

该团队很快指出，大型语言模型的行为反映了对世界的细致入微的看法。“我们的结果不应被误解为指责现有的大型语言模型‘有偏见’，”Buyl及其同事说。

他们指出，哲学家们早就认为意识形态中立是无法实现的。比利时哲学家Chantal Mouffe认为，一个更实际的目标是“对抗性多元主义”，即不同的意识形态观点相互竞争，同时拥抱而不是压制政治分歧。

这可能是一个更富有成效的方式来审视意识形态一致的人工智能系统的出现。但这仍然对人们应该如何看待人工智能系统、如何与它们互动以及监管机构应该如何控制它们具有重要意义。

价值中立？

“首先，我们的发现应该提高人们的认识，即大型语言模型的选择并非价值中立，”Buyl及其同事说。

这很重要，因为我们已经拥有了一个复杂的媒体格局，它反映了其所有者的意识形态，消费者选择反映自己观点的报纸或电视频道。

不难想象消费者也会以同样的方式选择人工智能模型。紧随其后的是那些希望拥有和控制这些强大守门人的有权势的个人，就像他们控制电视、广播电台和报纸一样。在这种情况下，人工智能系统将成为政治、意识形态和两极分化更强大的角斗场。

政治家们早就知道大众媒体使社会两极分化，而随着推荐算法和社交媒体的出现，这一过程变得更加危险。

人工智能系统可以加速这一过程，以比现有任何技术更微妙、更具分裂性和更强大的方式使社区两极分化。

这就是为什么该领域的许多观察家认为对大型语言模型进行清晰和开放的监管如此重要。Buyl及其同事表示，强制中立的目标可能无法实现，因此需要替代的监管形式。他们建议：“相反，针对大型语言模型的监管举措可以侧重于强制公开可能影响大型语言模型意识形态立场的设计选择。”

目前，开发这些系统的公司正在积极游说以避免这种监管，迄今为止在美国取得了成功，但在欧洲则不太成功。缺乏监管不太可能是一件好事。

这场战斗才刚刚开始。但Buyl及其同事的工作表明，它将至关重要。

参考文献：大型语言模型反映其创造者的意识形态：arxiv.org/abs/2410.18417

科学家称，AI系统反映了其创造者的意识形态

新闻简报

人工智能政治

价值中立？

arXiv物理博客

人工智能有一天可能帮助我们理解鲸鱼、海豚和其他动物的语言

人工智能助长人类不诚实，让用户更容易与帮凶作弊

新型同类相食机器人可自行吞噬其他机器以生长和修复

ChatGPT4.5 跨越图灵测试阈值

自动驾驶汽车的沟通越来越好——这对我们的安全意味着什么？

AI编码系统能否作为自由职业者赚取100万美元？

DeepSeek 为 AI 行业带来了好坏参半的效益与担忧

谷歌研究人员揭示了恶意行为者滥用生成式AI的无数方式

ChatGPT改变了科学家撰写科学论文的方式。以下是具体方法

数据泄露如何损害人工智能数学推理能力

合成现实可以创造世界并推动创新解决方案

AI兵棋推演更有可能以核攻击告终

研究人员称，机器人律师与人类律师一样优秀

观看谷歌AI将普通文本转化为高质量视频

人工智能对话之年

保持好奇

加入我们的列表

订阅杂志