广告

档案学家希望人工智能帮助保存和分析特朗普所说的一切

探索特朗普档案,这是一份全面的特朗普媒体露面合集,塑造着公众话语和问责制。

Google NewsGoogle News Preferred Source

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

(图片来源:Joseph Sohm/Shutterstock) 就职典礼还没过一个星期,电视新闻就已经充斥着唐纳德·特朗普总统政府的各种活动。特朗普通过推特承诺将对非法投票行为展开调查,并威胁说如果芝加哥警方不能解决“混乱”问题,就“派联邦部队介入”。而这仅仅是周二到周三之间发生的事情。这种高度的关注促使 互联网档案馆(一个保存网页上所有内容的存储库)于一月初启动其 特朗普档案。你可能已经通过互联网档案馆的 Wayback Machine 进行了数字时空旅行,或者查看了免费书籍、电影和软件。特朗普档案的内容来自互联网档案馆的 电视新闻档案,其中包括自 2009 年以来超过 520 小时的特朗普电视演讲、采访、辩论和其他广播节目。它还将继续增长。“目前没有可访问的电视新闻图书馆,所以电视新闻就像海浪一样冲刷着我们,”互联网档案馆电视新闻档案的负责人 Roger Macdonald 说。电视新闻档案让记者、学者和公民有机会在电视新闻的浪潮拍打上岸后,能够喘息、反思和处理。而在特朗普档案的案例中,它是一个追踪特朗普在公共政策问题上言论的工具,并确保录像不会因为互联网的短暂性而消失。安娜·维纳(Anna Wiener)已经利用该档案在她为《纽约客》撰写的一篇文章中 沉浸式地 观看特朗普的电视节目,而德国总理、物理学出身的安格拉·默克尔(Angela Merkel)据 报道,正在仔细研究特朗普的存档采访,以了解这位新任总司令。因此,特朗普档案已经在发挥其作用,但对于档案的策展人来说,这仅仅是他们更大愿景的一个框架。这些档案管理员希望人工智能能够扮演更重要的角色,简化对民选官员在档案中言论的访问,从而增强问责制。“这里对人工智能有一个非常明确的公共利益价值,”Macdonald 说。“我们设想这是一个为期多年的项目,旨在模拟机器智能如何使媒体对人类和机器都更易于访问和理解。”

广告

深入

目前,关闭字幕文本是连接电视新闻档案(自 2009 年以来收集了 130 万个节目)的 *数据线*。因此,在特朗普档案中的搜索就是搜索字幕中的关键字。这种技巧使得广播新闻视频可以被搜索。但关闭字幕有其局限性——试试数一下直播中的错误——这就是人工智能发挥作用的地方。除了文本,Macdonald 和档案团队希望利用面部识别、语音识别和其他深度学习工具,将每一秒的视频都置于上下文中。“我们希望能够为我们的视频收藏提取新颖的元数据:谁在说话,什么时候,以及是什么类型的节目?”电视新闻档案的高级创意技术员 Dan Schultz 说。“即使进行情感分析,也都在收集新颖元数据的范围内。”情感分析,简而言之,就是利用词语选择和语气来评估一个人的语言是负面的还是正面的。这些算法将是记者和好奇公民 alike 审问数据的关键,通过有针对性的问题(特朗普关于经济的言论在过去 6 个月里是如何变化的?)而不是更普遍的查询,并获得相关的答案。而且,在一个关于“假新闻”的党派斗争正在进行的时代,人工智能将更容易帮助我们拨开迷雾。

眼见为实

人工智能程序已经擅长从文本和图像中提取信息。Facebook 的面部识别软件可以识别你和你的朋友,算法可以 自动为照片添加字幕,研究人员也定期使用 Twitter 数据进行 情感分析。然而,视频是一个更难攻克的难题,但这个难题正在被攻克。Twitter 的人工智能团队,被称为 Cortex,开发了一种算法,可以识别直播视频中正在发生的事情——据 MIT Technology Review 报道,它可以告诉你你是在弹吉他还是在抚摸猫。然而,直观地说,处理视频在计算上比处理文本或图像要复杂得多,这也是这项任务的难点所在。Comcast 最近收购 了一家名为 Watchwith 的公司,该公司构建了一个利用计算机视觉和机器学习自动生成视频元数据的系统。Google 使用语音识别为视频自动生成关闭字幕。Netflix 和 Hulu 也投资了深度学习和计算机视觉方法来生成视频元数据,以改进个性化推荐。其他公司如 Clarifai、Viisights 和 Movida 的 Deeva API 也依赖人工智能提供类似服务。在所有这些努力中,最终目标都是让视频更容易在数字世界中被找到。尽管如此,还有很长的路要走。“在看到如此少有的技术兑现其承诺后,我对人工智能方法的有效性感到相当(怀疑),然而,保持开放的心态至关重要,”Digital Asset Management News 的编辑 Ralph Windsor 写道。对 Windsor 来说,在专业档案管理员能够依赖这项技术之前,人工智能还有很多需要证明的地方。扩大档案 对于电视新闻档案团队来说,特朗普是第一个,在不久的将来,他们计划将档案工作扩展到众议院和参议院的多数党和少数党领袖。是的,他们还将存档奥巴马政府时期的数字足迹。“值得注意的是,八年前我们没有这样的技术管道来揭示这些事情,”Schultz 在被问及为何从特朗普开始时说。“这是一种兴趣、技术时机完美结合的完美风暴,并且与档案的总体使命一致。”除了为后代保存视频外,该档案还充当了创意表达的载体。例如,电视新闻档案团队集成了一个名为 Popcorn 的工具,它允许任何人直接在浏览器中组合新闻视频剪辑,而无需花费数百美元购买编辑软件。“我们非常好奇它会发生什么。我们甚至无法想象人们将如何使用我们的东西,”电视新闻档案的执行主编 Nancy Watzman 说。

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章