人工智能

哈罗德·科恩在1966年代表英国参加威尼斯双年展时已是一位备受赞誉的艺术家，他的作品随后在世界各地的顶级画廊和博物馆展出。因此，在1969年，当他开始涉足计算机时，他的目的只是让机器帮助他创作绘画。他回忆道：“我曾想过设计一个程序作为一种助手。我来构思天上的范式，它来完成世间的实现。”但随着科恩发现自己投入绘画的时间和精力越来越少，他的计算机化分身，被命名为亚伦（Aaron），开始拥有了自己的事业。

1983年，亚伦用它的机械手拿起铅笔，在伦敦泰特美术馆为一群着迷的参观者不倦地一幅幅创作图画。对他们来说，科恩必须亲手为图画上色这一点并不重要；许多围观者都把一幅新画夹在手臂下走出了画廊。到去年，当

波士顿电脑博物馆为科恩的“继子”亚伦举办了一场完整的展览时，亚伦已经掌握了画笔和调色板，并且在科恩设置好设备后，能创作出完整的画作，其中许多都相当赏心悦目。

科恩在计算机程序上的成功引出了一个问题：这些画作的创作者是谁？答案绝非显而易见。也许创造性智能属于科恩，因为毕竟亚伦只是按照他编程的方式行事。另一方面，科恩无法预测亚伦会做什么，而且画作是由机器之手创作的。

自20世纪80年代初以来，数十人尝试探索计算机的潜力，以补充其绘画、写作和音乐创作，甚至创作完全原创的艺术作品。部分得益于计算机速度和能力的增长，它们可以被编程以更复杂的方式行事，这些艺术家在赋予机器“创造力”方面取得了巨大成功——计算机程序现在可以创作巴赫风格的原创音乐，像查理·帕克一样演奏爵士萨克斯，甚至创作出可以说具有自身风格（或至少不能直接追溯到程序员艺术家）的作品。但是，一堆螺栓和硅芯片真的能有创造力吗？

加州大学伯克利分校的哲学家约翰·塞尔是关于计算机能否像我们一样思考这一问题的主要怀疑论者，他言简意赅地提出了自己的论点：“程序只有语法，没有语义。”换句话说，计算机永远不可能拥有心智，因为它只是遵循规则来转换符号，而不理解这些符号的含义。无论你认为这些符号是1和0、Fortran还是英语——它们只有对编程或使用计算机的人类心智才有意义，对计算机本身没有。没有意义，创造力便是肤浅而不重要的。塞尔承认，原则上，计算机或许可以被编程得像莎士比亚一样写作，或像贝多芬一样作曲，但无论机器的产出多么深刻，它仍然仅仅是符号转换的结果。他坚称，大脑以某种方式超越了这种操作。

假设塞尔是对的——计算机可以设想模拟人类创造力，即使它们缺乏真正的理解，也永远无法创作出在人类意义上有意义的艺术。许多有趣的问题仍然存在。计算机究竟能表现出多大的创造力？贝多芬程序在实践上和理论上是否可能？那些已经存在的明显具有创造力的程序又如何呢？它们的艺术作品水平如何？即使计算机注定只能产生产出而非创造性作品，也许它们仍然可以教会我们发展新的绘画或作曲方式。也许它们可以被设计来提出新想法，得出令人惊讶的类比，区分洞察力与琐碎。谁知道呢，也许我们在此过程中还能学到一些关于人类创造力的东西。

在加州大学圣克鲁斯分校的一个工作室里，一支室内乐团正在排练一首新作品。音乐既熟悉又陌生。有些听起来像是帕莱斯特里那以前不为人知的作品；另一些时候，又像是莫扎特和斯科特·乔普林某种形式的合作。乐手是人类，但这位新作曲家是一个名为“emi”（Experiments in Musical Intelligence，音乐智能实验）的计算机程序。

大卫·科普是该大学一位卓有成就的作曲家和音乐教授，他在20世纪80年代初转向计算机，因为他认为一个巧妙编写的程序可以在他创作停滞时提供帮助。“我曾想过，我可以想出一些东西，也许能生成一些模式，帮助我度过那些难以思考下一步该写什么的时候，”他说。这个项目从科普可以作为作曲辅助工具，发展成为一个独立的音乐创作程序。起初，科普给计算机一些通用的音乐风格规则和从各种作曲家那里提取的特定音乐模式，但结果不尽如人意——过于无聊和机械。科普重新设计了程序，使其能够接收一段音乐，自行找出一些作曲规则，然后利用这些规则创作一段新作品。结果往往令人信服，有时甚至不可思议。从几首巴赫合唱曲中提取的模式开始，emi有时会想出它认为是新模式的东西，但实际上它们与巴赫在其他合唱曲中使用的乐句非常相似。

EMI 并不及科普本身的原创性。它能创作出一些有趣的，偶尔令人惊叹的音乐片段——就像它巴赫风格合唱曲中那幽灵般的回声。它的作品引人入胜，尤其是在初次聆听时。但第二次听起来，它们就开始显得缺乏灵感。其中一些听起来像是称职的音乐学生模仿以往作曲家的作品。

保罗·霍奇森的程序给人留下了更持久的印象。霍奇森是英国布赖顿的一位爵士萨克斯风演奏家，他编写了一个名为“即兴演奏者”（Improvisor）的程序。与emi一样，“即兴演奏者”可以模仿不同的风格，例如查理·帕克和路易斯·阿姆斯特朗的风格，甚至能捕捉到巴赫键盘音乐的许多韵味。然而，与emi不同的是，它能实时作曲，而且通常很快。由于它随机选择和混合旋律和节奏模式，每次演奏都是独一无二的。它有多好？霍奇森说：“如果我是初来乍到，听到有人像‘即兴演奏者’一样演奏，我会很高兴加入。”

当然，如果霍奇森是初来乍到，他不会期望找到一位像阿姆斯特朗和帕克那样能够改变流派的爵士乐巨匠。这样的人是稀有的。“即兴演奏者”当然不会发现新的流派。然而，它能做并且正在做的是，探索给定且定义明确的音乐风格的可能性。霍奇森成功地想出了一套程序可以遵循的规则，用以描述给定风格音乐中出现的音符模式，然后进行模仿。“即兴演奏者”实际上分析了查理·帕克（Charlie Parker）的音乐，然后重现了他可能演奏过的那种流畅的比波普（bebop）中音萨克斯风旋律线。“即兴演奏者”本质上是派生的。

这并不意味着我们应该将其斥为缺乏创意。毕竟，大多数人类创意在某种程度上也是派生的。许多专业的爵士中音萨克斯风演奏者通过聆听和研究查理·帕克的独奏，吸收了他的风格，并将其融入自己的演奏。他们可能没有大师那样的创造力，但他们继续探索他开创的风格。遵循规则——保持在定义的风格之内——创造力仍然是可能的。在这个意义上，创造力仅仅是通过在规则规定的风格限制内进行实验而产生的新颖性。这对于雕塑家、画家、编舞者以及爵士乐手都适用。

然而，以这种方式定义创造力可能显得不够令人满意。个性是如何介入其中的呢？毕竟，即使是平庸的艺术也需要超越仅仅吸收他人的风格。计算机科学的语言能否捕捉到每位艺术家似乎留在其作品中的艺术签名呢？可以捕捉的论点如下：创作一件艺术品的过程涉及一系列决策。艺术家必须决定使用画笔还是铅笔，创作肖像还是风景，使用绿色还是蓝色，等等。起作用的规则规定了这些选择的类型，但从众多选项中选择一个的方法则是一种偏好。例如，英式十四行诗的形式规定了abab的押韵模式，但它没有说明哪些词押韵——是“wish”与“fish”，还是“bad”与“sad”，或者是“book”与“nook”。诗人进行选择。如果规则不允许这种选择，我们就会得到一个确定性系统，其中创造力是不可能的。

一个有创意的计算机程序也面临选择。然而，程序和诗人之间的区别在于他们如何决定采取哪种行动。程序通常通过随机选择——可以说，抛硬币——而诗人则根据植根于个人经验和艺术视野的独特偏好和判断进行选择。这并不是说计算机原则上不能表现出个性。可以同时运行几个亚伦的副本，每个副本都被编程在选择点表现出不同的倾向。它们都会以相同的风格绘画，但每个独立的程序都会以可识别的独特方式绘画。人类艺术家提供更微妙的签名，更广泛的线索，因为人类思维比计算机程序要丰富得多。

即使我们承认 EMI、Improvisor 和 Aaron 正在运用一种在某种原始方式上模仿了创作它们的艺术家的创造力，我们离完整的人类创造力模型仍有很长的路要走。激进的创造力，那种在历史书中留下印记的创造性天才所展现的创造力，发生在创作者不仅探索一种艺术创作方式，而是改变这种方式的时候。科恩说，在艺术界，人们谈论“风格”时，会用一套“问题”（problematics）来描述，也就是值得关注的东西。真正有力的艺术家会改变这些问题。然后其他人会跟随。

他补充说，到目前为止，还没有计算机能够质疑程序中设定的问题。

科恩早在20世纪60年代中期就对艺术作为一种基于规则的系统产生了兴趣。他注意到人们即使在最抽象的画作中也常常能看到表面、风景和物体，并对是什么让他们能够做到这一点感到好奇。为了更好地理解绘画中的表现力，他开始尝试开放而非封闭的曲线、各种对称和阴影等。

亚伦（Aaron）源于科恩更系统地继续这项实验的愿望。他给他的最早程序设定了规则，允许它们制作出清晰易懂的图画——例如，计算机被告知如何划分空间，或者被告知不能越过之前画过的线条。随机性使得每幅画都独一无二，而规则则确保结果在视觉上保持连贯。后来，科恩赋予亚伦描绘人们可以轻易识别的事物的能力，再后来又赋予它关于所画物体的知识——例如，它知道球是圆的，人类有两只胳膊和两条腿。多年来，科恩扩展了亚伦的能力，使其能够描绘三维场景和物体，包括近几年来的人体肖像。

但想想构成亚伦的那种规则。科恩告诉亚伦什么是杂技演员，以及杂技演员如何能踮着脚尖站在药球上而不摔倒。他告诉亚伦胳膊和腿在不同的身体姿态下如何改变形状。他还告诉它，如果从观众的角度来看，身体某部分前面有东西，那么这部分就不应该出现在画中。因此，亚伦有时会画出只有一个可见手臂的杂技演员。但它从未画过独臂杂技演员。而且，如果任其发展，它也永远不会画。它甚至无法考虑这样做，因为它没有办法改变其基本的身体图式。对亚伦来说，所有人类都有两条胳膊。它不能在某个特定情况下决定，通过描绘一个独臂人——或者，像印度女神那样，有六条胳膊——会更好地服务于艺术。

因此，亚伦是一个相对缺乏想象力的程序。如果人类有两条手臂的信息以明确可分离的方式提供（如“手臂数量：2”），并且它还有一个规则：“每隔一段时间，如果一个图式包含一个数字，就用另一个数字代替”，它就能生成独臂或六臂的人。当然，即使这样也会带来问题，考虑到亚伦的写实风格。亚伦对两臂人的身体平衡有所了解。一个独臂杂技演员踮着脚尖站立，可能需要以不同的方式支撑手臂或身体以避免摔倒。所以科恩需要修改亚伦的平衡图式以及解剖学图式。（如果身体一侧有六条手臂怎么办？）要让亚伦能够想出画一个独臂或六臂杂技演员的主意，它必须具备某种批判能力。它必须评估自己实验的结果，并根据自己的审美判断进行修改。科恩说：“我们称之为创造力是一个相对术语。亚伦比任何其他绘画程序都更具创造力，但我不会认为它具有绝对意义上的创造力，除非它能修改自己的行为。”

一些计算机程序试图通过将变异作为其首要指令来克服亚伦的局限性。其中之一是 Mutator，它是雕塑家威廉·莱瑟姆（William Latham）和程序员斯蒂芬·托德（Stephen Todd）在英国温彻斯特的 IBM 赫斯利研究实验室的杰作。20世纪80年代初，作为伦敦皇家艺术学院的学生，莱瑟姆开始尝试进化艺术。他受到生物学的启发，在生物学中，非常简单的步骤（细胞分裂）的重复导致了复杂而有趣的形式（动物和植物）。他会从一张单一的图片开始，然后从中产生大约六张子图片，每张都对原作进行一些小的改动。这些改动并非随意，而是应用非常简单的规则的结果。例如，如果莱瑟姆从一个立方体开始，他可能会通过在立方体的一侧制造一个隆起，或者通过切掉一个角，或者通过横向切割立方体来产生一个子图片。然后，对于每个子图片，他会应用相同的规则集来产生下一代。有时他会使用要求将两张父图片合并为一张的规则——一个立方体可能与一个圆锥体合并，产生一个带有立方体环的圆锥体。通过重复这些简单的操作许多代，他构建了复杂的家谱，其底部的复杂成员与顶部的简单原始成员截然不同，并开始类似于机器人、蜘蛛、坦克和许多无法命名的人物。它们常常让人联想到蛞蝓和蜗牛以及其他无脊椎动物。

最初，莱瑟姆用铅笔和纸手工创作他的画作，将一代的兄弟姐妹横向铺满一张大纸，然后将他们的后代纵向延续，从一张纸到另一张纸。有些作品长达30英尺。然而，11年前，他决定使用电脑来减轻繁琐的工作。他想到一种方法，先编写一个短程序来生成一个父图像，然后让电脑对程序进行随机修改。莱瑟姆用他艺术家的眼光，选择最好的子图像来培育下一代。结果如此令人惊讶，以至于莱瑟姆认为使用电脑让他能够创作出他否则无法想象的图像。他将电脑视为一种解放，将他的想象力从一些人类的局限中解放出来。他说：“当你第一次开始变异形式和形状时，有些东西是熟悉的。然后这些形式开始做一些非常奇怪的事情，比如内外翻转，或者突然长出一千根你最意想不到的小触手。很快你就能创造出具有美丽复杂性的形式，这是人类想象力无法一蹴而就的。这有点像你小时候在石头下发现奇怪的昆虫——它有那种魅力。”

马萨诸塞州剑桥遗传艺术公司的计算机科学家卡尔·西姆斯以一种与莱瑟姆原理相似，但在实践中涉及更精细突变方法的方式生成演化图像。实际上，他的方法模仿了DNA的操作。在西姆斯的程序中，每个图像都由自己的迷你程序生成。为了生成子图像，迷你程序会与一个或多个其他迷你程序“交配”。这种意义上的交配涉及将一个迷你程序的几行代码与另一个迷你程序的几行代码拼接在一起。为了保持有趣，西姆斯还在子程序中偶尔引入随机突变。一个完整的迷你程序可以添加到另一个程序中，或者嵌套在其中。经过许多代之后，一个只有一行的迷你程序可能会演化成一个由许多不同后代中的几个较小部分组成的十行程序。

西姆斯（Sims）的程序比莱瑟姆（Latham）的产生更多惊喜。它的图像是抽象图案——有时是黑白，有时只有一两种颜色（可能带有许多微妙的色调），有时是多色的。线条可能稀疏或繁密，直线或曲线，清晰或模糊，整体结构对称或不对称。即使是第二代的子代也可能与它们的父母截然不同，而曾孙女通常完全不保留任何家族相似之处。

乍一看，尽管莱瑟姆受过美术训练，但似乎西姆斯成功地创造了更具创造力的艺术家。然而，这种印象是肤浅的。你可以说，西姆斯的程序完全是转化，没有判断。它致力于激进的变革，而不是微妙的改进。它不知道如何识别一个有希望的改变并将其发展，以发挥其审美或交流潜力。艺术涉及有纪律的探索和无结构的玩耍。如果一位艺术家玩耍一段时间，当出现有趣的事物时，他或她就会停止玩耍，并更系统地探索它。这从艺术家的回顾展中可见一斑。在早期的作品中，我们看到了后来更充分发展的趋势的萌芽。很少看到风格突然发生根本性转变，而（例如毕加索）不止一次的这种情况则更是罕见。

莱瑟姆的图像具有强烈的家族相似性，因为他选择了他认为有趣的方法，并让他的程序遵循这些方法。他只允许在代码的表面层次进行微小的变异。一个特征（比如说，一个号角或一个线圈）可能会被重复或扭曲，但基本的图像结构不能改变。这不是一个缺陷，而是莱瑟姆的深思熟虑的策略。相比之下，西姆斯对他的图片的审美并不那么关心，而是更关心艺术家和他的程序之间的整个互动过程。他的程序产生激进的转变，因为他允许它改变图像生成代码的核心。

无论是莱瑟姆的程序还是西姆斯的程序，都无法从审美角度评估其所作所为。在这两个程序中，每一代的选择都是由人类完成的。亚伦、即兴演奏者和大多数其他所谓的创意计算机程序也是如此。这并不是说计算机程序不能做出任何形式的判断。西姆斯编写了一个评估新颖性的程序。该程序会进化动画生物，并根据其解剖结构对战斗的适应程度，从每一代中选出最好的。其他程序则在运行时进化其适应性标准。不难想象一个能够识别音乐、图片或文本中通常被人类认为是吸引人的模式的程序，尽管在实践中，以令人满意的方式做到这一点可能过于雄心勃勃。科恩多年来一直试图找到一种方法赋予亚伦评估其自身绘画的能力，但没有成功。他说：“这个程序本身就很复杂，当你开始进行评估时，复杂性会呈指数级增长。任何形式的实验都可能导致程序崩溃。”

无法做出这些判断是一个严重的局限，因为创造性工作中最重要的步骤之一就是区分好与坏，有效与无效。印第安纳大学布鲁明顿分校认知科学和计算机科学教授道格拉斯·霍夫施塔特说：“创造力没有公认的定义，但我认为每个人都会同意，它是新颖性和重要性的结合。新颖性随处可见，任何人都可以新颖。重要的是新颖且具有一定的深度。”

事实是，创作（和欣赏）艺术所涉及的心理过程远远超出了目前任何计算机程序。实际上，它们可能也超出了未来的任何程序。虽然目前还没有人能精确阐明当我们以人类丰富的思想回应人类丰富的美学艺术品时所涉及的心理过程，但我们可以同意它们涉及微妙的联想和判断，其中许多是无意识的。心理学家在这里面临的一个问题是，人类思维包含大量的概念和经验，它们之间存在数十亿潜在的联想。目前，我们无法指望在计算机模型中匹配这种多样化的丰富性。然而，一些科学家已经成功地将这些联想过程的片段分离出来，并用计算机程序对其进行建模。其中一个名为 Copycat 的程序，以简单的方式帮助我们了解创造过程中联想的实际含义，以及可能实现它的机制。

Copycat 由《哥德尔、埃舍尔、巴赫》一书的作者霍夫施塔特及其同事，新墨西哥州圣达菲研究所自适应计算项目主任梅拉妮·米切尔构思。霍夫施塔特本人是一位极具创造力的人，充满着智慧的活力。他选择专注于类比思维建模，因为它既是艺术也是科学中创造力最常见的源泉之一。许多科学洞见都以强大的类比形式出现——例如，心脏本质上是一个泵的概念——我们今天都认为这是理所当然的。对艺术家来说，类比可以提供一种在理解范围内打破现有艺术规则的途径。例如，类比可能让一位画家将静物看作风景。诗人可能会用它来连接通常没有任何联系的词语和思想（月亮是一艘在多云的海上颠簸的幽灵帆船）。

Copycat 当然没有那么宏大。它在字母字符串之间寻找类比。如果霍夫施塔特告诉他的程序 abc 变为 abd，然后他问，“pqr 变为？”它会回答 pqd，或者，更好的是，pqs——大多数人可能也会这样回答。为此，Copycat 必须能够以多种不同方式描述每个字母字符串的结构，并且它必须以某种方式决定哪种描述是生成类比的正确或最佳描述。例如，假设你得到字母字符串 ffmmtt。你可能会将其描述为三对字母。如果你得到 klmmnotuv，你可能会将其视为三个字母组。在每种情况下，字母 mm 的感知方式都不同：作为一个整体或作为两个不同整体的一部分。如果你只得到 mm，你就没有理由将其视为任何一种。正是上下文促使你以某种方式描述输入，并可能放弃初始描述而采用另一种描述。

字母串并非人类的乐趣，甚至也不是噩梦。但是，Copycat 仍然是一个高度复杂的程序。想象一下，如果它要模拟更复杂、更有趣的概念，比如自杀或背叛，它会变得多么复杂。霍夫施塔特的目标不是模仿诗人的想象力，而是展示创造力所需的思维流动性，其中类比对上下文的敏感性就是其中一部分。

Copycat 能够处理一个新情况并探索一系列可能的类比，然后判断这些类比中哪个更好。思考这个谜题：如果 abc 变为 abd，那么 xyz 变为？Copycat 给出 xyd 以及其他几个答案，但它认为 wyz 是最好的。为什么？因为生成它的描述不那么明显，推理更深奥。要生成 wyz，你必须认识到 abc 和 xyz 是字母表的开头和结尾，D 是 C 的后继，但 Z 没有后继，而且后继和前驱是相反的。你还必须决定三次反转：向后而不是向前遍历字母表，用前驱代替后继，然后再次翻转序列。相比之下，要得到答案 xyd，你只需认识到 Z 没有后继并复制 D。

因此，Copycat 为我们提供了一个例子——尽管粗糙——说明计算机如何运用审美判断。霍夫施塔特的工作比大多数人工智能程序更接近人类思维，因为那些程序结构过于僵硬，无法识别除了程序员预先想到的类比之外的任何类比。当然，评估字母串与判断绘画或旋律相去甚远，而且如何从这里达到那里也绝非显而易见。说到底，我们对人类思维过程的了解仍然非常粗略。创造力在很大程度上仍是一个谜。

那么，赋予伟大艺术作品连贯性和目的的艺术远见又如何呢？计算机能否被编程具备这种远见呢？这可能是所有谜团中最大的一个。首先，没有人真正知道这种远见在创作行为中扮演什么角色。一位艺术家可能一开始就对自己的方向有一个清晰的认识，心中有一个特定的效果，而另一位艺术家则可能让远见在创作过程中逐渐显现。霍夫施塔特说：“当我画画时，我坐下来，完全不知道自己要做什么，没有任何远见。然后我开始画，它就变成了：好的，我们开始吧；我不知道我们接下来会怎么做；我将让它在过程中发展。”也许在足够丰富的计算机模型中，远见也能显现出来。

霍夫施塔特认为，如果计算机能足够大、足够快，足以媲美人类大脑的巨大复杂性，那么在计算机程序中捕捉构成创造性思维的过程是可能的。“人们现在在计算机上模拟星系的演化，他们得到了他们从未预测到的惊人结果，”霍夫施塔特说。“你不会说蚂蚁是智能的，但集体而言，蚂蚁建造了奇妙的桥梁。我们甚至无法想象我们是由多少个细胞组成的。同样，我认为人类思维极其复杂，但它并没有任何我们无法在计算机程序中捕捉到的根本性东西。这只是一个复杂性问题。”

如果霍夫施塔特是正确的，那么我们最终可能不得不决定是否接受计算机程序的审美判断，以及是否承认它们的重要性或实用性。有人可能会争辩说，程序的丰富性无关紧要：计算机艺术根本不是艺术，只是一种空洞的模仿。无论介质是什么，计算机的作品都无法表达痛苦、勇气、同理心或智慧。也许是这样。但即使计算机的艺术概念对我们人类来说无关紧要，这也不妨碍计算机拓宽我们的审美视野。

科恩说：“亚伦不是人类，也无意成为人类。我的目标是让亚伦发展自己的个性，看看这种特殊的智能能做什么。”如果一台计算机具备发展出一种新型音乐或绘画的远见呢？仅仅因为创新是由计算机产生的就拒绝它，那将是摒弃大量引人入胜的美丽艺术品。我们会是输家。