1997 Discover Awards：声音：声波束

获奖者：American Technology Corporation 的 HyperSonic Sound System

创新者：Elwood Norris

Elwood Norris 想要淘汰有源音箱。他将永远摒弃那种只有发烧友才喜欢、笨重的低音、高音和中音扬声器组合，取而代之的是一个和奥利奥饼干一样大的单一扬声器。

Norris 称之为 HyperSonic Sound System，它并非普通的扬声器。它没有振膜，而是使用一个晶体片，可以像聚光灯一样将声音束投射到房间里。当声束撞击墙壁或天花板时，它会反弹回来，产生声音源自该点的感觉，就像木偶师抛出自己的声音一样。为了实现立体声效果，两束声可以对准房间或剧场的相对两侧。Norris 说，你可以将每个声束聚焦在一个点上，声音就会在那里产生。他还补充说，同样重要的是，他产生声音的新方法在人类听觉的整个范围内比最昂贵的扬声器失真更少，效率也高五到十倍，因此需要的功率更小。

这听起来近乎神奇，但 Norris 的声光灯依赖于一个简单的效应，该效应在 150 年前由物理学家 Hermann von Helmholtz 首次解释。当在风琴上大声演奏两个音符时，他注意到还会产生第三个音符，其频率是其他两个音符频率之差。Norris 的设备也做同样的事情，但它用晶体代替了风琴，晶体产生两个高频的强大声束，其频率超出人类听力范围。这两个声束相互作用，产生一个复杂的超声波，其中一个分量是两个频率之差。你听到的就是那个分量。例如，要产生 440 赫兹的音符——中央 C 上方的 A——Norris 生成一个包含 200,000 赫兹和 200,440 赫兹音调的超声波。只有这两个音调之间的差值——440 赫兹——才是可听的。

Norris 并不是第一个以这种方式叠加超声波束的人，但他成功地在电子上混合了几个信号，并通过单个晶体发送，该晶体振动并发出一个叠加的超声音符束。由此产生的声音保留了超声波的一个有用特性——它是定向的，这意味着你只能在你正对着 Norris 的扬声器时听到声音，或者当它从平面反射回来时，例如剧院墙壁。

Norris 是加利福尼亚州 Poway 的 American Technology Corporation 的创始人兼首席技术官，他花了四年时间才使这个想法得以实现。他说，这基本上是一项车库项目。他去年早些时候产生了第一个可听声音，并希望在 1997 年底前将低保真产品推向市场。

决赛选手

寂静无声

BBN Systems and Technologies 的 QuietChip

创新者：James Barger

James Barger 说，当你开车时打开它，感觉很奇怪。你的第一反应是旁边车道的汽车突然变响了。当然，事实并非如此。而是你自己的汽车发出的声音——引擎的轰鸣声，轮胎的尖叫声——几乎消失得听不见了。相比之下，周围的世界似乎更吵了。

就像两个水波如果一个波谷遇上另一个波峰就会相互抵消一样，两个精心匹配的声波也可以相互抵消，产生近乎寂静。Barger 的公司 bbn Systems and Technologies，总部位于马萨诸塞州剑桥，多年来一直在制造反噪声系统，它们的作用正是如此，但这些系统是为海军舰艇和商用飞机设计的。将这项技术用于降低家庭汽车的噪音将花费 50,000 美元——即使对于豪华车市场来说也太贵了。

然而，到 1994 年，Barger 意识到电子电路已经足够小，可以制造出价格合理的反噪声系统。他和他的同事花了两年时间，将分析汽车、船只或小型飞机产生的噪音、计算合适的反噪声并向扬声器发送抵消信号所需的一切都集成到一块集成电路芯片上。结果就是这个两英寸见方的 QuietChip。

去年 12 月，Barger 在一辆雪佛兰 Cavalier 上对其进行了测试。安装在发动机和乘客舱内的麦克风和其他传感器将噪音输入 QuietChip，然后 QuietChip 将相应的反噪声输出到汽车的音频扬声器（即使收音机在播放，它也能工作）。bbn Systems and Technologies 预计将在明年某个时候开始向汽车公司销售该芯片。如果一切顺利，几年内新车将会变得异常安静。

将音乐带到网络

MIT 的 NetSound

创新者：Michael Casey

在创建自己的万维网主页时，Michael Casey 感到很沮丧。他说，我想在上面放一首音轨，由于他曾是一名专业的音效制作人，他自然想制作高质量的音轨。但互联网对于传输高质量音频来说太慢了。即使使用了数据压缩技术和高速调制解调器，下载一个五分钟的音频片段也要花费大约十分钟。

因此，作为 MIT 媒体实验室的研究生，Casey 开始着手改变计算机处理声音的方式。按照目前的标准，从雷声到莫扎特奏鸣曲的一切都被表示为数字录音，计算机每秒对声波进行数万次采样，并将其记录为一串数字。Casey 想，与其在所有情况下都必须组装和传输大量数据，不如描述声音让计算机重新创建它会更有效率。

Casey 说，你必须问：一个声音最重要的信息是什么？这就是你提取的内容。例如，创建一个模型来模拟脚步声的样子，就能让计算机产生数千种不同的脚步声——快速的或慢的，沉重的或轻的，在木头、混凝土或大理石上的脚步声。使用这种模型，Casey 可以用惊人少的数据生成逼真的声音。例如，要传输一首交响乐，他会发送乐谱以及每种乐器的声音模型；另一端的计算机将根据这些信息重构整个交响乐。

去年 10 月，Casey 将几种不同的模型组合成了一个概念验证程序，名为 NetSound。与传统的数字采样方法相比，通过安装了该软件的两台计算机之间传输音乐所需的数据至少要少一千倍——理论上，目前录制的所有古典音乐都可以存储在一张光盘上。然而，Casey 承认，虽然音乐音准完美，但会缺乏人类演奏的温暖和个性。因此，他认为他的发明将补充而不是取代传统的录音方法。例如，它可能有助于为电脑游戏提供通用且令人信服的音效。或者，它还可以用于一个程序，允许坐在键盘前的人充当指挥，根据自己的喜好塑造演奏。目前他正在努力使他的技术被接受为行业标准。

像人一样说话

芝加哥大学和微软的 Speakeasy

创新者：John Goldsmith

这是一年最好的时光，也是一年最坏的时光。John Goldsmith 会用一个音高的变化来强调这两个关键词，来朗读《双城记》的这句名言。然而，他的电脑程序显然还有一些 bug。它朗读的却是：这是一年最好的时光，这是一年最坏的时光。

尽管如此，这比其他电脑程序能达到的完全平淡的单调音调有了很大的进步。Goldsmith 说，虽然计算机已经能够产生清晰可辨的语音好几年了，但其语调非常平淡和人工，听起来令人痛苦，一次不能超过两三分钟。

1995 年，在从芝加哥大学语言学系休假期间，Goldsmith 开始纠正这一不足，并教会计算机模仿人类说话者的语调模式——音高升降。他制定了一系列规则，反映了美国英语说话者在说话时如何改变音高。例如，在“你吃晚饭了吗？”这样的“是/否”问题中，主要重读的词——“晚饭”——用最低的音高说出。相比之下，在“什么时候吃晚饭？”这样的“为什么/什么/哪里/何时/如何”问题中，同一个关键的词的音高最高。在 Goldsmith 休假期间工作的微软研究院，他将这些规则变成了一个他称之为 Speakeasy 的计算机程序。

从那时起，开发就通过反复试验进行。他会输入一些测试句子，比如狄更斯的那句话，看看电脑出了什么错。他说，你修复一个问题，然后是另一个，然后是第三个和第四个。与此同时，Speakeasy 在越来越多的句子结构中，其语调越来越像人类——尽管 Goldsmith 说，你仍然知道它是电脑。他去年九月完成了这个程序，但微软没有透露对这项技术是否有任何计划。与此同时，Goldsmith 正在努力教他的程序像人类一样在语音中插入停顿。也许有一天，他甚至会把它变成口误。