广告

1992年 Discover 奖:计算机硬件和电子产品

了解视频压缩技术如何使 AT&T 的 VideoPhone 2500 能够通过标准电话线传输清晰的视觉图像。

Google NewsGoogle News Preferred Source

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

这有点像从橙汁中提取水分制成浓缩汁,然后稍后再加水将其变回橙汁。这就是 Compression Labs 的 Todd Townsend 描述视频压缩过程的方式,这项技术使 AT&T 新推出的 VideoPhone 2500 成为可能。VideoPhone 是第一种通过现有电话线传输音频和全动态彩色视频的实用方法。

广告

一个多世纪以来,视频电话一直是科幻小说的题材;从《杰森一家》和《飞侠哥顿》到《星际迷航》等节目,视频电话都扮演着重要角色。尽管自 1964 年 AT&T 在纽约世界博览会上推出 Picturephone 以来,技术上就已可行,但没有人能够找到制造实用型号的方法。

20 世纪 80 年代,索尼和三菱推出了价格低廉的即插即用视频电话,但这些电话只能传输黑白静态图像,并且在图像传输过程中必须暂停对话。视频会议在 20 世纪 80 年代成为企业文化的一部分,但需要专用网络和昂贵的设备。

VideoPhone 是一款外观普通的商务电话,可插入任何标准电话插孔。唯一的区别是翻盖式视频屏幕,可以显示对方的实时图像,以及一个视频按钮,允许任何一方随时阻止使用视频屏幕。

为了配置其 VideoPhone,AT&T 的研究部门开发了一种新的高速调制解调器,可以将声音和图像信息通过电话线传输。然而,实现可用的视频电话的最大障碍是找到一种方法,将数据需求量大的视频图像——每秒消耗 9200 万比特(比特是信息可能的最小单位,即计算机语言中的 0 或 1)——通过现有的国家电话网络传输。该网络每秒只能处理 19,000 比特。

为此,AT&T 求助于加州圣何塞的 Compression Labs。Townsend 拥有七项数字电话传输专利,是 VideoPhone 压缩技术的架构师。他采取的第一个也是最简单的步骤是将系统内置摄像头捕捉的图像数量从每秒 30 帧(广播电视的标准)减少到 10 帧。这一下子就消除了大约 6000 万比特。即使每秒 10 帧,该电话的定焦摄像头也能产生相当于大多数摄像机的输出图像。考虑到摄像头的镜头直径只有一枚硬币大小,这已经很不错了。

接下来,Townsend 和他的团队通过在 VideoPhone 上使用小型 3.3 英寸方形电视屏幕,又节省了一部分信息。屏幕越小,创建图像所需的像素就越少。虽然传统电视的分辨率为 300 x 400 像素,但 VideoPhone 屏幕的分辨率为 112 x 128 像素。

但视频压缩中最重大的创新是 Townsend 的编解码器(codec),一个内置于每个 VideoPhone 的编码和解码设备,它只忽略动态图像中最关键的部分。编解码器仅处理图像中从一个瞬间到另一个瞬间发生变化的部分,使 VideoPhone 能够传输和接收最少量的必要信息。

编解码器将整个屏幕划分为 224 个块(每个块为 8 x 8 像素),每秒分析每个块十次。如果一个块中的图像从一帧到下一帧没有变化,编解码器就不会重复传输该块的数据。相反,编解码器会保持屏幕上的同一图像,直到它发生变化。例如,如果呼叫者后面有墙纸,则不需要发送有关该背景的任何新信息,除非,当然,呼叫者的头部遮挡了它,或者它着火了。如果图像从一个瞬间到下一个瞬间发生微小变化——例如嘴唇移动——编解码器就会知道只发送两个图像之间的差异。

如果一个块发生重大变化——比如挥手——编解码器会完全重新编码该块,新图像将完全取代旧图像。但由于大多数视频电话通话显示的是一个人的脸,因此在通话期间,VideoPhone 图像的大部分内容保持不变。

广告

最终,信号的视频部分从每秒 9200 万比特压缩到仅 11,200 比特。原始图像数据的 99% 以上被删除,压缩因子为 6000:1。

VideoPhone 将压缩数据转换成可以发送的标准电话线的音频声音——价格与普通电话呼叫相同。这种声音类似于你不小心拨打传真机时听到的刺耳声。Townsend 说,这是一种绝对的音调和音符的森林,非常复杂且交织在一起。

广告

在电话呼叫的另一端,接收 VideoPhone 中的编解码器会监听这种刺耳的声音并解压缩信号——将水重新添加到橙汁中。生成的图像质量不如标准电视,但却令人惊讶地清晰。

Townsend 的工作在去年春天达到了顶峰,当时他从圣何塞打了一个 VideoPhone 电话到印第安纳波利斯的 AT&T 实验室。Townsend 回忆说,连接建立后,我终于能看到与我一起工作了一年半的人们了。每个人都围着摄像头,欢呼雀跃。

视频屏幕在我们工作、娱乐、接收新闻、形成观点以及现在我们如何沟通的方式中扮演着日益重要的角色。当然,看到电话线另一端的人有很多好处。祖父母可以在出生后几分钟内看到新生儿,分散的家庭可以一起分享节日。视频电话可能最终会成为一个巨大的噱头,就像四声道立体声一样,但也有可能它们会像按键取代了转盘拨号一样,将只有声音的电话淘汰。然而,如果 VideoPhone 要真正普及,1500 美元的零售价将不得不大幅下降。

Jon Krakower 和 Jon Sedmak,苹果电脑(加州库比蒂诺)的产品设计师,因开发 Macintosh PowerBook 系列便携式笔记本电脑而获奖。这些设计精美的电脑拥有台式 Mac 的全部功能,而且轻便、经济实惠、易于使用。每台 PowerBook 都配有一个颠倒放置的鼠标,即轨迹球,使用户能够快速在屏幕上导航。设计师将用户舒适度和便利性置于首位,这是便携式计算领域的一项大胆成就。

广告

Jerry Erickson,惠普公司(俄勒冈州科瓦利斯)的研发部门经理,因开发 HP 95LX Palmtop PC 而获奖。这款计算器大小的电脑重达惊人的 11 盎司,拥有传统台式机的所有处理能力。它内置 Lotus 1-2-3 电子表格软件、一个时间管理系统、备忘录书写功能和一个易于使用的电话簿。HP 95LX 可以在任何时间、任何地点,在用户手中提供移动信息和分析。

Kamran Elahian,Momenta 公司(加州山景城)前董事长,因开发 Momenta Pen-top 便携式笔记本电脑而获奖。这款独特的模块化计算机可以运行所有 DOS 和 Windows 应用程序,并允许用户使用笔或传统的键盘作为输入设备。除了向打字不识字的人们敞开计算机世界的大门外,基于笔的输入系统还允许人们在不方便使用键盘的会议和其他场合使用 Momenta。Momenta 可以捕捉电子墨水来记笔记、绘制图形并将手写体转换为文本。虽然它只有三环活页夹大小,但功能强大的 Momenta 甚至包含一个传真机。

Yoshitaka Ukita,索尼公司(东京)的产品设计师,因开发 Data Discman 电子书播放器而获奖,这是第一款将 CD-ROM 光盘和电子书的强大功能和多功能性集成到易于携带的设备中的产品。Data Discman 配备了各种软件,涵盖教育、娱乐、商业和健康等主题。每张光盘可以存储超过 100,000 页文本、32,000 张图形或长达 5.6 小时的音频。现在存储在 CD-ROM 上的海量信息的检索不再局限于精通 PC 的用户及其台式机外围设备。

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章