广告

未来浪潮

在一个寒冷多雪的日子里,英格丽德·达贝奇在杂乱无章的波浪线中看到了丰富的隐藏含义。如今,达贝奇的小波是当前最热门的数学之一。

Google NewsGoogle News Preferred Source

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

当时我在蒙特利尔讲学,天气冷得要命。我试图去看看这座城市,但我只能在户外待上几分钟,就不得不匆匆跑回室内喝杯热饮取暖。所以,我有点被迫待在酒店房间里——计算。英格丽德·达贝奇回忆起她1987年2月发现一种特殊数学结构“小波”的重大时刻,这随后在应用数学界引起了阵阵兴奋。那是一段极度专注的时期。“我订婚了,同时又完全沉浸在我的想法中,即使在观光、洗头发或做饭的时候也是如此。但后来一切都很快就水到渠成了。到三月底,一切都完成了。我感到精疲力尽又兴奋不已。然后我们结婚了。”

广告

当我去年六月,气温徘徊在90度左右时,她向我讲述这段经历时,很难想象她艰难地穿过蒙特利尔的雪堆,捂着冰冷的耳朵,脑海中却飞速旋转着小波的图像。我们坐在她家乡布鲁塞尔的一张摆满了玫瑰、草莓和西瓜片的桌子旁,喝着冰茶,透过敞开的法式窗户,我们可以听到她两个蹒跚学步的孩子在草坪上玩耍。但她智力冒险的兴奋在她湛蓝的眼睛里闪烁着,随着她寻找将数学思维过程转化为普通词语的方法,她的语速也越来越快。

达贝奇(发音为 DOhB-shee)迅速成为世界领先权威之一的领域是信号处理——应用数学的一个分支,它关注信号的分析、传输、操纵、存储和重建。信号只是一条波浪线,就像一年中每日温度的图表,或者人脑微弱电输出的轨迹。信号处理在物理学、天文学、计算机科学、工程学和医学中的应用是无限的。达贝奇明显地乐于其工作的跨学科性质:她喜欢与不同领域的人交流,并帮助他们将她的见解和成果应用于他们各自的特定问题。

信号处理并非只有科学家才做。我们所有人无时无刻不在做,无需思考。想想我们眼睛和大脑无与伦比的能力,能从看似无意义的背景中提取隐藏的图像。在国际畅销书《魔眼》(Magic Eye)及其续集中,那些看似随机的彩色斑点和条纹——看起来像点画抽象画,但实际上是由强大计算机程序生成的图案——结果却是令人着迷的图片谜题。只要眼睛肌肉足够放松,再耐心一点,观察者很快就能发现三维图像,例如长着翅膀的狮子,仿佛显示在页面后方的舞台上。图像从混乱的前景中开始凝聚的神奇时刻,证明了这本书的标题,也证明了人类思维的力量——这种力量远远领先于技术。目前还没有任何机器人能够接近复制任何聪明学龄前儿童几分钟内就能掌握的模式识别壮举。

魔眼戏法最令人惊奇的特点是,狮子一直潜伏在画面中,完全暴露在观察者眼前。所有关于其三维形状、天使翅膀等复杂信息,都清晰地显示在打印页上——只是以正确的方式收集这些信息的问题。这种解码任务是应用数学家所说的图像处理的一个复杂例子。

即使在一维空间中,图像处理的难度也显而易见,远在平面几何和立体几何的特殊性使问题复杂化之前。在一维空间中,人们谈论的是信号而不是图像,但这两个概念密切相关。对于一个典型的信号,可以想象麦克风的输出,它通过将空气对薄膜表面的波动压力转换为电流来捕捉声音。该电流湍流振荡的记录构成了一种称为时间序列的信号。它可以由笔在移动的纸条上记录,或切成数字数据位并以电子方式存储,或通过跳动的亮点在示波器监视器屏幕上描绘成锯齿状的线条。

想象一下,麦克风安装在一扇俯瞰繁忙城市街道的敞开窗户上,而对面房子里的女孩弹奏了一段中央C。在这难以穿透的麦克风信号丛林中,那段音符就隐藏其中。人耳无法从街头噪音中分辨出来,眼睛也无法在示波器跳动的轨迹中感知到其优美的模式。找到那段音符是对信号处理技术的考验。这是一个简单的,一维的类比,就像在迷幻的彩色斑点大杂烩中找到一只带翅膀的狮子——但它并不容易。

在过去的十年里,信号处理科学经历了一场革命,这场革命主要由小波掀起。现代计算机的速度,加上小波分析的精确度,现在赋予信号处理器前所未有的能力,能够从城市喧嚣中恢复那个孤独的音符,在混乱的无线电信号星系中看到一颗星星,从一大团无害的组织中找出潜藏的肿瘤。然而,尽管工具是新的,但技术却是旧的。小波分析本质上是对19世纪初法国数学家兼物理学家让-巴普蒂斯特·傅里叶发明的方法的改进。

傅里叶发现,任何信号,无论看起来多么复杂,都可以通过添加足够数量的简单、规则的曲线——正弦波来重现。所有正弦波都是无限长的蛇形,形状完全相同且不变。两个特征将一个正弦波与另一个正弦波区分开来:波的振幅(或每个波峰的高度)和它的频率——单位时间内记录的波峰数量。计算机可以通过将不同振幅和频率的多个简单正弦波叠加在一起来重建任何信号,无论其多么复杂。当然,随着构成波的数量增加,所得信号的复杂性也随之增加。

但傅里叶更进一步。他不仅演示了信号如何合成,还展示了信号如何分析。给定一个信号,你如何找到构成它的波?你如何将它分解成构成它的简单正弦波——可以说,是信号处理的不可约原子?他发现的解决方案在实践中很费力,但对计算机来说却是轻松的工作。这是一个数学过程,充当一种过滤器,用于找出任何特定正弦波对任意信号的贡献程度。构成信号的波的振幅和频率的列表称为其傅里叶表示。有时它被称为傅里叶谱,因为它类似于任何光混合物中纯色强度的汇编。

广告

假设麦克风对面房子里的女孩弹奏了中央C,并让它回荡。除非街头噪音压倒一切,否则对信号的傅里叶分析将以惊人的精确度识别出这个音符并确定其振幅。从构成麦克风接收到的声音的波形列表中,中央C的非凡强度和持久性将像一根突出的拇指一样引人注目。

傅里叶分析不仅擅长识别钢琴回响的音符等信号,而且还能以一种非常简洁的方式描述它们。工程师们喜欢这种速记方式,称为压缩,因为它通过减少描述信号所需的信息量,帮助他们更有效地在拥挤的通信线路上传输信号。连续信号原则上包含无限多个值,或以数字化形式包含大量数据点。传输那个中央C需要每秒测量信号数千次,只要它回响,然后发送这些值。然而,有了傅里叶分析,所需的一切就是信号的每个组成正弦波的振幅和频率列表。正弦波有一个方便的属性,就是它们会一直持续下去,直到被告知停止,所以每个波都隐含地代表无限多个点。因此,它们是长而规律的信号的理想速记。

广告

但傅里叶分析尽管优雅且强大,却有一个严重的缺点:它无法很好地处理短时信号。假设街对面的女孩放弃了钢琴,敲击了一面钹。示波器将显示由此产生的突然、短暂而响亮的信号,表现为一根又高又窄的尖峰。对这个信号进行傅里叶分析会得到大量高频波——每个波都是无限持续的。当它们叠加时,它们会相互抵消,除非在它们全部相互增强以产生尖峰的那一个时间点。所有组成部分,单独来看,都分散在时间中,因此无法重现尖峰的精确时间。对于这种特定信号的时间结构,原始时间序列(其中钹的撞击像一个突出的拇指)被证明是一个更好的表示。

傅里叶分析在描述频率方面的成功以及在重现精确计时方面的失败,是信号处理基本原理的体现。应用于声音,该原理指出:你对音高了解得越准确,你确定它被敲击的时间就越不精确,反之亦然。这种洞察力与量子力学的一个著名结果不谋而合并非偶然。海森堡著名的不确定性原理规定,如果你确定一个粒子的位置,你就对它的速度知之甚少,反之亦然。事实上,不确定性原理不过是信号处理应用于原子领域的结果。

从这个角度看,傅里叶谱和时间序列代表了显示信号的两个极端:如果你想知道女孩钢琴上敲击的音高,你就使用频谱;如果你想知道她何时敲击钹,你就使用时间序列。

当然,在实际的日常生活中,我们两者都想要:我们希望从麦克风信号的混乱中提取音高和时间信息。事实上,有一种古老的声学信号表示法,以无与伦比的经济性记录了这两者——那就是我们熟悉的乐谱系统。通过表示每个音符的时间和音高,并省略了大量次要信息,如所需的精确音量水平和区分伟大音乐与机械复制的无限微妙调制,乐谱专注于乐谱中被认为是至关重要的属性。几十年来,信号分析师一直在努力开发一种技术对应物,以实现中世纪音乐抄写员通过在五条平行线上放置黑点而达到的精彩妥协。

广告

时间序列与傅里叶表示最明显的结合是,将信号划分为一系列有限的时间段——在信号分析术语中称为“窗口”——然后为每个时间段找到合适的傅里叶表示。这种方法称为“加窗傅里叶分析”,是乐谱的数学版本。每个窗口对应一个特定的、短的时间间隔;其傅里叶分析则对应于该间隔内听到的音符。这种表示的元素——可以从中构建任意复杂信号的原子——是短时波列。它们类似于蛇形尺蠖,是后来被称为“小波”的祖先。

对于某些目的,加窗傅里叶表示被证明是一种足够的折衷方案,但它也存在一个严重的缺陷。由于每个窗口都有固定的有限长度,因此无法非常精确地定位信号中的尖峰:您可以确定尖峰属于哪个窗口,但无法确定它在该帧内确切出现的位置。

所有这些,英格丽德·达贝奇在蒙特利尔冰冷的街道上蹒跚前行时都已熟知。但她也意识到各种与该主题相关的新进展,涉及量子理论、地震学和计算机视觉等不同领域。她觉得,需要的是将所有这些线索综合起来,从而更好地表示信号。而她也找到了一个。

达贝奇提出了一种数学分析信号的方法,这种方法对于钹的撞击和类似信号效果很好。傅里叶分析将复杂信号分解为组成正弦波,而达贝奇的方法则将它们分解为小波。这些巧妙制作的小波具有奇妙的数学特性。其中之一是,每个小波的长度在数学上与它所代表的音高相关——音高越高,小波越短。由于钹的撞击包含许多高频成分,因此其组成小波很短;相比之下,中央C则包含较长的小波。达贝奇的小波也没有冗余,这意味着每个小波都是它所代表的复杂信号的必要组成部分。相比之下,加窗傅里叶分析中使用的组成正弦波具有大量的冗余,因此它们包含的信息比重建信号实际所需的信息要多。

广告

达贝奇并没有发明小波。数学家们之前曾摆弄过这些小东西,但他们无法让它们发挥特别有用的作用。事实上,在达贝奇发现她自己的小波家族之前,应用数学家们几乎确信,可行的小波分析是不可能的。与此同时,傅里叶分析也留下了一些不足之处。傅里叶巧妙地逐个频率进行滤波的方法依赖于无限长正弦波的完美平滑性和规律性。达贝奇发现自己被迫构建具有前所未闻特性的小波。与加窗傅里叶表示的短而平滑的元素相比,她的小波具有分形特性,这使得其中一些看起来像阿尔卑斯山的悬崖。但是,正如她向我保证的那样,计算机并不在意视觉美学,那些笨拙的岩石隐藏着奇妙的数学特性。“我想我们只能接受它们的样子,”她带着母亲般的关切说道,谈及她的朴实创作。

至于有效性,实践是检验真理的唯一标准。小波在嘈杂的信号中能多好地找出音符和钹声?为了验证这一点,达贝奇准备了一个模拟测试信号,包括两个音高相似的持续音符——例如C和升C——以及连续两次钹声。然后她对信号进行了加窗傅里叶分析和小波分析,结果惊人。加窗傅里叶表示能够区分两个长音符的音高或两个尖峰的时间,但不能同时做到两者。另一方面,小波则明确地分辨出两个频率和两个峰值。它们可以说是同时充当了显微镜和望远镜。达贝奇的分析,在某种意义上,是两种不兼容的信号记录方式之间的最佳折衷。

广告

我问达贝奇她是如何想象她的小波的。她解释说,她不以公式或文字来思考,主要是以图像来思考。为了说明它们是如何出现在她脑海中的,她画了一系列点来代表数字化信号的数据,然后通过从顶行的一个点发出并向底部扩展的树状结构将它们连接起来。在图画的底部和右侧,她放置了更多的点,以表示该方案一直持续到信号的末尾。然后,她用模拟的努力,手掌向上,手指张开,将一个无形的物体向前推离身体,解释了她如何在脑海中推拉这些连接的点,迫使它们形成不同的图案。在这个过程中,她突然意识到,如果她足够聪明,这种推动,而不是产生无休止变化的图案,最终会让这些点安定下来,形成一个稳定的图案。这就是她发现她的小波的方式。

尽管我对其含义只有模糊的理解,但她的话语却清晰地让我想起了爱因斯坦如何描述自己的思想:“文字或语言,”他曾回答采访者的问题,“无论是书写还是口头表达,似乎在我的思维机制中都不起任何作用。作为思维元素出现的心理实体是某些符号和或多或少清晰的图像,它们可以被‘自愿地’再现和组合……上述元素在我的情况下,是视觉的和某些肌肉类型的。传统的词语或其他符号,只有在次要阶段才需要费力地寻找。”在遇到英格丽德·达贝奇之前,我从未完全理解他所说的“肌肉类型”是什么意思。

当世界各地的应用数学家了解到达贝奇小波的卓越特性后,他们开始将其融入自己的工作中。如今,紧支撑正交小波基,通常称为达贝奇小波,已成为信号处理数学工具的基本要素。但达贝奇希望做的不仅仅是证明漂亮的定理——她首先想提供帮助。“小波只是一种工具,”她坚称,“简单、多功能、强大的工具,可以完成各种各样的任务。这就是我在所有演讲中强调的。”

这些天,她收到了很多讲座邀请。她的受欢迎程度部分归因于她高度重视确保自己的观点被理解。在她向应用数学领域之外的人演讲之前,她会先学习他们的语言,并寻找他们熟悉的示例。“我并不假装自己是工程师、医生或等离子物理学家,但我会努力了解他们是如何以自己的方式处理信号处理的,而不是试图将我的语言强加于他们。”

她的工作的一个应用是在湍流系统中发现有意义的模式。无论是水龙头喷涌而出的水,还是空气猛击飞机机翼表面,亦或是炽热带电气体在核聚变反应堆中疾驰,描述这些过程的底层数学方程,尽管已知,但过于复杂,即使是最大的超级计算机也无法求解。在湍流系统的描述中寻找秩序,主要是图像处理的一项艰巨任务,而图像处理本质上是多维信号处理。任务是在不断变化的数据混乱迷宫中,发现肉眼看不见但却预示着意想不到力量存在的持续漩涡。诀窍是找到隐藏在看似随机数据中的带翅膀的狮子。但是,除非知道要寻找什么,除非事先对这些漩涡可能的大小和形状有很好的概念,否则它们就会逃脱普通分析。小波可能做得更好。

小波分析的另一个应用取决于其压缩信息的能力。FBI收集的每一枚指纹最终都将被数字化为约8000万个数据位。随着时间的推移,联邦调查局已经积累了数亿枚这样的指纹,因此它将面临信息泛滥的危险。因此,FBI评估了不同的图像处理技术,以寻找最有效地从这场信息洪流中消除冗余数据并促进压缩数据传输和检索的技术。通过将原始数据量减少约20倍,并且仍然能够重现比其竞争对手更清晰的图像,小波表示赢得了比赛,并且现在正在实施中:未来,罪犯将归咎于英格丽德·达贝奇的定理。我怀疑这场胜利的一部分可能与她向训练有素的非本领域人士传达复杂思想的卓越能力有关。

广告
广告

但她目前最喜欢的应用与流体力学或犯罪学无关。她最近加入了普林斯顿大学的数学系,在未来几个月里,她计划与生物医学研究专家密切合作,将她的小波应用于心电图、脑电图以及各种现代医学图像的分析。

例如,心电图是心脏产生的电信号的长图表。除了明显的脉搏周期性之外,未经训练的观察者看到的只是一堆不规则的噪声。但对专家来说,这份记录编码了关于我们最重要肌肉功能的丰富隐藏信息。想象一下,如果这份记录能够数字化、存储并随时检索,以便与同一心脏的不同轨迹进行比较,或与他人的轨迹进行比较,最重要的是,进行统计分析,对专家来说将是多么大的帮助。小波既然能够从街头噪音中发现音符或钹声,难道它们就不能发现那些逃过表面检查的细微异常或疾病迹象吗?即使这样的程序不能取代专家的经验之眼,它也能加快初步筛查,并能将现代医学的好处带给今天无法获得它的人。英格丽德·达贝奇是这样希望的。

无论她在将高深数学应用于生物医学问题方面取得怎样的成功,无疑都将体现她独特的风格。正如她的小波旨在在两种相互矛盾的表示方式之间取得最佳折衷一样,她的整个职业生涯都以她有意识地努力调解不同方法、发现学科间的共性以及在多样性中寻求和谐与连贯为标志。

那天在布鲁塞尔的会议结束时,我问她对《魔眼》有什么看法。她略带遗憾地承认,她从未能够充分放松眼睛,从而找到那只带翅膀的狮子。但我想,对于一个内心拥有如此强大而清晰视野的人来说,这算不上什么大损失。

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章