如何使便携产品产生空间音频
扫描二维码
随时随地手机看文章
提示:
.扬声器数量及其间距限制了便携立体声系统的声场。
.空间音频试图人工重新制造出真实世界里聆听声音的体验,或者建立一个并不实际存在的感官空间环境。
.使用HRTF(人头相关传输函数)信息,可以对双耳的声音做合成,使之仿佛来自聆听者所处空间中的任一点。
.声学波束形成功能使音波指向某个方向,而不是扬声器的典型辐射模式。
.通过一个扬声器阵列提供空间立体声,需要一种有效的串扰抑制算法。
.很多方法都可以提供空间音频,但对于一台小型便携设备上的任何合理尺寸,它们大部分都不适用。
一个立体声音响系统所产生的声场通常受制于扬声器的物理位置,并且聆听者收到的音响事件受限于两只扬声器的跨度。对于便携式的小型音响系统,用户感受到的立体声声场非常有限,几乎就是单声道。为克服这一限制,可以采用空间音频发声技术,扩展立体声声场,获得更好的串扰抑制,并增强某些空间定位性能。
空间音频
自然状态下,在你周围发出的声音本身就是有空间性的。声源是整个空间中一个小区域中的某个点,不过也有一些声源是发自广阔的区域,如地震和山崩。声音在环境中的各个物体上反射。你听到的是双耳的直射声和反射声,通过人的一些听觉处理后,最终辨识出声音。你可以对处理过的声音作出一些判断,用一些标志确定它们的特性,如方向、位置、响度、背景、品质、远近、音调、丰满还是单薄。如果有两个或更多声源,也可以确定每个声源相对于耳朵接收到的全部声音的混合特性。
空间音频这个词汇表示用电子或机械方式做声音的重现,它试图人工地重新创造出声音的真实世界聆听体验。另外,它还试图用人工改变再现的声音,创造出一种原来可能并不存在的感受空间环境。
空间音频重现的原理很简单:如果到达两个耳鼓的重现声波与某个位置上的真实声源完全相同,则你会感受到重现声仿佛来自该位置的一个音源。这与该声源是否发自其它位置无关。到达耳朵的声音数据经过大脑处理,最终特定出有关声音的各方面特性。
HRTF
耳朵的HRTF(人头相关传输函数)描述了你从空间某个点接收和处理声音的方式。频响HRTF描述了人体汇集声音信号的方式,以及耳廓(或外耳)与耳道在声音到达耳蜗前过滤信号的方式。环形对称的外耳(或耳廓)构成了形状特殊的天线,使经过位置相关和频率相关过滤的声音到达耳鼓,尤其是较高频率的声音。
图1 人头相关传输函数考虑了声波在不同时间进入人耳,并且由于两耳距离差而有不同强度,从而定位空间中的声源。
HRTF是对不同距离和方向所接收声音的左耳和右耳脉冲响应(或人头相关脉冲响应)静态测量值的傅里叶变换。ILD(双耳声级差)和ITD(双耳时间差)都来自每只耳朵所听到的声音(图1)。
每个人的HRTF都有差异,因为有时听力与身体特性有明显差别。但是,多个HRTF测量的数据库采用了一般的分类法,如男性或女性,以及年轻人或老人,通常用于那些需要HRTF的消费音频应用。这种测量可能要花很多时间,因为人们不可能长时间地将自己的头部保持在一个固定位置,因而得到的是不确定数据。于是,有些HRTF数据的创建者仅对仿真头做测量,这种仿真头是按照人类平均人头与人耳而建立的模型,避免了头部运动的误差。
你的耳朵能以三个维度确定声音的方向,前/后、上/下,以及两侧,角分辨率约为3°,另外还可以估计出距离,因为你的大脑、内耳和外耳会使用来自一只耳朵的单音,并与两只耳朵收听到的立体声(或声差)作比较。在自然环境下,个人已经通过多次试错和终身体验,了解了自己声音定位能力的准确度(即他们的HRTF数据),并能有效地补偿自己身体的形态与构成。
通过对现有声音信号采用适当的过滤器,并将声音与HRTF信息想结合,可以合成似乎来自空间中任何点的声音,从而获得专门针对每只耳朵的左、右声道声音。与耳机用户所体验到左、右声道分离类似,每个耳朵都只听到它应该听到的声音。比较来说,通过耳机播放的立体声音频信号似乎被限制在两耳之间的一条线上。这种原立体声和空间音频之间的差异产生了3D声,或虚拟声。
音频串扰
当两只扬声器距离聆听者有一定距离时,建立一个空间声音效果要困难得多,因为耳朵可以听到来自任何声道的声音,从而产生音频串扰。采用破坏波干扰可以抑制掉无用的信号,实现串扰抑制。反波(或抑制波)发送给右耳,抑制掉不想要的左声道音频信号(图2)。同样,左耳也处理不想要的右声道信号。结果是获得了明显的左、右声道增强区,提升了声音在3D空间中的感觉。
图2 串扰抑制采用破坏波干扰法,抑制不需要的信号。
这种对每个声道内声音的附加处理是有必要的,它可以消除或减少串扰效应,并考虑到聆听者所处位置对声音的可能影响,包括扬声器的角度与距离;不同年龄、性别或种族的耳朵灵敏度与形状;头部与躯干的尺寸与质量;以及所处物理环境,包括是否存在反射或吸收材料。所有这些因素都决定了一名聆听者能否以及如何精确地判断出一个声源位置。因此,用于扬声系统的空间音频创建技术还必须包括声学波束形成。
声学波束形成
扬声器音频重现中的声学波束形成是指将音频波指向某个方向的能力,而不是扬声器一般的辐射模式。理想的扬声器是一种处于无限反射板中的活塞式声源组,它的辐射模式取决相对于扬声器振膜半径的重现频率。声音波束的角度与扬声器活塞半径和声音波长之比有关。在低频时,扬声器的声音均匀地散播在扬声器前的所有方向上。因此,可以在屋子前面的几乎任意地方放置低音炮,而能从屋子中的任何地方听到相同质量的低音。
随着频率的提高,扬声器前的辐射模式越来越集中,逐渐成为围绕一根垂直于扬声器表面轴线的狭窄的锥形。在锥形内声压级最强,而在锥形外则快速跌落。在一部高保真音箱前,两边来回移动聆听高频声,就可以测得这种效应。
另外,实际扬声器都处于相对较小的有限箱体内,而不是无限反射板。箱体边缘会产生声波的衍射,从而导致更加复杂的辐射模式。如果将扬声器置于一个开放的地方,只要聆听位置处于与扬声器前立面垂直的轴线上,就可以正确地听到所有重现频率。
如果扬声器放在室内,则聆听位置就不再那么关键,因为墙壁和家具都会以各种角度反射声波。尽管反射便于人们从各种位置的聆听,但由于反射来自不同时间,携带了不同的原信号强度,因此获得的声音缺乏清晰度。
极端情况下的声学波束成形方法尝试将扬声器的声音能量指向室内环境中的某个角度。单扬声器的声学波束成形是困难的,因此一般应用都要使用两个或更多的扬声器。采用多只扬声器也可以通过声波能量的结合与破坏,创造出某种方向样式。
在一个多扬声器阵列中,阵列的大小与形状也使某种定向样式成为可能。阵列通常是线性的,但也可以是2维阵列,如曲线、平面、圆,或这些类型的组合(图3)。一般来说,在较高频下更容易实现和辨别出空间效果。不过,一个有良好低频响应的大型阵列与扬声器也能在低频端做出很好的方向性控制。
图3 用扬声器阵列波束成形技术,声波在期望的空间位置上产生有益的干涉。
阵列的尺寸与形状部分地决定了实现所需空间效果要采用的技术。另外一个因素是阵列建立的目的。例如,画中画功能可以让两个观看者看两个电视频道,但如果你想为电视机前端坐的几个人都仿真出一个5.1环绕声环境,就需要其它的技术。实际情况是,一个空间音频系统可能必须同时支持两种方法,并且可能还有一些其它方法,消费者才能有愉悦的聆听体验,而与电视节目的模式无关。
波束成形技术
机械的波束成形器是靠扬声器物理尺寸与位置来产生所需要的空间效果,而电子波束成形器则采用DSP,先对信号做处理,再将音频信号提供给扬声器。根据不同应用,可以将这些方法结合使用。
电子波束成形技术最初开发用于雷达应用。它在音频中的首次应用出现在话筒阵列中,用于捕捉语音和音频。这一领域中多年来的大量应用产生了音频波束成形算法。
话筒阵列波束成形的基本概念是:单独调节阵列中每个单元所接收信号的相位与波幅,使联合输出可以获得某个方向上的最大信噪比。这个概念类似于采用带通滤波方式,在频域中提取所需信号。但对话筒阵列的波束成形,工作是发生在空间域,通带可以配置为各个方向。现在已有很多广为报道的波束成形技术,对某一技术的选择通常取决于应用的要求与约束。
虽然音频波束成形广泛应用于音频信号的捕获,但它的音频回放中的使用却相对有限。一个主要的原因是,立体声系统一直能提供相对良好的性能,对很多应用来说,没必要使用两只以上的扬声器。但是,现在不断缩小的便携设备机械部件给立体声回放带来了重大挑战。例如,由于扬声器尺寸减小导致输出音量的损失,以及由于扬声器间距窄小而导致立体声像的模糊不清,都是问题。
平板电视越做越薄,严重限制了扬声器锥体的振动,从而降低了输出音量等级以及音频质量。克服这些限制的一种方法是使用一个小扬声器阵列,以增加整体音量,并使用音频波束成形技术做出一个更好的声场。很多其它方法也可以通过扬声器阵列系统创造出空间音频,如WFS(波场综合)和现场立体声,但它们通常都需要十几到数百只扬声器和大量的空间。因此,它们一般用于剧院和听音室,而不适合于中小规模的扬声器阵列。
用于话筒阵列的波束成形技术可以很容易用于扬声器阵列应用,因为回放基本上是反向的捕捉过程。但是,全带宽的音频回放需要较语音更大的带宽,因此需要在算法选择和阵列结构上做特殊的考虑。
通过一个扬声器阵列提供空间立体声需要一种有效的串扰抑制算法。另外,扬声器阵列算法必须尽量地减小音频回放时的失真,包括人工效果与声音染色。挑战是开发出适用于小型阵列的技术,它的主观效果要好于只使用立体声的情况,并且它以一种多只扬声器的方式应用这些技术,不需要复杂的算法编程技术。
空间阵列放大器
德州仪器公司用LM48901来应对这种挑战,这是其空间阵列音频放大器系列中的第一款,用于扬声器阵列的实现,可使有空间约束的应用产生出一种身临其境的声音体验。四声道的D类LM48901音频IC实现了分布式的电子波束成形算法,再加上采用HRTF数据做声音布置,从而做出了波束成形扬声器阵列。
单只LM48901可以用于两个、三个或四个扬声器的应用。多只LM48901 IC的级联可以设计出八个、12个和16个扬声器的阵列,提供更宽广和更令人激动的音频体验。