DVD和相关的光学媒体,以及磁盘驱动器容量的快速增长,已提高了高阶AV系统的门坎。就传统的CD播放机而言,电子产业的进展重点在于整体的清晰质量,此质量却受限于盘片数据的分辨率,之后的发展则锁定于组件成本的降低。在今日,便宜、庞大的数据储存已突破了此一瓶颈,也使得更高性能水平的新格式得以出现。要达到更高的音质,其关键在于模拟及混合信号电路,例如模拟数字转换器(ADC)、数字模拟转换器(DAC)以及放大器。
媒体及数据格式
在相同的尺寸下,4.7 GB的DVD所提供的原始数据储存容量是音频CD的7倍,而现在更推出更高阶的HD-DVD以及蓝光盘片。磁盘驱动器也日趋普遍,其容量已可达到数百GB。在此同时,开始出现许多失真及无失真压缩算法,以更有效率地利用这些实体媒介。增加的数据容量不仅能延长录放时间,而且能让音频的录制更为精确。新的格式能提供多声道环绕音响,以及在解码音频串流中提供更高的取样率和数据分辨率。
CD播放机在取样率为44.1 kHz,分辨率为16 bit时,仅能读取两声道;而音频DVD在每一取样24 bits,且支持取样率高达192kHz的情况下,则能读取6声道。两者的MLP(Meridian无失真压缩技术)压缩算法皆是采用无失真技术,能完全再生录音的每一个细节。另一方面,以MPEG-4格式进行编码的视频DVD,在音频部分采用AAC压缩,取样率为96kHz,样本分辨率则视AAC解码器的工作而定。这些相同的格式也适用于硬盘机。然而,这些数字所代表的声音质量究竟如何呢?
真实的模拟
每个人对于声音的喜好是相当主观的。一些测量数据,包括频宽、信噪比(SNR)以及总谐波失真(THD)等,都会影响听觉的质量。
数字音频系统的频宽与取样直接相关:能被录制的最高信号频率为Nyquist频率,其为取样率的一半。当Nyquist范围高达96kHz后,新的媒体格式的频宽便扩展至超音速的范围。尽管20kHz频率以上的声音本身是无法被听到的,它们却造就了更为精确的再生信号相位,这在听觉中扮演了相当决定性的角色。在多声道系统中,高频宽能打造更佳的空间位置分布。然而,唯有在信号链中的每一个部分(包括ADC、DAC、放大器及扬声器)皆具有相同的高频宽时,这些好处才会落实。
数字音频系统的SNR受限于样本分辨率:使用越多的位数去呈现每一音频样本,则其再生就会越精确。量化误差(原始信号与其数字再生信号间的误差)会产生一个每增加一位分辨率,其强度便减少6db的噪声阶层。因此,在16位分辨率时,可以达到的最佳信噪比为96dB,在20位时为120 dB,24位时为144 dB。然而,这些都只是理论上的数据。在实际情况中,模拟线路还会有热噪声及闪烁噪声。因此,一个DAC或ADC的数据分辨率通常与其真正的效能无关,真正相关的是SNR。“等效位数”(ENOB)是计算自被测量到的SNR,说明在每一个取样中有多少数据位数于噪音中遗失。再进一步检视信号链,每一个模拟层级会增加更多的噪音,系统的整体性能会受限于噪声最大的那个组件。
谐波失真与数字音频格式并非直接相关。基本上,它是发生于模拟电路,且如前所述,整体的总谐波失真是由最弱的环节来决定。在信号链的每一环节中都能达到低失真,如此才能展现高效能。
录制
从只读到可记录和可复写媒体,例如DVD RW, DVD+RW,以及将近兆字节的硬盘机,使得低成本的数字家庭录像成为可行。典型的DVD录像机具有模拟及数字输入,以录下来自电视机、摄影机和VHS卡匣式录像机等来源的声音及影像。自从消费者希望家庭录像的质量能与商店所贩卖的预录盘片相同后,用来录制的信号链就必须达到与播放时相同的效能 。再强调一次,影响质量的因素不再是数据格式,而是模拟及混合信号电路。
混合信号 质量的关键
在今日,音质的瓶颈所在正是ADC, DAC以及周边的模拟电路。为了充分发挥今日数字媒体播放器的潜力,这些电路必须达到极佳的SNR,低总谐波失真,以及更大的频宽。迈向高阶音质的第一步,就是在芯片层级上将模拟及混合信号电路与数字电路分开,使其采用不同的IC工艺。采用先进工艺的数字电路(如MPEG解码器),对模拟电路而言却通常是有弊无益的。特别是对数字电路而言,先进的CMOS工艺带来更小的晶体管,以及更低的供应电压,如此能大幅度地降低成本及功耗;然而,这些特性却会让模拟电路出现更大的噪声。再者,新工艺的特性通常并不完整,难以进行精确的模拟,而这对于最佳化模拟电路是相当必要的。因此,为避免性能打折,最好的方法便是将模拟及混合信号电路放在另一颗IC上,并采用较高压的CMOS工艺将更为合适。此种音频IC的例子之一为Wolfson最近推出的WM8590,其提供高效能的立体录放音效。
音量控制及SNR
将系统切割开来的另一个重要考虑则是音量控制。虽然如同模拟电路一般,此功能也可以由数字电路来处理,但是两种方式的结果却不相同。在数字电路上衰减播放信号,对于DAC及之后的层级所增加的噪声并没有改善,因为在一定的时间内,这些噪声是固定不变的,随着信号音量的降低,SNR会逐渐恶化。为避免此情况,音量控制必须由模拟电路来处理,如此先前所增加的任何噪声便会降低。然而,对于“静音渐回功能”而言,数字衰减仍是有用的,藉由此功能,系统会渐进的降低或调高信号的音量。
在录音方面,当模拟输入的信号强度接近ADC的最大水平时,便能达到最佳的SNR。因此,较弱的输入信号必须在ADC之前便由模拟电路加以放大,而非数字电路。其中要注意的是,此放大不得超过ADC的范围,否则将造成信号超载。峰值限幅器可避免超载的情形发生,其在信号水平变得太高之前,可减少模拟放大器的增益。另一种选择则是自动音量控制(ALC),对于某些音频信号而言,这是一个有用的选择。不同于限制峰值,但一样能在信号强度较低时增加前放大器的效能。
WM8590具有低噪声模拟前放大器以满足这些要求,放大器的增益由主处理器控制,或是由整合的峰值限幅器或ALC所控制。另外在播放方面,同样也提供静音渐回功能。
EMI和差动信号
并非所有的噪声都源自于信号链的组件。数字电路、交换式电源供应器或是无线传输设备都会产生电磁波干扰(EMI),这会造成邻近模拟电路的噪声突起。即使EMI是发生在音频频宽外的频率上,频率信号互调仍会产生可听见的低频率信号。良好的PCB布局能解决此问题:如果模拟信号路径较短,且距离EMI来源较远,则EMI的问题将会减少。另一个降低EMI的方法是藉由在信号路径的每一侧接地,并在铜层之上或之下创造接地面,以保护模拟信号。
然而,最有效的解决方法还是差动信号。利用两个完全相同,但具有不同极性的信号,以取代一个单端的电路。在一个对称布局中,两个路径相邻运作,则相同的EMI突波会被导进这两个信号中。这两个信号间的接收侧不同,因此EMI得以抵销。共模拒斥比(CMRR)越高,则抑制EMI的效果就越好。使用两个镜像信号也能增大有效信号,故任何残余的噪声都会变得较不明显。
WM8590在模拟输入及输出部分使用差动信号,使得信号电路能有效抑制EMI噪声。模拟输入/输出接口的缓冲器应尽可能放在靠近接口的地方,藉由此接口和缓冲器之间极为敏感的连接得以缩短,鉴于标准音频输入/输出插座的设计,其必须保持单端的型态。
电源供应
电源轨提供了另一个路径,让外来噪声得以进入模拟电路。供电电压中的波动是由电源供应器本身及数字和模拟电路所引起的。模拟电路具有电源拒斥比(PSRR),能隔离输出信号,使其免受此波动影响。一般都希望能有较高的PSRR,因为它可以减少噪声穿越。然而,引用某一特定频率的PSRR数字不太具有意义,因为整个信号频宽都需要较高的PSRR。
此外,电源噪声应在源头处便加以抑制。线性电源供应器有低频电源线涟波,而交换式电源供应则会产生高频交换式噪声,两者都可藉由使用适当的稳压器和存除电容器加以大举消除。数字电路一样会在宽带下产生交换式噪声。对策之一即是将模拟电路的电源供应与接地和数字电路所使用的分开,因为那些地方正是大部分噪声的来源。而在“吵杂”的数字IC旁的去耦电容器能让其交换式噪声在传导至电源轨之前便发生短路。
模拟电路亦会将涟波导入其自身的电源供应,这常常便是谐波失真的原因之一。每一电源供应器皆有一内部阻抗,当电流输出时,便能降低它的电压。在信号达到峰值时,许多模拟电路都需要更多的电流,而唯有当此需求达到最高时,才会稍微降低其供应电压。结果造成了电路输出的峰值低于其该有的数值,因此音频波形被扭曲了。减少电压阻抗可减轻此种类型的失真,且并非仅限于DC,而是遍及至放大器的整个频宽范围。低噪声稳压器和储存电容器的结合可达到最佳的效果。在稳压器频宽范围外的高频,电容器的等效串联电阻(ESR)成为供电内部阻抗的一部份,因此低ESR电容器能展现较佳的效能。在PCB上的寄生电阻及电感是不利于音质的,应该藉由将存储电容器置放在消耗电流处的附近,以减轻其影响。
频率
在数字声音再生中,频率信号是一个常常会被忽略的因素。被使用于DAC或ADC的频率是做为时序的参照;就像是要取得精确的间隔量化位准,稳定的电压参照是不可或缺的一般。频率会决定信号样本的时间间隔精确程度。频率抖动会造成样本时序的变异,信号的波形将会因此而改变。若此抖动在本质上为随机的,则会形成噪声而被听见;若是与音频信号相关,则会造成失真。
对于频率抖动的灵敏度而言,DAC和ADC的架构是不同的。事实上,对于现今大部分的媒体播放器而言,超取样积分三角技术是唯一在商业上可行的选择。就如同Wolfson在其音频IC中所采用的多位架构,比起单位元方法更能容忍频率抖动。低抖动频率源无疑是最重要的因素。若频率恢复需要藉助外部来源(例如光纤S/PDIF连接),则可使用锁相回路消除其抖动。就如同对模拟信号的保护一样,必须尽可能地保护频率源与DAC或ADC的连接,使其不受干扰。
另一个与频率相关的议题,则是系统需支持一种以上的取样率。由于光盘所使用的音频编码方式相当多元,这已成为现今DVD系统必须正视的问题。许多的失真压缩算法是在频率区域内呈现音频信号,这让译码器可以决定原始以及解码数据的取样率。就DVD盘片而言,数据是存放在时序区域,其取样率固定为96kHz或192kHz;而传统的CD格式则需支持44.1kHz的取样率,这可能会难以落实,因为此频率与其它常用的取样率并非简单的等比例关系。对于需在同一时间使用两种不同取样率的系统而言(例如在将模拟音源烧录至硬盘的同时,还同步播放盘片),这些问题更是严重。
WM8590为少数能针对整合的ADC和DAC提供完全独立频率的音频IC,这让双轨运作可以实现。结合其差动架构、高SNR、低失真,以及强大的电源供应抑制,这些功能将各种与媒体格式有关的优点,转换为实际的、听觉上的音质提升。