升频比特处理释疑[译文]

HiFi秀 | 2016-12-14

harvey注:我自已曾经尝试过买了两个型号的廉价升频、升上变换DAC处理器,用了一段时间后,发觉还是用回10数年前一直用到今天的Wadia 2000 DAC处理器,它是一部标准的44.1kHz / 16bit数模转换器。所以升频、升上变换是不是好真是疑真疑假,众说纷纭。

近年来,发烧界数码玩家掀起了一股对数字音响器材进行“升频 (up-sampling)”和“升比特(up-bit)” 处理的热潮(为便于阅读,下文统称其为“上变换(up-conversion)”处理)。起因是由于DVD盘片上出现了以 96kHz / 24bit规格录制的音频信号,以及某些公司在做产品推广时,宣称他们的器材内使用了Snell & Wilcox插补器来对图像信号进行了倍线处理,可以令画质得到了有效的提高。

本文的目的旨在替您解开一些围绕在“上变换”处理技术周围的谜团。首先,所有线性 PCM(脉码调制)数字录音里的信息量都是有限的。如果录音室里的整套录音设备都处在最理想的条件之下,那么这些音乐信息记录的多寡与否,便只受制于取样频率(每秒钟从原模拟波形中提取多少个样本)和取样深度(用多少数据来描述那些样本。又称“量化精度”,以 bit为单位)。我们所熟悉的CD唱片的标准取样频率和取样精度,被规定为每秒44100次和16bit / 样本。

提升取样频率和取样精度,都能带来可察觉的音质改善,但前提必须是原始模拟信号,在被转换成数字信号以前,它的信息通路上没有重大的限制因素——因为一张用廉价麦克风来录制的96 kHz / 24bit唱片,听起来决不会比以44 kHz / 16bit规格录音的版本好多少。不过,一旦当你捕获了某特定的取样频率,和取样精度所能容纳的全部信息以后,所有在录音之时所丢掉了的信息,便再也找不回来了。用音频系统进行回放的时候,关键就在于要还原出数字录音里的每一个细节,以便尽可能多的重造出录音时想要抓住的原声信息。

1982年,当Sony和Philips联合推出C D系统时,两家公司在如何将音频信息最好的保存下来这一问题上,出现了分歧。鉴于当时技术的局限性,Sony认为最佳的办法是采用 44.1kHz / 16bit标准的数模转换器;而Philips则坚持采用14 bit的转换器,但是取样频率却高达176.4  kHz,是44.1 kHz的4倍。同时,Philips 还专门为此开发了一种被称为“超取样(over sampling)”的技术,那就是在原录音的样本之间,再插入 3个取样点。该过程的实现运用到了许多与高等数学相关的理论与技术,创造出了一个介于“真”声和原取样信号之间的信息还原状态。说得形象一点,此项技术的效用就好比是一个小孩在用画笔作曲线的连点游戏,在经过了“超取样”之后,他在单位距离内有了更多的点可以连接。既然点的密度高了,那么连起来的曲线,看起来自然就比原先的更加平滑。而从技术上来讲,现在这条曲线拥有了4倍于原样本的取样点,也即我们所说的“4倍超取样”。

其实,Sony和Philips在1982年所提出的两种CD规格在音频信息量上是一致的,只不过Philips采用的是较高的取样频率,和较低的量化精度把音频信号处理成了另一种格式而已。这种做法的优势就在于:当数字信号被转换回模拟信号以后,设计者能够使用音频特性更加优异的模拟电路。由于经过了对取样后的脉冲信号进行四舍五入取整数的量化过程,在数字信号被转换回模拟信号以后,它已不再像原取样信号那样保持连贯、平滑的波形了,取而代之的是一连串充满了细小“阶梯”的弧段。这些尖锐的梯状边缘所引至的失真,将以取样频率和取样频率的整数倍频率为中心,对称分布开来。以 44.1 kHz取样率录制的唱片为例,这些失真带,会出现在44100 Hz ± 20000 Hz的宽广范围内,同样受到影响的当然还有44100 Hz的倍频,如:88.2 kHz,  132.3 kHz,  176.4 kHz等等。

请注意:那些失真频带的最低端已经“侵袭”到了24.1 kHz(44.1 kHz减去20 kHz)。毫无疑问,这一频带距离人耳的听音范围实在是太近了,必须要用滤波器将它们有效地过滤掉,以避免音质受到严重的损害,比如:IMD互调失真,高音单元过载(甚至烧坏),放大器接收到大量的超声波信号等。正因如此,Sony在它们的第一代CD机上,使用了被称为“砖墙式滤波器”的滤波组件组:9-11 阶的模拟滤波器以极复杂的方式累加在一起,对音频信号进行滤波。在实际情况中,这一安排大大的劣化了音质,因为它会导致严重的相位漂移,以及频带内的涟波干扰等诸多问题。

相比较来说,Philips的设计思路则是要欺骗数 / 模转换器,让其以为它正在处理的是 176.4 kHz的信号。这就意味着,那些具有重大失真的频带都被推到了176.4 kHz和它的倍频附近。由于此时受影响的失真带宽仍然保持为± 20 kHz,所以这些频段的最下端到 156.4  kHz时就已完全截止,距人耳最敏感的听音频段已非常遥远。这样一来还使得设计方可以采用结构更加简单、性能更加优异的模拟滤波器。

Philips 的设计方案在此后相当长的一段时期内,受到了全球厂商的广泛青睐。因为自 1982 年以来,为了能够使用结构简单、性能优异的模拟滤波器,几乎每台CD 机都运用了超取样技术。近些年来,能够以更高的转换频率(4倍、8倍,甚至16倍超取样)还原出所有16 bit信息的 DAC(数 / 模转换器)芯片已经能在国际市场上找到。而随着科技的发展,大量的18-bit DAC,20-bit DAC,以及24-bit DAC又陆陆续续的面世了,这些芯片均能够在非常高的转换频率下运作并保持极佳的精确度。现在,即便是市场上最便宜的DAC也在诸多方面超越了 1982年最高技术所能提供的一切。


那问题的关键究竟是什么呢?

关键就在于:为了利于数模转换,对数字音响器材做“上变换”处理,已成为许多厂商在设计产品时的唯一主导思想。从1982年开始,这项技术就被某些人称作“超取样”,但不管是你把它叫做“over sampling(超取样)”,或者“up-conversion(上转换)”,或者“up-sampling(上取样)”,还是其它的什么东西,它们指的都是同一件事:为获得更高质量的数模转换而将原取样数据转换为取样频率/比特数更高的信号。

至今仍有人询问:“Mark Levinson何时会出一台能让我44.1 kHz / 6bit规格的CD,听起来具有 96 kHz / 24bit音效的上变换处理器?”要知道,现役的所有 Mark Levinson解码器都会根据原输入信号的特性,将数字信号超取样(也可以说是“升频”)至352.8或384 kHz。那么,为何你还想要我们把回放标准降低到只有96 kHz或192 kHz呢?

人们对于“上变换”技术的理解偏差主要来自于这样一个事实:聆听者可以(使用某些器材)即时改变“上变换”数字滤波器或是它的滤波特性,并通过比较来认定哪种状态的音质最好。不可否认,音质上的差异确实存在。在研发产品时,就已经觉察到了使用不同的数字滤波器,在主观听感上所反映出来的巨大差异。倘若我们在自己的处理器上加装一个按钮,让您能对机内的数字滤波器做某种程度的改变,那您也一定会聆听出相当的差别。又或者,我们将该过程“机外”化,令它独立的成为一款产品,并放到市场上去大赚一笔。但是这样作对我们客户的利益没有任何好处。

说到底,假如我们(或是其它的厂家)拥有一个运算能力极强的处理系统来进行这一工作的话(我们也的确拥有),那么,将产品研发过程中所淘汰掉的“失败技术”保留在机箱内,并通过比较来反衬出我们经过了甄选的“优越技术”如何的更好,是否有违追求原音重现的本意呢?再者,我们又是否应该为那些只被人们用来短暂地测验一下便弃置一旁的东西而收取消费者大量的金钱呢?我们已认定了要不断地提高我们的先进科技,并确保产品中只有我们最尖端的技术。某些人可能会认为我们太过天真(或理想化),但实际上,我们只是不愿为了让经过优化的音响表现听起来更悦耳,而急于在我们的产品上提供一个非最佳音效的对比选择而已。


那噪声整形(noise shaping)又是怎么一回事呢?

噪声整形(又称:调制)的确在很大程度上限制着低bit数 DAC的性能,尤其是对于那些普通的廉价1比特DAC而言。这些被称为“Sigma Delta”或“Delta Sigma”的 DAC,将Sony / Philips设计中的数字交换发挥到了极至:它们用较高的取样频率来和大量的bit数做了交换。但即便如此,它们也未能达到足够高的转换速率去补偿1比特与16比特之间所存在的巨大差距,更不用说是24比特了。所以,它们需要通过噪声整形来将大量的噪声挪移到人耳敏感的听觉范围以外。不过,就算是目前最好的1比特DAC,在略高于20-30 kHz上面一点儿的频带内,仍存在着大量的噪声,并且统统需要被过滤掉。

当弄清楚了这些会导致声音听起来不一样的因素之后,专业唱片录音市场便采用了不同的噪声整形器,创造出了不同的“声音”——就像使用均衡器之类的电子效果器。少数几家公司为一些录音室,设计出了这样的外置式数字效果器。这部分器材必须要具备数字输出端,以便它们的“效果”信号,能被送往其它器材做更进一步的处理。而且,那些输出信号还必须是拥有极高取样频率 / 比特数的数字信号,原因很简单,如果没有增加数据信息量,你就不可能进行有效的噪声整形。

比特数的音频信号的,而其中的一些厂家已把噪声整形和上变换功能,定位成了一种原理,类似于视频倍线器那样的音质改善途径。不幸的是,部分消费者盲从的去购买某些器材,但却不知道它们究竟是怎样改善音质的。倍受争议的“上变换”产品,是用户可调式超取样滤波器。(对于一个好的超取样滤波器来说,噪声整形仅仅是众多影响它性能表现的参数之一。)为什么要为制造商已经包含在他们解码器中的那些东西再花去数千美金呢?外置的超取样解码器是为唱片录音室所设计。因为在那儿,作为整个录音技术处理的其中一个环节,它们会被用来改变唱片录音的音色,而这些解码器与普通民用解码器唯一的不同就在于,它们的超取样滤波系统是用户可调的。

相比之下,我们是在进行了大量深入的聆听测试,并确定了哪一套参数组合听起来最中性以后,才引入这一“超取样”功能的。在更加愤世忌俗的心情影响下,我们有时甚至在想:究竟我们是否可以在处理器上加一个“demo mode(示范模式)”,以在不作超取样处理的情况下转换原始的 44.1 kHz信息。到时,你将会(或者你是否会)为超取样所带来的巨大音质改善而惊讶不已!坦率的说,如果我们的用户想要通过一些比较特别的方式,来改变它们系统的主观听感的话,建议他们最好还是去买台数字均衡器。


提升取样与超取样

刘汉盛

降低Jitter的设计表过,接着要谈MEDEA的提升取样(Upsampling)、超取样(Oversampling)部分。有些读者可能会以为提升取样与超取样是二种不同的设计,其实这是一体的二面,基本说来是做同一件事,它们都是把取样频率的数值提高。「提升取样」可以采用自写算法(Algorithm,为某种目的而特别写的软件),把特定的算法灌入DSP芯片中,以DSP来运作。另一种「超取样」或「提升取样」则是普遍包含在市售的数字模拟转换芯片成品中。

或许您心中有一个疑团:既然在模拟讯号转为数字讯号的过程中,取样频率已经被「定死」了(如CD的 44.1kHz),我们为什么还要在数字转模拟的过程中把取样频率提高呢?这样做有实质意义吗?其实是有的,不过其目的并不在于改变原始录音时的取样频率,而是要让低通滤波器(Low Pass Filter)工作得更容易。


低通滤波器的任务

这话怎么说呢?为了让读者们明白,我必须从录音时模拟讯号转为数字讯号说起。当我们在做数字录音时,依照Nyqust取样理论,取样频率至少要有最高截止频率的二倍。受到当年制作CD规格时的科技限制,工程师们把最高截止频率订在20kHz。由于模拟音乐讯号不止到达20kHz而已,所以超出20kHz的频率必须在模拟转换成数字讯号之前先行滤除,而滤除高于20kHz频率时不可能刚好从20kHz处像切豆腐般垂直陡峭滤除,它一定会有一个「缓冲区」,所以最高截止频率订为22.05kHz。 22.05kHz的二倍就是44.1kHz,这就是CD取样频率的由来。这个用在模拟讯号A/D化之前的低通滤波器就是所谓的Anti-Aliasing Filter(抗锯齿,修边的意思)。

而当我们要把数字讯号还原为模拟讯号之前,也就是D/A之前,还需要再做一次数字讯号滤波的动作,这是因为此时的数字讯号中并不仅只有0-20kHz的频率而已,它还包括了取样频率的高次谐波,这些高于22.05kHz的高频谐波必须滤除,否则可能会引起扩大机内的内调失真,甚至烧毁喇叭的高音单体(这也是为何SACD唱盘设有高频限制机制,防止损毁扩大机或喇叭单体)。此时,我们再度需要一个低通滤波器,让低于20kHz的频率通过,高于20kHz的频率将其滤除。这个用在数字讯号D/A化之前的滤波器就是所谓的重整滤波器 Reconstruction Filter,一个模拟式低通滤波器。


必须让缓冲区加宽

问题来了,我们可以设计一个滤波曲线很陡峭的低通滤波器,让滤波缓冲区只在20kHz-22.05kHz的狭窄范围内。但是,这么陡峭的滤波曲线代表着每个八度可能需要高阶滤波(例如8阶或10 阶…)。这么高阶的滤波器往往会在截止频率处带来严重的相位问题与振铃(Ringing)副作用,而导致声音难听。为何我们不采用和缓的滤波曲线,以低阶滤波器来工作,这样不是可以让相位与振铃问题降到最低吗?同时,低阶滤波器的制造成本也会较低。

另外一个问题又来了,假若我们要采用低阶的滤波器,那就代表滤波缓冲区要很宽,这样滤波曲线才能够和缓而不陡峭。换句话说,就是要拉高低通滤波的起点,这样滤波的起点(取样频率)就不能设在原始的44.1kHz处,而是更高的倍数处,一般最常见的就是8倍(352.8kHz)超取样。滤波曲线和缓的滤波器不仅制造成本较低,同时相位失真与振铃现象也较低,,结果就是让声音更好听。


结合DSP与DAC芯片的优势

在一般的数字模拟转换器或CD唱盘中,可能只使用内含提升取样或超取样功能的市售D/A转换芯片。而在MEDEA内部,不仅采用DAC,还用上了Analog Devices SHARC DSP一个、Motorola DSP一个,作为提升取样频率、降低Jitter以及De-Emphasis之用(数字讯号接收芯片采用CS8413)。或许您又要问:既然市售数字模拟转换芯片内已经包含超取样功能,如果再用DSP做一次数字滤波,岂不是叠床架屋?没错,假若市售数字模拟转换芯片内的超取样品质很高,这样做当然是多余的。但是,如果有更高明的工程师自认自己以DSP来设计的数字滤波功能与品质超过市售数字模拟转换芯片呢?这就是高价数字模拟转换器能够大作文章的地方了。设计工程师可以把市售数字模拟转换芯片内的超取样功能完全或部分旁路,以自己设计的DSP来取代。假若设计得当,应该可以得到更低的相位失真与振铃。 Weiss的设计工程师就是以DSP来做8倍提升取样频率的工作,让取样频率从44.1kHz提升为352.8kHz(或384kHz,如果输入讯号为 48kHz取样时)。如此一来,数字讯号频宽就可达到176.4kHz。从20kHz到176.4kHz,这段滤波缓冲区已经够宽了。

转载本站内容请标明来源和作者,本站转载内容均标明作者和出处,如有遗漏请联系本站及时处理!


为承办好相关论坛重点相关工作,原定云展会顺延!
创新云展会,2023年BAE北京国际音乐音响展相约2024年,在线恭候!
点击进入报名领取礼物>>