"Loading..."

敢向PCM格式叫板?——聊聊风头正经的DSD编码格式

不知道在看推文的各位,是不是都知道曾经我们一度狂热的CD唱片其实就是数字化的音源,而其中的数字编码标准是脉冲编码调变(Pulse-code modulation,PCM),这个从CD诞生之日起就一直到今天还在沿用。但除了PCM或更精准地说是线性脉冲编码调变(Linear pulse-code modulation,LPCM)之外,还有一个今年风头正旺的DSD(Direct Stream Digital)编码格式。现在市场上的高端播放器,把支持DSD格式作为一个卖点。到底什么是DSD编码格式?是否真的有如厂商宣称般提供更优良的音质?今天小灵结合之前整理的资料,跟大家好好扒一扒DSD的前世今生。


提示:今天的推文提及很多专业名词,注意划重点咯!


微信图片_20181120112201



Direct Stream Digital的历史


事实上DSD的诞生已经很久,早在60年代就已经有利用脉冲密度调变〈Pulse-density modulation,PDM〉编码,将音频信号记录在数位媒体上,正确来说应该是由PDM一个特殊分支-脉冲宽度调变(Pulse Width Modulation,PWM)来实现,这种编码方式目前已经完全被PDM格式所取代。


目前常见的DSD编码就是基于PDM规范,这个音乐编码格式的标准规范在1999年发表,是由当时领导音乐储存格式的巨头SonyPhilips合作开发,至于为何制定DSD规范的原因有些复杂。主要是因为那时候由Sony和Philips所制定的CD〈Compact Disc〉规范专利快要过期,在即将失去由CD专利带来的大量收益情况下,Sony和Philips决定再次联手打造下一代的音乐储存规格Super Audio Compact Disc〈SACD〉,所以DSD的出现绝大部分是因为商业考察。


在储存编码上,SACD使用和CD常见PCM编码完全不同的音讯格式,采用单位元的DSD编码。Sony花下重金聘请当时最顶尖的两位声音工程师Ed Meitner〈现任职于EMM Labs〉和Andreas Koch〈现任职于Playback Design〉来制定SACD规范,并且在初期免费开放给大多数知名录音室使用,这成为DSD音讯储存格式第一次大规模被使用在商业活动上。

微信图片_20181120112205

Direct Stream Digital标志



超级音频光盘〈SACD〉的起源


讲到DSD自然必须介绍一下SACD,SACD取样频率高达2822.4kHz,是一般CD取样频率44.1kHz的64倍,而且理论上具有能够再生100kHz以上频率范围的能力。此外由于SACD使用DSD的脉冲编码,因此省去位转换的过程,同时降低数位滤波可能产生失真和噪声的问题。


虽然这一切都让SACD听起来非常的美好,但SACD在推广的路途上却是相当艰难,因为当Sony和Philips决定用专利屏障再次垄断音讯储存格式时,其他音乐制作公司和硬件生产商却看上了正蓬勃发展的DVD光盘,并且希望利用这个容量更大的储存媒介来发行高品质音乐光盘,就此开启了新世代音乐储存媒介规格的战火。


Super Audio CD和传统CD音乐光盘规格比较


Super Audio CDCD-DA
编码格式Direct Stream DigitalLinear PCM
碟片容量

4.70G

B[DVD-5]

8.54GB

[DVD-9]

Max. 780MB
读取机制650nm激光780nm激光
声道数最高支持5.1声道双声道

响应频率

范围

0~100kHz 〈max〉5~20kHz
动态范围120db〈0 - 20kHz〉96db
读取频率〈双声道〉2,822,400Hz44,100Hz
取样深度〈量化〉1bit16bit

最高数据

流量

〈双声道〉

5.64Mbps1.4Mbps

规格制定

公司

Sony、PhilipsSony、Philips


高品质音乐储存规格之争


DVD-Audio规格很迅速地在SACD出现的隔一年后正式上路,使用和CD相同的LPCM编码,并且可以储存高达192kHz/24bit双声道的高品质音乐。DVD-Audio在音乐制作上和传统的CD音乐并没有太大区别,由于多数音乐制作公司都历经过CD格式的洗礼,因此刚开始大部分音乐制作公司,偏向选择技术上更加成熟的DVD-Audio规格,当然也有一部分理由是可以摆脱Sony和Philips的专利束缚


想当然,Sony和Philips为了捍卫自家格式和利益自然会做出反击,Sony和Philips藉由自己在硬件制造上的优势,拉拢大多数DVD播放器制造商,让后续生产的DVD播放器无法兼容DVD-Audio。这个作法严重的打击DVD-Audio阵营,虽然DVD-Audio阵营有不少大型公司支持,但是其内部意见却是相当分歧。由于每个成员都怕被另一个规范所束缚,这为DVD-Audio推广之路种下了失败的种子。


另外更令内部成员惊恐的是,在那音乐盗版猖獗的年代,DVD加密法很快地就被黑客所破解,每个音乐制作公司都害怕DVD-Audio会重演CD的盗版局面,因而都裹足不前。第一份正式DVD-Audio音乐光盘,居然是由一个发烧友,在缺乏良好录音设备的小型研究室录制。


在DVD-Audio阵营内部互相猜忌的情况下,Sony乘胜追击的许诺SACD将永远不能被电脑所播放,这几个举动成功稳固住SACD作为新一代音乐光盘的地位,并且也解决了双方阵营长久以来惧怕盗版的疑虑。


微信图片_20181120112208

▲SACD标志及SACD的种类。由左至右分别为:单层SACD〈4.7 GB〉、双层SACD〈8.5 GB〉、混和型SACD〈4.7 GB〉


SACD的殒落


经过上面一大串折腾和较劲之后,Sony和Philips阵营开始自信满满地宣传和推广多声道格式SACD,并且宣称未来是高品质多声道音乐的年代,而且也渐渐获得多数音乐制作公司的认同。眼看着储存格式大战就要分出胜负的时候,Apple的iPod迅雷不及掩耳上市了,尔后几年将在线数位音乐下载量,更提升到了一个惊人的程度。


面对Apple所掀起的在线数位音乐潮流,Sony选择继续维持SACD的生产和发行,并且在2003年规划出同时拥有传统CD层和SACD层的混和型SACD,期望在实体音乐光盘销售上有所突破。但是这很快地就碰上SACD播放器销售不佳的问题,因为当年的SACD播放器价格大多落在5,000元美金以上,消费者并不愿意购买昂贵且只能播放音乐的SACD播放器,因此让SACD的销售受到直接的影响。


再加上几年后,Wavelength Audio发布了基于电脑播放的非同步USB DAC,这使得利用电脑播放高品质音讯档案变得更加容易。尔后又随着全世界网络速度的提升,和在线音乐的流行,出门购买音乐光盘渐渐的不再是获得高品质音乐唯一来源,SACD就此成为只有少部分音乐爱好者的选择


微信图片_20181120112210

▲混和型SACD结构图和读取机制:混和型SACD具有一层4.7GB容量的DSD层〈上层〉,同时还包含一个符合PCM红皮书的CD音轨层〈下层〉,能够兼容传统的CD播放器。


2006年,在体认到SACD几乎已经不可能成功的情况下,Sony做了一个策略上的大转变,推翻之前SACD将不会被电脑播放的承诺。Sony推出以SACD为基础的DSD-Disc,这个格式的SACD将旧有物理防拷贝保护层移除,使得电脑也能够读取这类型光盘片。


但是由于已经失去市占率,DSD-Disc在完全没有推出过任何商业音乐光盘下就被抛弃,从2009年后就已经没有大型商业音乐制作商,使用SACD当做音乐储存媒介。虽然到这边,由Sony和Philips主导的SACD已经完全溃败,但也为后续的DSD格式音乐打开了另一扇大门。



DSD音乐播放原理


上面看完了DSD音乐格式的历史信息,这边笔者想先来介绍一下DSD到底和PCM有甚么不同,首先我们就从介绍DSD音讯编码开始。DSD编码使用不同于以往PCM逻辑来记录音讯,DSD信号是以ΔΣ调变后的PDM编码形式储存在储存媒介上,DSD的内部记录的是一个连续时间的单一位序列,以固定的时间间隔来记录,在标准的SACD规格下每个取样间隔是1/2822400秒,取样频率为CD规格〈44.1kHz〉的64倍之高


DSD每一次取样会比对本次取样和上一个样本值的变动,接下来使用0和1来记录振幅的变化,0代表比上一个信号值来得低,1代表比上一个信号值来格高,所以每一个取样的信号是和前一个信号的相对值。DSD藉由非常高的取样频率,将以往量化不精准所造成的失真,下降到一个位以内的误差。


微信图片_20181120112213

▲DSD编码示意图,在每1/2822400秒记录下一个单位元的数据,每一次记录的数据是和前一个数据的相对值。


为了确保大家都能够轻易理解等一下的DSD和PCM比较,在这边快速地介绍一下PCM编码。PCM编码主要包含取样〈Sampling〉、量化〈Quantization〉、编码〈Coding〉三个过程,如下图上半部所示,PCM也是在一个固定的间隔时间内〈如CD是1/44100秒〉记录下原始模拟信号的振幅。


但和DSD不同的是,PCM记录的是一个绝对值而非DSD的相对值,每一个不同的振幅强弱都有其代表的数值。然后再将记录下来的数值转换成离散时间信号,最后再依据PCM规范给予一个编码就是常见的LPCM格式数位音讯。简单来说,PCM编码就是在连续的时间〈X轴〉坐标下,记录当时的振幅〈Y轴〉大小


微信图片_20181120112215

▲LPCM编码示意图,在固定时间间隔下〈1/44100秒〉,记录当下的振幅大小的绝对值。


DSD音乐播放

DSD音乐的记录和播放流程,相较于传统PCM编码来得简化许多,由于目前市面上主流是使用基于单位元的模拟数位转换器(analog-to-digital converter,ADC),来进行音乐录制。所以如果将录下来的声音直接使用DSD格式储存的话,在播放时只需要在输出端,经过一个开关电容网络构成的低通滤波器,来还原成模拟信号即可。


整个流程相较于传统的PCM处理,省去了在录音端单位元转多位的过程,和在播放端必须经由超取样和ΔΣ调变成PDM信号的手续。这使得DSD具有非常好的先天优势,并且理论上能够在硬件端节省下多余的处理元件,也间接地降低处理过程所产生的失真。


SACD较早时期采用1bit转换技术造成的高频抖动〈dithering〉与谐波〈Idle Tone〉等问题,目前的DAC芯片为了因应1bit译码缺点,大多使用多位〈例如:6 bit,64阶〉的ΔΣ调变。此种调变混合1bit PDM和PCM的优点,在低电位输出时直接调整输出脉冲电压为低电压,可以让后续的低通滤波电路设计问题简化不少。在理论上看起来是如此的完美,但是人算不如天算,完美的事情永远只在理想状态下发生,后面的章节和各位讨论DSD所需要面对的问题和优势。


微信图片_20181120112219

▲〈上图〉PCM音讯的录制和播放流程简图,总共历经两次超取样处里和两次位数转换,〈下图〉理想状态下DSD音乐录制和播放流程简图,过程中无须经过超取样和位数转换。


DSD和PCM编码比较


由上面的介绍就可以看出,DSD和PCM是两种完全不同思维模式的编码,而两种规格也拥有各自的优点和缺点。


DSD编码优势

1.理论上极高的取样频宽

标准的DSD音乐使用2.8224MHz取样频率,理论上能够记录最高到1411.2kHz〈取样频率的一半〉的声音,相较于传统CD使用的44.1kHz取样频率,这让DSD格式拥有非常宽广的取样频宽,即便和目前录音室常见的高规格24bit/192kHz PCM录音相比〈取样频宽最高达96kHz〉,DSD也拥有超过14倍之多的取样频宽。


2.优势的动态范围〈0~20kHz〉

DSD信号经由高频噪声整形〈noise shaping〉电路处理,将DSD带有的高频噪声,提升到超越人耳聆听范围外的频率后,在0~20kHz的频率范围内,DSD拥有理论数据上高达150db的动态范围,相较于16 bits/24 bits PCM编码的96db/144db动态范围,DSD编码理论上拥有更好的动态范围〈0~20kHz〉。


微信图片_20181120112221

▲DSD和PCM编码比较,红色框格内代表24/96kHz PCM编码可记录的范围,橘色为24/192kHz,绿色为24/384kHz可记录范围,24bit的PCM信号底噪坐落在记录范围之外,理论上小于-144db;蓝色线为2.8224MHz DSD在不同频率范围的底噪示意图,可以发现在大约30kHz后,DSD编码的底噪急遽上升,在接近极限频率时达到大约-6db的响度。


3.更小的音乐容量

DSD编码在储存容量上也具有一定的优势,随着音质的提高,PCM音乐的档案大小可以说是指数型成长。而DSD由于编码上的优势,在标准的2.8224MHz取样频率下,DSD的档案容量只约略超过24/96kHz的PCM音乐一些。这使得DSD不论是在储存或是网络下载,都比PCM格式来得有优势。


格式〈bit/kHz〉容量耗时〈5Mb带宽
CD〈16/44.1〉32MB1 分钟
PCM24/88.295MB2.6分钟
PCM24/96103MB2.8分钟
PCM24/176.4190MB5分钟
PCM24/352.8〈DXD〉380MB10分钟
DSD〈1/2822.4127MB3.4分钟


4.除了上列的优势之外,DSD音乐在播放时还具有无取样频率限制、直接支持DAC主要时钟和长传输距离的优点。



DSD编码缺点

上面提完DSD的主要优势,但就跟多数的规范一样,DSD也有其无法克服的技术缺点。而且这些实际操作上的缺点,反倒严重的抵销DSD上述的优势,并且在大多数情况下还产生更多的问题,底下就让笔者来介绍一下DSD编码相较于PCM编码有甚么样的缺点。


1.实际上较窄的频率范围

标准的DSD编码有一个先天的缺点,相较于CD规格的16bit/44.1kHz的-96db〈16*6db〉底噪来说,DSD的底噪高达-6db,这个现象在实际测量上也可以观察到。DSD编码在超过20kHz的时候,会产非常大量的高频噪声,如果不将这些噪声移除,将会对后端的音响器材造成伤害。所以必定需要经过滤波技术的处理,现在的处理方式是利用噪声整形电路,将噪声移到人耳聆听范围外〈>20kHz〉。

但这也说明后续就要由低通滤波器将这些噪声移除,由Sony的规范书来看,DSD信号必须经由一个截断点为50kHz的低通滤波电路处理移除高频噪声。这使得现实上在播放时能使用的最大频率范围,大约只比30kHz高一点点,这直接影响到DSD其中一个优势:「理论上极高的取样频宽」为了减少高频噪声的问题,目前最新的DSD档案都使用双倍的取样频率〈DSD128〉,理论上藉由噪声整形电路,能够将高频噪声推到更高的频率范围,但实际上还是无法解决通过低通电路后实际能用的频率范围。


2.档案经过多次格式转换

由于DSD编码是一种单位元的记录格式,使得DSD音讯几乎完全无法利用现在的音讯设备来编辑,因此在音乐后制的时候,DSD音讯还是必须被转换成PCM音讯来编辑。目前的DSD音乐编辑模式,是先将DSD转换成Digital eXtreme Definition〈DXD〉格式,DXD本质上就是352.8kHz / 24bit的PCM编码音讯,等后制和音乐编辑完毕后,再转换为DSD信号。因此DSD音乐档案反倒同时继承DSD和PCM的缺点,并且在多次的转换过程中,还会额外导入另一层的高频噪声,这使得DSD原本希望移除PCM编码缺陷的初衷,完全不存在现在的DSD音乐中。


3.相对高解析PCM编码没有显著优势

DSD编码当初的比较目标大多是CD规格的PCM音讯,但在高分辨率的PCM音讯流行的当下,高分辨率PCM音讯实际可用的取样范围和噪声控制能力,完全优于标准的DSD格式。为了解决这个问题,刚刚提到双倍取样的DSD128音讯就此诞生,虽然可以些微的降低DSD噪声过高的问题,但单位元编码先天上的缺陷依然存在,并且双倍取样的DSD128音乐档案大小,对比高解析PCM音讯来说,也变得没有储存容量上的优势。


4.硬件支持度不广泛

DSD处理对于目前已经习惯PCM音乐已久的音乐制作公司来说,必须投入额外的成本才能进行后制,所以严重的影响到DSD格式的推广。此外目前市面上绝大多数支持DSD播放的DAC,是将DSD音讯重新编码回PCM信号的方式来播放,只有非常少部分的DAC支持原生播放DSD音乐。除此之外,DSD传输并没有被大多数传输规范所纳入,像是USB Audio 2.0和Mac平台的特性规范中,音讯传输就只有标准PCM一种格式。


好在最近被推广DSD-over-PCM〈DoP〉传输规范解决这部分的问题,这个传输规范使用24bit/ 176.4kHz PCM传输来包装DSD信号,利用前面8个位来当做DSD的标记。又由于2.8224MHz取样的DSD音讯数据量相当于16bit/176.4kHz的PCM音讯数据量,所以后面的16位就可以用来包装DSD音讯,让有能力的硬件厂商自行研发DSD解决方案,并且也让不支持DSD传输的iOS系统有机会播放DSD音乐。当然这样的传输规范也有它的缺点,那就是由于数据是藉由PCM信号的方式包装,如果硬件误判DSD为PCM信号时,就会在88kHz的地方产生一个大约-34db的杂音,并且播放DSD的相关操作和设定过程相当繁杂,所以DSD音乐规格还是相对地不普及。


微信图片_20181120112224

▲利用16/176.4kHz PCM格式包装标准DSD音讯的示意图,前8个位为识别标签,后面16位为DSD编码信号。



小结


至此,相信大家对DSD编码格式都有了一定程度的了解,也许有人会问说:既然DSD有那么多不便和缺点,为什么最近突然有一群厂商在推广DSD音乐格式?


小灵只能且必须这样说:没有一个格式是没有缺点的,要看实际使用和市场的反应。关于DSD近年风头旺盛,推测是DSD规范出现到现在已经超过十年(国际上大部分的技术类专利有效期限是十年),所以基本上DSD格式现在已经成为一个开放式规格。其次目前主力的推广DSD的公司,是当初开发DSD规格的Andreas Koch所任职的Playback Design,自然会希望能够将DSD音乐推广开来。


反倒是制造业界用于转换DSD与PCM标准规格的瑞士数位音乐公司Weiss的老板Daniel Weiss,在两年前发表了一份简短的DSD白皮书,很明白的点出DSD无法后制处理,一定要先转换为PCM信号,才能进行必要的后制工作。所以在录音阶段,Weiss推荐还是先用PCM格式储存声音信号比较实际。


再顺道回过头看一下当初制定DSD规范的Sony,目前和日本音响协会一同制定新的「Hi-Res」认证,仔细阅读其内部规范后,可以发现虽然DSD同样被视为高解析音源,但是在高解析音源的定义中,并没有对DSD格式做特别着墨,可以推敲出Sony对这个已经失去专利主导权的音讯格式的态度


但总体而言,DSD和PCM谁好谁坏并不是真正的重点,它们都只是储存音乐的一种格式,重要的还是里面所包含的音乐。因为音乐的感动并不是靠音乐储存格式来决定,只要一个储存格还有足够的人在继续使用,就有它被保留的意义存在。至于DSD和PCM到底谁会成为未来格式的霸主?就让音乐制作公司来烦恼吧。


Processed in 0.077491 Second , 53 querys.