最近自己一直在关注和了解DSD方面的信息,因为自己的DAC能SD卡直播DFF格式文件,于是乎下载了很多SACD,再从里面抽取DFF文件格式用于播放。
实际自己听下来,DSD格式确实有一套(不管前期是不是PCM转的,大家都知道其实很多都不算是DSD直录)。
年龄与阅历关系,LP我几乎没啥接触,最早涉及的音乐媒体就是卡带,然后CD、MD、DAT,MP3一步步下来。让我选的话,高端的模拟音源格式(LP/金属带/)当是首选(还有更好的开盘带),但这是一个非常折腾人的选择,昂贵,状态难以保证,使用不便等等,自己玩过卡带颇有感触。那剩下的都是数字格式了,0和1,区别无非是怎么排列0和1的问题,而这之中DSD应该是目前听起来最悦耳的数字编码格式了。
DSD的基本概念,抄袭百度百科上的解释是最直接准确的:DSD是Direct Stream Digital的缩写,表示直接比特流数字编码,是SACD(Super Audio CD)的编码模式。
在说DSD前不得不先说说PCM,也就是我们最常见CD的数字编码格式。因为基本概念都是相同的,DSD也是基础之上的改良及演化而来。
说到CD基本上都知道:16BIT/44.1KHZ,就我自己的理解,简单形象的说,如果下图中的这条曲线表示声音在自然界中1秒钟的波形的话,我们在用数字0和1模拟(采样)这个波形的时候,一秒内采样了44100次,而16BIT则代表采样的这些信息被记入了16位深的数据元中。
随着PCM数字技术的发展,PCM采样已经从当初的CD标准(16BIT/44.1KHZ)发展到了如今数字母带标准(32BIT/384KHZ),但其基本概念并未有改变。上图中的前半部分竖线表达了采样频率越高,采样间隔时间就越短,所获得的的声音就更加细腻流畅。后半部分的横线则表达了位深越大(比如24BIT),单位数据内可供描述声音信息的空间就越宽(信息量越大),则声音的精度就越好。
如果把LP的模拟声想象成一个圆的话,数字音频的工作重点始终是:想办法让0和1模拟出来的声音无限的接近“圆”,无疑24BIT,192KHZ甚至32BIT,384KHZ采样肯定比CD是要更好的(只是单纯从理论上来说,与实际录音品质无关)。这个很好理解,你拿一张白纸,上面画上44个点连起来,和画上192个点连起来,肯定后者更连贯更圆,所以,著名的专业DAC厂商,LAVRY的老板说的24BIT 94KHZ的声音最好,再上去采样虽然高但声音只会糟糕的说法我一只也持有疑问。
当然,我不是理论党,更深奥层次的技术研究很苦手本文也不打算深入探讨了,先说PCM的采样和位深主要目的是方便对比下面的DSD格式而已。
如上图,DSD通常以64位的DSD来说,即以1BIT 2.8244MHZ的标准,是CD的44.1KHZ的64倍采样率,也就是2824400每秒,并最终输出为1BIT信号。
首先傻子也能看出来DSD的采样率要远高于CD的44.1,但PCM不只是只有CD的44.1KHZ采样率,同时还是多比特流,DSD则是单BIT流,1BIT,2.8244MHZ的DSD采样换算的话基本上也就相当于16BIT 176KHZ的PCM采样(没记错的话),所以相对如今的32BIT 384KHZ的数码母带流来说已经没有采样率上的优势了。
但我一直有个疑问,如果说SACD由于采样率的优势比同样采样率较低的CD好听的话,为什么有些使用DSD标准去转录CD,然后通过DSD播放器播放还是比原来的CD好听呢?要知道CD中的信息量就这点,即使你用DSD去录理论上原始信息量也不会增加。我自己觉得这可能还和1BIT流的解码方式有些关系。
关于1BIT解码的理论,网上的相关解释摘录如下:
【单比特技术最重要的目的就是要将多比特的数码信号直接以1bit DAC进行解码,再利用模拟电路或数码电路将数码音频信号调变为模拟音频信号。其最大的好处是它不再像多比特解码器一样需要用到16或18、20、24个很精密的基准电流来代表经过量化后的多比特(16、18、20、24bit)数码音频信号。因为,多比特系统在低频部分由于基准电流太低的原因,使信号变得相当微弱,如果电源或电路设计不当,就很容易造成解析力大幅度降低,一般来说,多比特系统常见的非线性失真及过零失真就是这样造成的。因此,采用单比特技术可以避免多比特系统容易造成的非线性失真及过零失真。
多比特系统的解码原理是:一次对16个数码位(或18、20、24个数码位)进行解码,数码信号不需要经过调变的过程,也就是说,不需要重新排列信号。
DSD的技术,简单地讲它是将信号以2.8224MHz采样、经多阶Δ-Σ调制,输出1bit信号流。在整个SACD系统中,都按照1bit的规格进行编码解码,因此相比PCM少了采样精度交替变换带来的音质劣化。
单比特系统的解码原理是:一次对1个数码位进行解码,数码信号还需要经过一个调变电路(Delta Sigma),也就是说,还需要重新排列信号,将处理过的单比特数码信号连贯起来,送1bit DAC进行解码。而这样对信号的处理方式,就称为Delta Sigma方式。其原理是:先对接收的数码位进行超取样及插值运算处理(可以接收16~24bit数码信号),然后再进行Delta Sigma调变,将调变数据送1bit DAC进行解码后,再转换成模拟信号输出。举例来说,一串用细绳穿起来的珠链。我们用两种方法将细绳上的珠子取下来,第一种方法是:分若干次取,每次取下固定数量的珠子;第二种方法是:有多少颗珠子就取多少次,每次只取一个珠子。实际上,第一种方法就相当于多比特方式,只有接收到全部16位数码后,才进行一次解码处理。第二种方法就相当于单比特方式,一个数码位一个数码位、连续不停地解码处理。】
以我拙计的智商,我觉得这段引述告诉我们这样几个事实:
1)PCM由于是多比特解码,用料电路较讲究,设计难度大,DSD的设计难度小,反而容易出好声。
2)DSD由于是连续的“珠子”,线性感更好(是否是回放音质好的一个原因?)
3)每次取16个珠子容易取错(造成失真),每次只取一个珠子不容易发声错误(降低失真)。
4)一个珠子接着一个珠子,意味着动作重复频率高,对时钟精度的要求也相对更高。
关于PCM和DSD各自的理论、优缺点,技术发展其实还有很多很多说法,我能力有限就不班门弄斧了,有兴趣的大家可以去看相关方面的专业资料。
接着聊聊DSD的播放。
由于SONY对DSD格式传输上的保护措施,DSD直到现在也只是部分开放,而不是完全放开。SACD(DSD)的破解还要源于SONY自家PS3游戏机的的乌龙(不细说了,有兴趣可自己搜索),不过,是真乌龙还是假乌龙就难说了,SONY在历史上明修栈道暗渡陈仓的事情也不是没做过。
但DSD或者说SACD最近两年的疯狂蔓延及普及除了PS3的乌龙事件导致了SACD被RIP成功外,更重要的是像ES9018这样新一代DAC芯片的出现。
由于这些DAC内置了对于DSD的解码功能(9018还特意针对DSD解码做了优化),所以这些以往只有业界大佬,如dCS,EMM才掌握的核心结束一夜之间如雨后春笋一般冒了出来,并落入凡间。任何有点制作能力的小厂商,只要利用这些专业DAC,也能立刻制作出一款DSD解码器,他们不再需要去考虑如何编写艰深DSD CODE,因为这些DAC芯片都替他们代劳了(而这恰恰是以往EMM这类厂商的核心竞争力),由于ES9018对于DSD解码的能力还很强悍,所以电路上注意些,甚至出来的声音都还不差。。。
于是你可以发现,这两年来,是个DAC,甭管价格多便宜,只要用了9018,都宣称我们能解DSD哦~(近期这趋势还蔓延到随身领域,如HIFIMAN 901,AK120等)。同时DSD也借着不断发展的网络带宽及正在普及的PCHI的顺风车,迅速进入了发展史上的快车道,我个人觉得DSD的黄金时代已经到来了!
关于DSD的播放,到目前为止,大致上就我所知道的有4种途径:
1)最传统的SACD 碟片的播放,一台SACD机是必不可少的。
DSD当年是为了SACD特意做的编码,有意思的是,十几年来不断累积SACD碟片资源反过来倒是为如今DSD在网络数字时代传播打下了一个良好的基础:SACD虽然没有CD多,但声音比CD好,资源数量上却比最新的BD CD要多;虽然比CD容量要大,但没大多少,很适合目前的网络带宽,而BD数字流动辄30G以上的容量对目前的网络带宽也是考验。
2)通过DAC解码播放,目前最常见的是PC上通过能够对应DSD格式(如SACD ISO,DFF等)的播放软件,通过USB传输DoP信号给能够解码DSD的DAC进行解码,然后播放。
这种模式根据传输线路的不同还可以衍生为通过网线(网络)、同轴、光纤等播放。关于传输后面会说到,具体还是有些区别的。
3)通过SD卡等媒介,直接播放上面的DSD格式文件,如最近SONY新推出的D100录音笔就能播放DFF格式的DSD文件,我的小解码器因塔维也可以直接播放,再如大家熟知的HIFIMAN901等等。
这种方式其实和上一种没有本质区别,应该也是利用DAC的解码能力(传输上不经由USB),但这种模式比上一种着实方便不少。强悍者如最近乾隆盛推出的QA860竟然还支持SD卡直接播放SACD ISO。。。我不知道如何做到(好像是我所知的第一家),但貌似DSD是越来越不值钱了,总觉得EMM将来的日子会很凄惨啊。。。
4)被很多人忽视的~BD机通过HDMI同样可以播放SACD,而且还是真正原生的DSD流播放。
基本上目前市面上你能找到的也就这几种模式了。
花开两朵,各表一枝~再让我们来说说DSD格式的传输。
方才说了,DSD并未完全开放,所谓的开放就是指的DSD信号的传输。SONY一直对自家音频技术采取加密及严格限制传输途径的方式,最初SACD是无法通过数字口传输的,只能通过SACD机的内置解码后模拟输出(如今BD也是,水印技术更要命)。若是撇开敏感的版权问题不谈,其实这也变相的限制了SACD作为一种更好的音频载体始终不如CD普及的原因之一。要命的是,和游戏机不同,纵使SONY对自家游戏机不断升级,重重加密,严防死守,黑客们对破解它的兴趣始终浓厚且持之以恒,SONY越守激起的挑战欲望就越大,反到是黑客们对音频领域这块基本涉及甚少。可笑的是,就像之前所说,SACD遭到RIP最终却是通过PS3的漏洞实现的,着实也算是一种讽刺了。
2012年,SONY突然想开了,决定放开对SACD的传输限制。一方面可能觉得SACD被破解,守不住了,又呈明日黄花之势,也就无所谓了;另一方面可能也是便于自家之后推出相关的DSD数位产品考虑,看看是否能让这个格式发挥余热,再创造点利润。
总之,允许了DSD数据通过USB口进行传输。之后大家就看到市面上各种带USB接口的DAC纷纷开始升级型号,支持起DSD播放来。
但其实早在SONY放开DSD USB的传输之前,DSD已经可以通过HDMI的高清接口进行“合法”的传输了。
这又要归功于BD这种SONY力挺的新一代音视频格式(大多数只了解HDMI是高清的视频接口,但其实更是种NB的音频格式接口),而SONY最初恰恰又是通过PS3来推广BD格式的,真的非常有意思,DSD无论在哪个阶段仿佛总是和PS3这个毫无相同属性的兄弟有着剪不断理还乱的缘分
目前已知的DSD传输途径基本有以下几个:
1)HDMI是目前真正能支持DSD原码流输出的接口,HDMI的接口芯片标准本身已经带有DSD/I2S格式的传输功能接口,也是版权合法的输出方式之一。
我家的BD机能够播放SACD,但无法通过任何数字输出接口如同轴,光纤输出SACD信号,唯一支持的就是通过HDMI输出DSD信号。HDMI接口若是作为音频接口来讨论的话,细说起来可以是个长篇,要是大家有兴趣可以自己去研究。顺便一说,BD这个新的视频格式,若是用作音频,除了拥有强悍的多声道能力,2声道也是非常牛的。我自己买过张2L的纯BD CD试音碟,同盘也随附一张内容一样的SACD,AB了一下,BD的声音比SACD更细腻,更清晰好听,可惜BD CD面临的问题也和SACD一样,网络数字流已是潮流所趋,作为实物BD如何普及是个问题。
遗憾的是,HDMI虽然天生就能输出原生的DSD信号,可基本没有哪家音频专业公司会采用这个接口制作自己的DSD解码器(带HDMI输入和输出)。以前的一个主要原因是老的SACD机都没有HDMI输出能力,可如今BD机已经普及,AV功放也都标配有HDMI输出,却还是没有哪家HIFI/HI-END老牌厂商尝试去做HDMI输入的DSD解码,很是奇怪(或许我寡闻了)。目前为止我只在网上发现一家DIY专门做了这个功能(HDMI输入)的DSD DAC,上一张图片吧。
2)通过DoP信号传输。我们目前常见的通过USB传输DSD信号也好,通过网线、同轴,光纤及其它类似数字端口传输基本上都是以此技术为基础衍生的。
DoP即DSD over PCM技术,简单说就是把DSD的声音资料放进PCM的架构中,并通过借助PCM流进行传输的一种技术。
为什么要借用PCM流?原因很简单,因为大部分现在流行的数字输入输出接口通常只支持PCM传输,不支持DSD。单独为DSD再开发一种接口成本过高也无法普及,可行的方式就是利用现行可传输PCM的各种方式中巧妙编入DSD信号,借腹生子。
至于如何让DSD伪装成PCM呢?从网上再次摘录一段说明供大家参考(以通过USB传输为例子):
【因為Apple OS 只容許PCM的傳輸途徑,因此我們必須尋找一個方法把DSD的聲音資料放進PCM的架構中,然後透過內建的USB驅動程式來傳送。為了要明確的在PCM的串流資訊中辨識出何時是DSD或是何時是PCM的資料,我們需要額外的位元,PCM比較高的規格是24位元/176.4kHz,這給予我們8個位元來當做辨識的標記,8位元有256種狀態可以標示,而我們其實只需要分別兩個狀態(DSD & PCM),8個最顯著的位元用來當做 DSD的標記,其餘跟隨的則是取樣資料從0x05 到 0xFA。每一個音軌內的取樣都包含有相同的標記,這已經是我們挑選過在當接收端的硬體誤判DSD的訊號為PCM時,最能有效降低爆音的方式,如果它真的不幸產生,他會在88kHz附近產生一個大約 -34db的雜音,這對於音質幾乎無損,而且大多的D/A轉換器都會在它抵達喇叭前就壓制到一個相當的程度,反之若錯誤的將PCM資料當成DSD來解讀,則只會製造出更少可預測的爆音。 留下的16的較低的位元則用來存放DSD的資料,第一個位元從t0開始。USB Audio的規格則將每一個PCM的Frame指派給特定的音軌 (左, 右...等) ,而當使用來傳送DS串流資料時,每一個PCM Frame 只包含相關連於其指派音軌的DSD資料。】
上面这段技术说明比较艰深,看看就可以,而我拙计的智商又告诉我两点:
1~DoP技术的传输的DSD信号不是原生的,更多的是出于现实考虑的一种妥协的传输方式,由于是拟态PCM,DAC做的不到位肯定容易发生某些误判,比如PCM/DSD误判,爆音等,上面也有提到。所以各位用上USB DSD解码的也不用太乐,这种方式未必是比HDMI原生DSD流更好的传输方式。
2~通过这种技术,除了USB,网络,同轴应该也可以输出DSD信号。理论上应该都是一样的,据我所知,QA860就可以通过同轴输出DoP信号实现DSD输出。通过网络我一时想不起哪台机器可以播放DSD,但应该也会有。我比较好奇的是,无线网路是否也可以利用这种技术实现DSD传输呢?
3)通过SONY的SPDIF-3标准数字端口进行DSD传输。
说起来知道这种方式也是巧合。之前我在关注Brocksieper的新DAC,官网上标明DSD READY但机器本身却没有USB口,我很疑惑那它通过什么端口输入DSD信号呢?然后我发了邮件特意问题了德国老头这个问题,没想到老头还真回信告诉我是通过SPDIF-3的标准输入DSD信号。
SPDIF-3是SONY数字接口格式针对DSD改写版,它使用分立的BNC接头连接左右通道和字同步信号(见下图)传输DSD信号(最右边的六个,输出与输入各三)。
我们都知道SPDIF数字端口可以传输PCM信号,SPDIF-3应该是SONY为了DSD在专业领域的传输(母带制作)而特意制定的标准,或者说这就是SONY在DSD专业数字领域的标准接口了。显然通过SPDIF-3传输的DSD也是原生DSD信号且“合法”的。除了以上两种方式,专业录音室及相关器材使用SPDIF-3传输DSD信号应该是比较普遍的方式。
4)其它各类专业DSD传输接口。
其实DSD格式的传输一直没有一个非常统一的标准,实际情况比较混乱。除了以上3种主流的传输方式,各大厂商也有自己定制的DSD传输接口,比如下图的EMM专业DSD ADC8 MK4的DSD接口(上排最右边的3个)。
显然这种接口只能配合EMM自己的器材使用,和它家并不通用,而之前说的3种方式都是有其通用性的。
总之,DSD主流的传输方式目前无非3种,第四类存在各大厂商自我定制但没有泛用性。
日后若有时间,还会再聊聊DSD的音质,此篇到此结束。
|