分享

聊聊DSD的那些事

 mm0123 2015-07-28

聊聊DSD的那些事-转自sina blog,原作者bule

 
本帖最后由 Arvin.G 于 2014-6-27 18:48 编辑

       最近自己一直在关注和了解DSD方面的信息,因为自己的DAC能SD卡直播DFF格式文件,于是乎下载了很多SACD,再从里面抽取DFF文件格式用于播放。

       实际自己听下来,DSD格式确实有一套(不管前期是不是PCM转的,大家都知道其实很多都不算是DSD直录)。
年龄与阅历关系,LP我几乎没啥接触,最早涉及的音乐媒体就是卡带,然后CD、MD、DAT,MP3一步步下来。让我选的话,高端的模拟音源格式(LP/金属带/)当是首选(还有更好的开盘带),但这是一个非常折腾人的选择,昂贵,状态难以保证,使用不便等等,自己玩过卡带颇有感触。那剩下的都是数字格式了,0和1,区别无非是怎么排列0和1的问题,而这之中DSD应该是目前听起来最悦耳的数字编码格式了。
DSD的基本概念,抄袭百度百科上的解释是最直接准确的:DSD是Direct Stream Digital的缩写,表示直接比特流数字编码,是SACD(Super Audio CD)的编码模式。

       在说DSD前不得不先说说PCM,也就是我们最常见CD的数字编码格式。因为基本概念都是相同的,DSD也是基础之上的改良及演化而来。
说到CD基本上都知道:16BIT/44.1KHZ,就我自己的理解,简单形象的说,如果下图中的这条曲线表示声音在自然界中1秒钟的波形的话,我们在用数字0和1模拟(采样)这个波形的时候,一秒内采样了44100次,而16BIT则代表采样的这些信息被记入了16位深的数据元中。


       随着PCM数字技术的发展,PCM采样已经从当初的CD标准(16BIT/44.1KHZ)发展到了如今数字母带标准(32BIT/384KHZ),但其基本概念并未有改变。上图中的前半部分竖线表达了采样频率越高,采样间隔时间就越短,所获得的的声音就更加细腻流畅。后半部分的横线则表达了位深越大(比如24BIT),单位数据内可供描述声音信息的空间就越宽(信息量越大),则声音的精度就越好。
如果把LP的模拟声想象成一个圆的话,数字音频的工作重点始终是:想办法让0和1模拟出来的声音无限的接近“圆”,无疑24BIT,192KHZ甚至32BIT,384KHZ采样肯定比CD是要更好的(只是单纯从理论上来说,与实际录音品质无关)。这个很好理解,你拿一张白纸,上面画上44个点连起来,和画上192个点连起来,肯定后者更连贯更圆,所以,著名的专业DAC厂商,LAVRY的老板说的24BIT 94KHZ的声音最好,再上去采样虽然高但声音只会糟糕的说法我一只也持有疑问。
当然,我不是理论党,更深奥层次的技术研究很苦手本文也不打算深入探讨了,先说PCM的采样和位深主要目的是方便对比下面的DSD格式而已。


       如上图,DSD通常以64位的DSD来说,即以1BIT 2.8244MHZ的标准,是CD的44.1KHZ的64倍采样率,也就是2824400每秒,并最终输出为1BIT信号。首先傻子也能看出来DSD的采样率要远高于CD的44.1,但PCM不只是只有CD的44.1KHZ采样率,同时还是多比特流,DSD则是单BIT流,1BIT,2.8244MHZ的DSD采样换算的话基本上也就相当于16BIT 176KHZ的PCM采样(没记错的话),所以相对如今的32BIT 384KHZ的数码母带流来说已经没有采样率上的优势了。

       但我一直有个疑问,如果说SACD由于采样率的优势比同样采样率较低的CD好听的话,为什么有些使用DSD标准去转录CD,然后通过DSD播放器播放还是比原来的CD好听呢?要知道CD中的信息量就这点,即使你用DSD去录理论上原始信息量也不会增加。我自己觉得这可能还和1BIT流的解码方式有些关系。

关于1BIT解码的理论,网上的相关解释摘录如下:
      
       单比特技术最重要的目的就是要将多比特的数码信号直接以1bit DAC进行解码,再利用模拟电路或数码电路将数码音频信号调变为模拟音频信号。其最大的好处是它不再像多比特解码器一样需要用到16或18、20、24个很精密的基准电流来代表经过量化后的多比特(16、18、20、24bit)数码音频信号。因为,多比特系统在低频部分由于基准电流太低的原因,使信号变得相当微弱,如果电源或电路设计不当,就很容易造成解析力大幅度降低,一般来说,多比特系统常见的非线性失真及过零失真就是这样造成的。因此,采用单比特技术可以避免多比特系统容易造成的非线性失真及过零失真。
多比特系统的解码原理是:一次对16个数码位(或18、20、24个数码位)进行解码,数码信号不需要经过调变的过程,也就是说,不需要重新排列信号。
DSD的技术,简单地讲它是将信号以2.8224MHz采样、经多阶Δ-Σ调制,输出1bit信号流。在整个SACD系统中,都按照1bit的规格进行编码解码,因此相比PCM少了采样精度交替变换带来的音质劣化。

       单比特系统的解码原理是:一次对1个数码位进行解码,数码信号还需要经过一个调变电路(Delta Sigma),也就是说,还需要重新排列信号,将处理过的单比特数码信号连贯起来,送1bit DAC进行解码。而这样对信号的处理方式,就称为Delta Sigma方式。其原理是:先对接收的数码位进行超取样及插值运算处理(可以接收16~24bit数码信号),然后再进行Delta Sigma调变,将调变数据送1bit DAC进行解码后,再转换成模拟信号输出。举例来说,一串用细绳穿起来的珠链。我们用两种方法将细绳上的珠子取下来,第一种方法是:分若干次取,每次取下固定数量的珠子;第二种方法是:有多少颗珠子就取多少次,每次只取一个珠子。实际上,第一种方法就相当于多比特方式,只有接收到全部16位数码后,才进行一次解码处理。第二种方法就相当于单比特方式,一个数码位一个数码位、连续不停地解码处理。

       以我拙计的智商,我觉得这段引述告诉我们这样几个事实:
1)PCM由于是多比特解码,用料电路较讲究,设计难度大,DSD的设计难度小,反而容易出好声。
2)DSD由于是连续的“珠子”,线性感更好(是否是回放音质好的一个原因?)
3)每次取16个珠子容易取错(造成失真),每次只取一个珠子不容易发声错误(降低失真)。
4)一个珠子接着一个珠子,意味着动作重复频率高,对时钟精度的要求也相对更高。
关于PCM和DSD各自的理论、优缺点,技术发展其实还有很多很多说法,我能力有限就不班门弄斧了,有兴趣的大家可以去看相关方面的专业资料。接着聊聊DSD的播放。

       由于SONY对DSD格式传输上的保护措施,DSD直到现在也只是部分开放,而不是完全放开。SACD(DSD)的破解还要源于SONY自家PS3游戏机的的乌龙(不细说了,有兴趣可自己搜索),不过,是真乌龙还是假乌龙就难说了,SONY在历史上明修栈道暗渡陈仓的事情也不是没做过。
但DSD或者说SACD最近两年的疯狂蔓延及普及除了PS3的乌龙事件导致了SACD被RIP成功外,更重要的是像ES9018这样新一代DAC芯片的出现。



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多