分享

采样频率越高越好吗?升频好听吗?

 冷峻MYAE 2023-07-20 发布于上海

近日,AudioOnes「本职音频」主事人欧阳锋在国潮HiFi公众号平台撰文《采样频率越高越好吗?升频好听吗?》,现内容转载如下:

在讲采样率是否越高越好之前,先要花多一点篇幅讲讲数字采样的一个认知问题,因为常看到一些大湿说模拟是线性的,数字是卡点取样,点与点之间有空白,所以数字的声音冷硬。大湿这样说,大部分发烧友也随之人云亦云。

数字采样做不到模拟的线性连贯吗?

模拟信号在幅度取值上是连续的,但连续并不代表模拟信号的分辨率是无限高的。连续的含义是某一取值范围内可以取无穷多个数值,它的分辨率被定义为不会被底噪掩盖的最小信号。

而模拟信号的数字化转换,首先要在时间上进行离散化处理,即在时间上用有限个采样点来代替连续无限的坐标位置。采样就是从一个时间上连续变化的模拟信号中取出若干个有代表性的样本值,来代表这个连续变化的模拟信号。因此,很多人就开动脑放,抓着这个来说数字采样是卡点,点与点之间是不连续的,所以信号有失真,声音听上去冷硬薄。

图片

但别忘了采样还要讲采样频率,即在1秒内测定波形的次数,速度越快可捕捉的频率越高。如CD的采样频率44.1kHz,就是以每秒44100次的速度来取得样本(常见的采样率还有48kHz88.2kHz96kHz),即1秒中有44100个样值(88200个立体声样值),甚至一些过采样技术会以基准采样频率的64倍或128倍进行采样!想象一下这些采样频率分割时间的密度,是可以无限接近测定波形的,别忘了本身模拟波形的分辨率也不是无限高的。

采样就像对测定波形进行“快照”一样,这与移动的画面是由一系列静止图像合成的过程非常相似。看电影、动画片时你会感觉画面是一帧一帧的吗?人类是有视觉阈限和听觉阈限的!

数字音频真的是因为卡点采样而不好听吗?

其实数字信号真正的失真来自于采样后的量化。采样把模拟信号变成了时间上的离散的样值序列,但每个样值的幅度仍然是一个连续的模拟量,因此还必须对其进行离散化处理,将其转换为有限个离散值,才能最终用数码来表示其幅值,这个过程称为量化。

图片

同样,量化需要讲量化精度,就是指用来存储数字化数据的数字的大小,数字越大本底噪声越小。比如16bit音频有65536个量化值,本底噪声-96dB24bit音频有16777216个量化值,本底噪声-144dB(这是理论上的,实际很多更接近-110dB)。其实16bit的噪声已经很低了,使用24bit的意义在于运算需要, 因为它能承载更大的动态范围,更容易处理高频噪声。

不管量化精度如何,信号在被量化时会引入失真,包括谐波失真、谐波与低频成分相混叠而产生的失真、互调失真,以及其他许多我们不希望听到的失真。正是这些失真让声音变得刺耳、失去温暖感或纵深感。而对于数字域的失真是有很多方法可以控制的。

图片

例如上图是量化后的正弦波的部分图像。由于在两个量化数值之间的信号无法分辨,所以图中的信号呈现“阶梯状”的失真。低电平信息完全丢失了,我们可以采用抖动(Dither)来避免这种失真。从数学上讲,抖动能完全消除哪些我们不愿听到的失真,将那些失真转化为一个固定电平的噪声。总之,抖动技术不但消除了“阶梯”失真,而且还将系统的分辨率提高了好几个十进制数量级。

相应地,在D/A数模转换时可以设置重抖动、过采样、低通重建滤波器,以滤除多余的高频分量,只把原始信号频谱取出来,并将量化阶做平滑处理,将音频信号复原为原始的连续变化的电压。

图片

因此,如果说数字音频不好听,只能说是设计不够好的数字音频产品不好听,就如模拟音频产品里面也有不好听的产品一样以上只大致描述模拟转数字转模拟,即A/D/A的过程,着重介绍采样和量化的概念,更详细的理论和技术可阅读数字音频技术相关书籍。)

采样频率越高越好吗?升频好听吗?

前面说了采样和采样频率、量化和量化精度的问题,下面回归正题,说说采样频率和升频。

即使在唱片制作中,一些录音工程师也认为高采样频率制作出的唱片会更加好听,并具备更高的重放频率上限,他们还引用高采样频率唱片所具备的开阔、温暖、宽广、延展等声音特征来支持自己的观点。但是,我们不妨从另一个角度对比做出解释:首先,较高采样频率录制的声音中的超高频是人耳听不见的,这一客观局限说明宽频带带宽不能成为优秀重放声音质量的理由。既然我们之中大部分人都无法听到超过15kHz的声音,那我们的耳朵又如何能区分44.1kHz、96kHz甚至192kHz采样频率所造成的声音差别呢?

图片

而在音频回放中,一些音响发烧友和专业人士尝试在数模转换器(DAC)之中进行采样频率上转换,并给出很多华而不实的理由来证明他们的观点。请记住,44.1kHz采样频率录制的唱片已经经过了滤波处理,不可能包含任何高于22.05kH以上的频率信息。采样频率上转换(升频)也不可能生成本来不存在的频率信息。已被母带大神Bob Katz实验验证的结论是,我们能感知采样频率造成的声音差别主要在于滤波器的设计,而不是那些超声波带宽。

图片

看到这,可能有人会问那是不是44.1kHz采样频率就足够了?音响研究者、感知编码科学的发明家Jim Johnston对于人耳的时域响应特性了解颇深。他的研究表明,处于或接近人耳高频上限频点的陡降低通滤波器会与人耳耳蜗滤波器相互作用产生预回声,这张被人耳认为是瞬态响应的缺失,从而模糊声音的清晰度。Jim通过实验计算出能够支持奈奎斯特滤波器足够平缓地避开人耳这种效应的最低采样频率为50kHz。因此,如果他的说法是正确的,48kHz的专业采样频率就已经足够了。

所以44.1kHz的采样频率也已经非常好。想想录音公司不论是采用48kHz/24bit或者96kHz/24bit的标准来制作唱片,在母带输出制作CD时都要下转换为44.1kHz/16bit。但实验表明44.1kHz这一采样频率向更低采样频率(如MP3)转换将会彻底地降低音质,而通过一个优化的采样频率上转换DAC进行处理的原96kHz声音与44.1kHz的结果相比,差别是很细微的。一个优质的DAC在使用不同采样频率时,就应该展现尽可能少的可闻性差别。

图片

正如我们在上一篇Geek日记《为什么你的数播不好听?你根本不懂玩数播!》中说的,作为消费者,我们根本不清楚录音公司的原生录音规格是48kHz/24bit还是96kHz/24bit,还是更高?要知道更高规格的意义在于运算时能承载更大的动态范围,方便处理高频噪声,但也会使设备运算负荷加重,速度变慢,对于文件保存更无意义,只会增加录音制作和重播的硬件成本(需要更高精度和运算速度的设备)。

我们一直建议AudioOnes数播用家不用太执着于音频文件的规格,CD标准以上的都接受。目前国外很多录音公司数字文件发行的专辑大多是96kHz/24bit了,我们也无需去考究原生录音规格是多少,更无必要去做升频处理,关键还是文件来源的质量保证。可能你也会发现一些352.8kHz/24bit DXD规格的文件听起来声音并不好,这或者涉及到另一个话题“录音质量”。

图片

总的来说,数字音频就是算术,其计算的精度以及工程师(或者工作站)进行运算的不同方法都会给最终的声音带来巨大的不同。再一次说明,我们能感知采样频率造成的声音差别主要在于滤波器的设计,而不是那些超声波带宽。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多