分享

音频处理中需要用到的关于声乐的基本概念

 openlog 2020-03-09

参考文献: 图解泛音及形成原理

  • 音的高度:=音的振动频率(正比)
  • 音高的计量:钢琴上每七个白键一个循环,分别叫做CDEFGAB(为何不是从A开始,而是从C开始?这是个历史问题。。。),也就是我们熟知的”Do Re Mi Fa So La Si”,过了一个循环就下标加一,又叫升八度,即,C1, C2, C3, C4…
  1. 高八度的声音,频率高一倍,也就是说,C2比C1的频率高一倍,C3比C2的频率高一倍。
  2. 钢琴中央C是C4,中央区的A键为440Hz(即标准音高。—–那为何标准音高又是用A来制定的呢?目测是制定者想纠正前面的错误
  3. 众所周知”Do Re Mi fa So La Si”是七个音,那为何有八度之说呢?

    原因很简单,在这个系统里,没有一度!


    比如C D之间,这叫二度,C E之间叫三度,以此类推。非要说有一度那也是有的,C C就是了!

    可是前面我们知道自然音的间距是不等的,那怎么办?所以就有了大小之分:C D之间差2key,所以叫大二度,E F之间差1key,所以叫小二度。以此类推。所以

小二度 = 1 key

大二度 = 2 key

小三度 = 3 key

大三度 = 4 key

纯四度 = 5 key

减五度 = 6 key

纯五度 = 7 key

小六度 = 8 key

大六度 = 9 key

小七度 = 10 key

大七度 = 11 key

纯八度 = 12 key

所有有人说“今天唱xx升了小二度”,意思是升了1key。

  • 谱对比表及频率

     

    国际谱

    男唱谱 女唱谱 频率
    C0 C1 C2 16.35
    C#0/Db0 #C1 #C2 17.32
    D0 D1 D2 18.35
    D#0/Eb0 #D1 #D2 19.45
    E0 E1 E2 20.6
    F0 F1 F2 21.83
    F#0/Gb0 #F1 #F2 23.12
    G0 G1 G2 24.5
    G#0/Ab0 #G1 #G2 25.96
    A0 A1 A2 27.5
    A#0/Bb0 #A1 #A2 29.14
    B0 B1 B2 30.87
    C1 C C1 32.7
    C#1/Db1 #C #C1 34.65
    D1 D D1 36.71
    D#1/Eb1 #D #D1 38.89
    E1 E E1 41.2
    F1 F F1 43.65
    F#1/Gb1 #F #F1 46.25
    G1 G G1 49
    G#1/Ab1 #G #G1 51.91
    A1 A A1 55
    A#1/Bb1 #A #A1 58.27
    B1 B B1 61.74
    C2 c C 65.41
    C#2/Db2 #c #C 69.3
    D2 d D 73.42
    D#2/Eb2 #d #D 77.78
    E2 e E 82.41
    F2 f #F 87.31
    F#2/Gb2 #f F 92.5
    G2 g G 98
    G#2/Ab2 #g #G 103.83
    A2 a A 110
    A#2/Bb2 #a #A 116.54
    B2 b B 123.47
    C3 c1 c 130.81
    C#3/Db3 #c1 #c 138.59
    D3 d1 d 146.83
    D#3/Eb3 #d1 #d 155.56
    E3 e1 e 164.81
    F3 f1 f 174.61
    F#3/Gb3 #f1 #f 185
    G3 g1 g 196
    G#3/Ab3 #g1 #g 207.65
    A3 a1 a 220
    A#3/Bb3 #a1 #a 233.08
    B3 b1 b 246.94
    C4 c2 c1 261.63
    C#4/Db4 #c2 #c1 277.18
    D4 d2 d1 293.66
    D#4/Eb4 #d2 #d1 311.13
    E4 e2 e1 329.63
    F4 f2 f1 349.23
    F#4/Gb4 #f2 #f1 369.99
    G4 g2 g1 392
    G#4/Ab4 #g2 #g1 415.3
    A4 a2 a1 440
    A#4/Bb4 #a2 #a1 466.16
    B4 b2 b1 493.88
    C5 c3 c2 523.25
    C#5/Db5 #c3 #c2 554.37
    D5 d3 d2 587.33
    D#5/Eb5 #d3 #d2 622.25
    E5 e3 e2 659.26
    F5 f3 f2 698.46
    F#5/Gb5 #f3 #f2 739.99
    G5 g3 g2 783.99
    G#5/Ab5 #g3 #g2 830.61
    A5 a3 a2 880
    A#5/Bb5 #a3 #a2 932.33
    B5 b3 b2 987.77
    C6 c4 c3 1046.5
    C#6/Db6 #c4 #c3 1108.73
    D6 d4 d3 1174.66
    D#6/Eb6 #d4 #d3 1244.51
    E6 e4 e3 1318.51
    F6 f4 f3 1396.91
    F#6/Gb6 #f4 #f3 1479.98
    G6 g4 g3 1567.98
    G#6/Ab6 #g4 #g3 1661.22
    A6 a4 a3 1760
    A#6/Bb6 #a4 #a3 1864.66
    B6 b4 b3 1975.53
    C7 c5 c4 2093
    C#7/Db7 #c5 #c4 2217.46
    D7 d5 d4 2349.32
    D#7/Eb7 #d5 #d4 2489.02
    E7 e5 e4 2637.02
    F7 f5 f4 2793.83
    F#7/Gb7 #f5 #f4 2959.96
    G7 g5 g4 3135.96
    G#7/Ab7 #g5 #g4 3322.44
    A7 a5 a4 3520
    A#7/Bb7 #a5 #a4 3729.31
    B7 b5 b4 3951.07
    C8 c6 c5 4186.01
    C#8/Db8 #c6 #c5 4434.92
    D8 d6 d5 4698.64
    D#8/Eb8 #d6 #d5 4978.03
  • 泛音:泛音是物体局部振动产生的。

非常清楚的局部振动,一根弦分成四段分别进行振动。这四段的振动频率是一样的。

我常讲的第一泛音,第二泛音就是这样的:

图上依次是基频,第一泛音,第二泛音。。。

可以看到,分的段越多,形成的频率越高。比如分两段,那频率就是基频的二倍。

真实的声音就是这些振动的叠加。

  1. 泛音形成的原理:驻波

    视频里很好的展示了驻波形成的原理,同频波经过反射形成了叠加。所以,能形成驻波,必须是物体长度是1/2波长的整数倍。这样才能形成叠加。

    这就是物体振动总是有固定频率和固定音色的原因:只有一些频率的波才能在物体中形成驻波,从而持续下去。其他频率的波很快就会能量消散掉。

    所以一个音叉,你怎么敲它,它都是那个振动频率,就是这个道理。

  2. 那怎么调节音高?

    参考弦乐,一根两端固定好的弦,本身的频率是固定的。改变音高的话:

    1. 把弦拉紧一点。

    2. 用手指按住一点,让弦的一部分不振动,可振动部分长度缩短。

    声带也是一样的道理:

    1. 拉紧声带,可以获得更高的音高。放松声带,音高变低。

    2. 捏住声带的一部分不发声,让另一部分发声,这样音高就提高了。这就是近年来所谓关闭唱法的基本原理。(关闭唱法的提法我认为是有问题的)

  • 人声的情况

    人声的情况要复杂一些,因为声带不是一个简单弦,它是一个立体的东西,更像这个图:

    立体的基频与第一泛音。

    人声还有共鸣的问题,会大大改变泛音的构成。

     

    基频决定音高,泛音决定音色。

    这句话是音频处理的核心。

  • 什么是频率?频率就是单位时间内波形重复多少次。

    上面这句没有疑问吧?那么我们看图

    假定这就是单位时间的波形图。第一张图的频率是2,第二张图的频率是4,这都没什么疑问。第三张图的频率?根据定义,波形重复了两次,所以频率是2。

    这个例子告诉我们,2和4的两个波,合成之后频率是最大公约数2。

    来个更复杂的例子:

    4和6的波合成频率为2。这个例子告诉我们,即使没有2的波,合成规律依然要取最大公约数。

    当然,这个例子是有问题的,1。自然界没有这种声音,一定是2, 4, 6, 8, …一定带基频。2. 即使自然界真的制造了这个声音,也会被人耳判定成两个声音。

    自然界的 2,4,6合成,应该是这样的:

    不管怎么说,我们基本上可以得到一个结论,2, 4, 6, 8, 10,..这样的波合成,最终波的频率是2,即使原本频率2的那个波振幅很小。


参考文献:音色与声谱图

  • 泛音的种类和多少决定了音色

一般来说

1. 泛音越充分的声音越饱满。

2. 低频泛音越充分的声音听起来越“厚实”,越“有力”。

3. 高频泛音越充分的声音穿透力越强,声音听起来越“亮”,越“尖”。

4. 高低频都有并且合理分布的声音,就是比较完美的声音。

声乐理论里,一般把低频泛音叫低位置共鸣,高频泛音叫高位置共鸣。

  • 频谱图/声谱图

频谱图就是描述在某一时间点上,各个频率的声音分布情况。

然而,频谱图只能描述某一时间点,不能表达一段时间的情况,所以把频谱连续的画到一张图里,就有了声谱图(这个翻译有点蛋疼)。

先看上图:

横坐标是时间,纵坐标是频率值,同一时间的纵线上存在着数个波,重合而成最终的波。颜色越亮则表示波的振幅越大。混乱的背景都是伴奏,我们只观察人声线。

再看下图:

下图反映了上图的某个时间点(上图中的黄线)的频率分布。横坐标为频率,纵坐标为振幅。这个图更有利于直观的观察泛音的成分和强弱。

  • 音频采样率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。在当今的主流采集卡上,采样频率一般共分为11025Hz、22050Hz、24000Hz、44100Hz(44.1khz)、48000Hz五个等级,11025Hz能达到AM调幅广播的声音品质,而22050Hz和24000HZ能达到FM调频广播的声音品质,44100Hz则是理论上的CD音质界限,48000Hz则更加精确一些。

44,100 Hz - 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率

  • 音频解析的过程是:取连续采样点,一般是4096个点,考虑到音频文件的采样率一般是44.1k,所以就是取了1/10秒之内的数据。然后对这4096个点作做快速傅里叶变换,就得到了频谱图。频谱图的信息是4096个点,每一个点对应的是这个频率上的振幅。
  • 频谱图反应的是在这个时间点上的频率分布情况。

严格的说应该是这1/10秒内的平均情况。

  • 声谱图上出现的水平线有什么意义?

    水平线表示一个歌手在某个音高上持续了一段时间。越亮的线表示振幅越大,听感上当然就音量大了。

    直线就是一个长直音。考察长直音主要看稳定度,整个线越直则这个长音越稳,如果大抖就是破音,如果小抖就是不稳。如果歪了,那就是音准没把握好。

    波浪线就是颤音。波浪越大则颤音越大。看颤音也是看稳定度,如果颤的不稳就是气息出现问题,控制不好。

  • 如何看共鸣?

    看泛音主要看三点:丰富与否;分布情况;泛音的音量。

    点看全图

    一般来说,所谓的泛音强弱都是和自己的基频来比的(或者是跟伴奏比)。因为音频文件的音量是可以调的,单纯看泛音大小没多大意义,以基频为参照才比较有实际意义。(低频的共鸣情况取决于元音的类型,每一个元音都有其特定的共鸣特性。一般来说,基频被共鸣强化的情况比较少。)

    可以看到,此例中第一泛音巨大(看多了就知道,一般都是第一泛音最大),在3000左右的三个泛音也很强。

    另一种观察方法就是和伴奏比,人声线越明显则人声越强,越能穿透伴奏。

    如上图,左边张雨生的人声线显然更明显。右边那英的线就不明显多了,混在伴奏里。

再来看另一个例子

后知后觉对比版

http://v.youku.com/v_show/id_XNjI1NTAxMzQ4.html

点看全图

张雨生后知后觉清唱“你不辞冰雪”,竟然有如此大的高频泛音!

要知道,这可是清唱,中音区!唱高音的时候鼓足了气,有很大的共鸣很正常,但唱低缓的主歌,竟然也能爆出这么大的泛音!只能说宝哥太逆天!

下面,请出阿妹躺枪:

点看全图

(图中竖线为背景音,就是那个类似指响的声音)

泛音少太多了。。。。

听感上也是很显然的,阿妹的音色暗的多,而宝哥的非常的清亮。

当然,必须要说明:宝哥占了cd版的优势。不过我们关注的是最终听感,声音经过怎么处理并不是我们关注的重点。这个例子很好的对比了泛音对音色的影响。

  • 如何看音准?

    我的软件特别加了标准音高线,以及标准的泛音线,所以可以很清楚的看清音准:

    点看全图

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多