单从倍频程和钢琴调式这两个名词看,距离确实有点远,一个偏科技一个偏娱乐。但是距离远不代表没有关系,下面就让我们给它们俩拉拉关系吧。
作者:良逸,阿里云技术专家,阿里云音视频通信 QoS 研发
什么是倍频程
首先什么是倍频程?从中文字义上看,就是“X 倍频率的范围”,是截至频率和起始频率之比成倍数关系的频段。与之相对应的另一个概念是等宽频程,意思是截止频率和起始频率之差相等的频段。具体定义如下:
为什么要用倍频程?
我们知道人耳的听觉的频率感知范围在 20Hz-20000Hz,范围非常的广,分析的时候,需要将这个频率范围划分成不同的频段(频带)来分析,怎么划分呢?于是有了上文的两种划分方式,一种是等宽频程,意味着每个划分的频带宽度是相等的;另一种是倍频程,意味着每个划分的频带宽度与上一个紧邻的频带宽度符合等比数列。
如果采用等宽频程,要表现出低频到高频的声音信息需要的数据量非常大,效率比较低,而且人耳对高低频率的敏感程度是不一样的,通常人耳对低频部分的频率变化比较敏感,而对高频部分的频率变化不太敏感,所以采用倍频程更符合人耳的听力特点,而且提高了频带数据的分析效率。
还有一个跟倍频程有关的概念是中心频率,每频程的上限与下限频率的“几何平均值”称为该频程的中心频率 f0 。特定的中心频率 f0 就代表了一个特定的频段, f0 作为基准频率,只要确定了基准频率,整个 20Hz-20000Hz 的频率范围,就可以按照倍频程的定义分段展开。通常显示倍频程,是以其带宽的中心频率线性间隔的,这叫做倍频程格式。这会导致倍频程在频谱图对应的横轴上出现相同的间隔,即使它们间隔不是均匀的。如下图所示(引用网络公开测试结果,数据来源见图片下方):
图片数据来源:https://community.sw.siemens....
同一个白噪声表现为窄带(蓝色)和倍频程(紫色)格式,x轴是倍频程格式。注意到,与较高频率的倍频程段相比,较低频率处的倍频带的填充数据较少。如上表格所示,这是因为较高频率的倍频带覆盖的频率范围,相比较低频率的倍频带要宽。如果将x轴线性绘制的话,效果如下图所示(引用网络公开测试结果,数据来源见图片下方):
图片数据来源:https://community.sw.siemens....
与倍频程格式相比,上图绘制了与之前相同的白噪声数据,但x轴是线性格式。可以看出,功率谱(蓝色)在所有频率下具有相同的密度,但每个倍频带(紫色)覆盖的频率范围越来越大。
另外,因为选取不同的基准频率,最终展开的频段格式也不一样,那如何来选取基准频率呢?标准化组织根据不同的应用场景就给出了不同的倍频程的标准定义。在声学测量中一般采用 1/3 倍频程来对频谱进行分析,国标《GB 3240-1982 声学测量中的常用频率》中对其标准频率有如下的定义:
八度音阶
从这里开始我们看一下倍频程跟音乐有什么关系。我们搜索“倍频程”英文翻译的时候,会发现如下结果:
为什么倍频程跟八度音阶都是 Octave 一个词呢?其实倍频程是借用了八度音阶的理论,因为历史上人们对音乐的认知要早于信号频谱分析的理论的掌握。根据人们的经验,音调升高一个八度,频率就增加一倍,近代频谱分析技术出现后,恰好发现这个刚好满足倍频规律。因此就按频率重新定义八度音阶。其实八度音阶在频率这个概念出现前就有了。
我们大家都知道,简谱中的八度音阶是这个样子的:
低音 do 跟高音 do 之间相差 8 度音,也知道女生一般比男生声音高 8 度。
这里还要说一下音高的概念,音高的英文是 pitch,而 pitch 又翻译成基音,而且 Opus 编码器里面有个功能叫 Pitch Detection,翻译成基因检测,那基音跟音高是啥关系呢?物体震动产生的声音,其中包含很多频率成分,最低的那个频率称为基频,对应产生的声音就叫基音,其他的谐波频率成分产生的声音就叫泛音。其中基音决定了人耳听到的声音的音高,而泛音形成了不同的音色,不同乐器有不同的音色,就是因为其产生的泛音成分不一样。与倍频程相关的频率划分,以及与八度音阶相关的音高,都是指的基音的频率,与泛音没有关系。
十二平均律
我们再看一下八度音阶的特点。
我们会发现 mi 和 fa,及 si 和高音 do 之间是半音关系,其它每个音之间是全音关系。所谓半音关系意味着,半音关系的音高比全音关系的音高少一半。如果把八度音阶,按半音的频宽展开的话,将会产生 12 个半音宽的频带,这就是所谓的十二平均律,又叫十二等程律,现在的钢琴就是根据十二平均律定音的。终于跟钢琴扯上关系了。
我们又知道一个八度音阶,对应的低频和高频相差1倍,即一个倍频程,那等程分成 12 份的话,那对应的就是 1/12 倍频程。音乐领域的标准化又来了,下图就是国际标准音高与频率对照表:
此表规定 A4 的频率 440Hz 作为基准频率,按照 1/12 倍频程的关系将频谱展开,就得到了每个标准钢琴琴键对应的音高频率。同样钢琴上的中央 C,对应的就是 C4 的键 261.63Hz。
音名和唱名
我们看到八度音阶是 1234567(do re mi fa sol la si),而这里又出现了 CDEFGAB,学过音乐的人都知道,一个是唱名一个是音名。唱名是演唱用的,而音名则是与固定频率或音高挂钩的,不同的是,同一个唱名可以放在不同的音名上,可以在钢琴琴键上左右移动,但是不同的音名则是与固定频率挂钩,是不会移动的。
钢琴调式
有了全音、半音、音名、唱名,以及唱名可以在琴键上移动,就产生了调式。
首先,全音和半音的关系,决定了是大调还是小调。凡是音阶排列符合【全、全、半、全、全、全、半】结构的音阶,就是大调。一般来说,一首音乐作品的主音符是使用 1、3、5 的,而结束在 1 上的就是大调音乐。
凡是音阶符合【全、半、全、全、半、全、全】结构的音阶,就是小调。小调音乐一般第一个音符是从 6 或 3 开始,而结束在 6 上。
当然大小调还按照不同的变音规则有很多其他细分,这里就不深究了。
其次,又因为唱名可以在琴键上移动,当主音符的 do 移动到 C 上,这时的大调就称做 C 大调,同理,当主音符的 do 移动到 D 上,这时的大调就称做 D 大调,而小调,也是这么定义的。
到此,终于给这两个看似不相关的名词拉上关系了,是不是还有点意思?
「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。