一.什么是好听,大佬的认知和笔者的浅见

怎么让音乐音质变好 怎样使音乐更好听(1)

让听众欣赏到好的音乐是一个很复杂的系统工程,在一定程度上,音乐的审美取向是基于主观的,并非能简单地用几个量化指标来描述;但是对于相关产业的从业人员,他们在工作中需要使用客观的量化指标来描述音乐产品的好坏,从创造音乐的作曲家,到演奏音乐的乐手,到录音师、混音师,再到设计各种相关设备的人员、以及设计各种音频算法的工程师,都接受了相关的教育,能够用一些可以量化的指标来描述音乐产品的质量,将自己的产品做成“自己心中理想的样子”。

这样似乎能够使得音乐产品的生产流程规范化,但正如Floyd Toole先生在其著作《声音的重现》[1]中指出的,上文中提到的音乐产品从业者做的工作往往都是独立进行的:录音师负责根据录音环境摆放传声器,调节合适的电平;而混音师则将录音师所获取的素材缩混,出品为最终要发行的音乐;电声产品的设计者则根据电声产品的生产规范对自己的产品进行调整;至于用户这边已经到了这个系统工程的尾部环节。容易想到这些环节中很多地方都是割裂的,不同的环节之间没有强力的联系。

怎么让音乐音质变好 怎样使音乐更好听(2)

主观听音怪圈,出自Floyd Toole《声音的重现》

所以问题来了,既然在这个系统工程中很多环节缺乏联结,我们该怎样决策目标标准呢?在这里笔者认为,对于大多数经过缩混的音乐,能够接近混音师听到的声音就是好的重放;而对于古典、爵士等音乐接近现场的声音就是好的重放(事实上古典音乐的录音也会根据内容对某些乐器进行补偿拾音以及其他微调,但是声学条件良好音乐厅的现场声音是完全可以作为参考的)。请注意此处仅仅是笔者个人的观点,仅涉及审美取向,不涉及对错。

怎么让音乐音质变好 怎样使音乐更好听(3)

主观听音怪圈详细描述,出自Floyd Toole《声音的重现》

二.苹果最近都做了什么?目前看来有哪些不足?

回到近日在音频领域动作频频的苹果公司上来,我们可以发现其最近在音频更新的内容恰恰对应了两种不同的对于声音的优化方法。大半年前发布的AirPods Max采用了“空间音频”算法(具体文章点击这里查看),是一种在原始信息不足的情况下人工加入一些信息,使得声音有了“空间感”,用通俗的说法可以看作一种“加味精”的行为,其效果也许正面也许负面,不一定有保证;但是近日Apple Music加入的“杜比全景声”和“无损音频”在笔者看来是原理上非常靠谱的音质优化方法,具体原理作者会在下一节讲解,一言以蔽之,这两种方法的出发点都是设法保留更多录音时的信息,在重放的时候自然就会更加接近现场或者音乐家设计的音响效果,而不是在之后人为地添加一些可能会背离音乐人初衷的音效。

怎么让音乐音质变好 怎样使音乐更好听(4)

Apple Music的新特性

但是此次更新想完全普及还有一些困难。首先“杜比全景声”的录制要求很高,无论是对于设备还是对于专业从业者的水平都有要求,所以符合“杜比全景声”录制规范的音乐是很少的,一般的音乐家和公司都很难承担如此高的成本,而且“杜比全景声”现今来看使用最广的领域还是电影,并非单纯的音乐制品。其次“无损音频”的文件体积较大,即有着较高的采样率和量化深度。标准的CD都是16bit/44.1KHz的格式,码率是1411.2Kbps,但目前市面上的蓝牙传输协议码率都达不到这个标准,更不用提使用目前的蓝牙协议去传输24bit/96KHz以及更高品质音频了。但事实上目前苹果公司的电声产品基本是蓝牙设备,如AirPods系列、HomePod系列都是蓝牙产品,所以蓝牙传输将会成为传输无损音乐的限制。

三.涉及的相关原理

1. 音频编码基础知识

各位读者一定都听说过MP3,也许有的人还听说过WAV、AAC等其他概念,事实上这些都是不同的音频编码格式,有的是没有压缩的格式,如WAV;还有的是有压缩的格式,如MP3、AAC等等。虽然格式不同,但是其主要经过的步骤都类似,为时间采样——幅度量化——编码为文件。这样就可以变为数字信号保存在电子设备中。而这些不同的编码就是在这三个步骤做文章。

首先在采样率上,一般的CD录音都采用的44.1K,这是根据奈奎斯特定律和录音工业的习惯而得到的采样率结果;其他的压缩算法也都基本保持了这个采样率,因为根据奈奎斯特采样定律,过低的采样率是会造成失真的。

其次就是采样位数,其单位为bit,了解计算机原理的朋友们都知道,n个bit能表示的信号强度就是2^n个。所以更高的采样深度就可以提供更广阔的动态范围,也可以使幅度曲线更加平滑。在这里我们可以计算一下普通CD的16bit位深可以提供多大的动态范围,计算如下:

对于幅度谱,如果其能记录的声音最大幅度是Amax,最小幅度是Amin,他们之间的功率差距为:Range=(AmaxAmin)²

换算到dB单位即:

Range(dB)=10*lg(AmaxAmin)²=20*lg(AmaxAmin)

带入Amax=21,Amin=216,可得Range16bit≈96dB

结果为96dB,而一般的古典音乐的动态范围不会超过90dB,所以普通CD是可以胜任古典音乐录音的;至于其他音乐形式动态范围都没有古典音乐大,所以CD是可以胜任绝大多数音乐的存放任务的。

怎么让音乐音质变好 怎样使音乐更好听(5)

既然16bit动态范围已经可以满足要求了,为什么苹果此次还要提供24bit的音乐呢?笔者认为首先人对于音质的评价十分主观,越高的参数会给人一种音质更好的暗示,从而获得更好的听音体验;另外在实际的层面这个量化位深也和信噪比有一定关系,而且更高的采样率确实可以使A/D转换后的数字音乐信号更加接近原始信号,即精度越高,越能逼近原始模拟信号

2. 杜比全景声的一些特性[2]

传统的录音技术都是使用两个麦克风按照一定的摆放方式(即立体声录音制式)进行录音,这样录音之后使用扬声器或者耳机再进行播放可以达到还原之前声音的效果,也就是说位置信息全部都在声道信息中。但是可想而知这种方法录制的音频只有两个声道信息,很难真实地表现出现实中声音从四面八方传过来的感觉。而杜比全景声引入了“音频对象”的概念,可以将场景中每一个发声源作为一个实体进行单独的定义和操作。即混音师在后期可以单独控制每一个发声源的位置,且音乐文件也能保存每一个发声源的位置信息,显然这样的位置信息保存方式可以脱离物理声道的桎梏,对于每一个不同的重放系统都能较准确地被重放到正确的声像位置,适应性更强。同时杜比全景声也有基于传统声道的录制方法,即“音床”,将这两个方法结合起来,示意图如下:

怎么让音乐音质变好 怎样使音乐更好听(6)

音床和声音对象共同合成为全景声的内容

之后工程师将这些内容进行混音,工程师在一定程度上会决定这些声音元素如何进行组合,位置都是怎样的,或者会加入一些效果器,调整一下电平。最后再进行母带处理,优化整体听感,并确认效果。

四.可能引发的市场变化

根据前文的内容,我们可以看得到苹果近一年的产品打了一套“组合拳”,先推出了空间音频算法,可以通过人头运动等计算相关的声像空间参数;同时又和杜比合作,获得了带有空间信息的一些音乐资源以及技术。这样来看的话,这两个功能确实能起到1 1>2的效果,使用耳机上的硬件和算法获得用户个性化的空间音频数据,再把这些数据和杜比全景声的音乐资源结合,确实走到了业内的前列,而且看起来是个很有效的办法。但是基于之前对于其缺点的分析,笔者认为在短期内杜比全景声制式的音乐数量很难有太大的突破(除非是使用算法优化已有的录音),所以这个功能暂时不会引发太大的变革。但可以肯定的是其他厂商在看到苹果这一动作后也会纷纷入局,至少会在这个领域投入研究保证自己不被落下。

而对于“无损音乐”的支持,笔者认为这还是会拉拢一些在意音质的人加入苹果生态的。这里可以举笔者自己的例子,笔者是一位音乐发烧友,经历过唱片店购买唱片、网盘寻找无损资源自己刻录、使用数播播放硬盘的音乐等等方式来获得优质音乐资源。但这些方法都不是十分经济和方便,CD听歌需要整张专辑聆听,对于流行歌来说这种方式很难连续听到想听的歌;收集资源也是零敲碎打,不如手机一键式操作。

怎么让音乐音质变好 怎样使音乐更好听(7)

目前比较方便的方式就是使用专用的网络播放器,但是受限于价格和资源数量也不是很理想。苹果此次更新以后,释放出了很多高码率的音乐资源,而且点播极其方便,这对于笔者这样的发烧友十分有吸引力。苹果能做到手握这么多高品质音乐其实是基于其Apple Music的地位和底蕴,这一点不是哪家公司都可以追赶的,可以说苹果利用其资源的丰富性刺激了相关产品的营收,也许本次音频领域的更新会让苹果产品的销量更上一层楼。

参考:

[1]. Floyd E. Toole . Sound Reproduction

[2]. Dolby . Dolby Atoms Next-Generation Audio for Cinema

,