一般音乐听众听到的数字音频都是每秒44,100个采样的(44.1kHz)。如果这不是你的制作采样率,那么就有必要进行采样率的转换。采样率转换有两种方式,但是无论哪一种转换方式,只要采样源和目标采样率之间的公倍数越小,结果就会越好。
“同步”的采样率转换:
它是通过使用采样源和目标采样率之间的最小公倍数来建立一个临时的高采样率,然后将高采样率的数据向下转换(过滤)为低的目标采样率。用高采样率作为媒介,可以避免转换不均或者有残余数据存在。
如果原始素材是96kHz,要想减少到44.1kHz的话,必须先提高采样率到14.112MHz。这个过程包含了三个数字过滤的阶段,每一次过滤都成为了频率响应和整理延迟失真的潜在隐患。
如果原始素材是88.2kHz,或者是任何44.1kHz的倍数,那么就只需要一个阶段的过滤就能转换到44.1kHz了。不管你使用的滤波器质量如何,越少的过滤意味着越少的失真。
“不同步”的采样率转换:
它在转换过程中,降低采样率的阶段使用了单独的转换器和时钟。采样源和目标采样率之间的数学关系越简单,音质受损的可能性就越小,在这里仍然是一样的道理。比如,2:1就比160:147要简单,转换的损失也小。越少的计算,意味着越少的误差容许量。
#2 数字音频转换器的性能上限是20kHz在Nika Aldrich周密详实的文章《Digital Audio Explained: for the Audio Engineer》中,他提醒我们,“我们听不到20kHz以上的频率。我们也听不到对20kHz以上音频作用的效果。”那么,使用高于44.1kHz的 采样率录音可能会有什么好处呢?
尽管确定的采样定理已经有了,但在现实中,奈奎斯特频率[注1]不得不建立在反锯齿滤波器(A/D转换)和重建滤波器(D/A转换)的性能上。虽然理论上存在完美的滤波器,但是现实中情况是不同的。在现实中,我们的反锯齿和重建滤波器是不完美的,所以会导致混叠现象,瞬变环现象和高频相位偏移的现象。当音频频段接近这个限制,也就是奈奎斯特频率时,这些问题就会开始恶化。
88.2kHz的奈奎斯特频率是44.1kHz。这将滤波形成最糟糕的异常部分放在了超过人耳可听频率频段以上的地方。有影响的频段只存在于20kHz以下。使用88.2kHz采样的数字音频会比44.1kHz产生更少的混叠和相位失真现象。
顺便说一下,越高效的滤波器售价也越昂贵。所以,如果你拥有的并不是很高级的转换器,那么使用更高的采样率就会获得更好的效果。
#3 176.4kHz,数据量太大,优势不足如果我们使用88.2kHz已经有很好的效果了,那么为什么不加倍,使用176.4kHz呢?
我们在音频上使用了88.2kHz,这样的好处是避免听到那些因为转换器性能的不完美而产生的糟糕部分。当我们已经听不到是不是有差异存在时,要想把结果变得更好就相对困难了。
而且不用想就知道176.4kHz的文件体积会大一倍。如果你经常在设备之间移动文件,上传到云存储空间或者管理大量的自动备份系统,显然这样做并不是明知之选。
题外话应该注意的是,根据以上这些逻辑,如果转交给消费者的版本是48kHz的话,那么音频制作可以扩展到96kHz上去。
同时也要注意,现在有很多关于在44.1kHz下录音的解决方案可以采用。而我们在这里考虑的是一个工程问题,所以 重点是这些完美设计的方案之外会发生的事情。
我和James Gleick一起完成了文章《The Information: A History,A Theory,A Flood》。我得知了数字音频系统的理论基础是在1928年到1949年间建立起来的。而现在,争论这些理论应用导致的不完美结果已经成了一件很有意思 的事。
[注1]奈奎斯特频率(Nyquist频率)是离散信号系统采样频率的一半,因哈里·奈奎斯特(Harry Nyquist)或奈奎斯特-香农采样定理得名。采样定理指出,只要离散系统的奈奎斯特频率高于采样信号的最高频率或带宽,就可以避免混叠现象。
来自logiclocmusic
,