1.声音是什么?

探索声音的秘诀 探究声音本质(1)

各种波形

图中我们可以看到几种常见的函数的波形,他们都是波。声音以波的形式传播,所以声音的本质也是波,即声波。下面是“搜索成龙”的这句话的声波(声音),采样率:16k,声道:单声道,位数:16bit。

探索声音的秘诀 探究声音本质(2)

横轴:时间,纵轴:幅度

我们知道声音是用来的听的,看不见摸不着,那么上面的波形图又是怎么来的呢?产生这个图形需要两个必不可少的步骤,一是声源,谁产生的声音;二是保存,怎么保存声音。

2.人的声音

探索声音的秘诀 探究声音本质(3)

人类声线

这张图展示了人是如何发声的,简单说,就是肺部产生气流动力,经过气管引起声带振动形成声源(通常称为激励),最后经过声道(咽腔、口腔、鼻腔等)调制后由口唇辐射出来,就产生了我们听到的声音。这个就解释了声源的问题,声音是由人的发音系统产生的,当然自然界并非只有人声,还有各种各样的声音,他们都有声源。接下来,就要看如何保存声音了!

3.采样定理

声音是一种波的形式,那么可以理解这是一个随时间变化的连续的模拟信号,就像sin函数一样。我们知道声音的呈现给我们的机器是计算机,而计算机只能处理和记录二进制的数字信号,因此,原始的声音必须用计算机的声音采集工具进行声音采样来获得声音的数字信号,通常这个工具是麦克风。那麦克风需要怎么样采样才能保证采集到的声音确实是声源发出的呢,也就是麦克风的采集质量?影响麦克风的采集质量的因素有很多,这里我们主要考虑采样率,也就是每秒钟采集多少次,也称采样频率。

奈奎斯特定理,它是连续时间信号和离散时间信号之间的桥梁。定理内容:当采样频率fs.max大于信号中最高频率fmax的2倍时(fs.max>2fmax),采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的2.56~4倍。

由于人耳可以听到的声音频率范围是20Hz~20KHz,人说话的声音频率范围是300Hz~3400Hz。根据奈奎斯特定理,为了能完整的保留原始信号的信息,麦克风的采样频率不能低于40KHz,一般麦克风设计的采样频率为48KHz,每个采样时刻麦克风收集的是当前时刻的电压数值。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的样本数据就越多,对声音波形的表示也越精确。有一些常见的采样率如下:

8kHz 常用于电话系统,对于人的说话已经足够(8K > 3400 *2);

11025Hz 获得的声音称为电话音质,基本上能让你分辨出通话人的声音;

22050Hz 无线电广播所用采样率,广播音质;

32KHz miniDV数码视频camcorder、DAT(LPmode)所用采样率;

44100Hz 音频CD,也常用于MPEG-1音频(VCD,SVCD,MP3)所用采样率;

48KHz miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率;

通过麦克风按采样频率采集后,声音就保存下来了,也解释第二个问题如何保存声音。这里的,声道数是1,表示只有一个麦克风在采集声音,有些设备有多个麦克风,就多个麦克风同时采集声音;位数为16bit,表示每个采样点的数值使用16bit表示,常见的short类型就是16bit。

,