当前位置: 编码机 >> 编码机资源 >> 声音是如何存入计算机的
当我们打开音乐播放器听到流行音乐的时候,你可曾想过声音是如何存储到计算机的么?在介绍声音存储到电脑之前,我们还是先看下你的耳朵为什么能听到声音。
我们的耳朵能听到声音,有两个必要的条件:一是有震动的物体,二是在空气中传播。对于第一个条件很好理解。关于第二个条件,在这里举个列子,你站在钢琴房外,是听不到里面钢琴的声音,这是因为琴房的墙阻隔了声音的传播。声音在空气中以波形传播,如下图所示:
在图中有两个坐标轴,横轴代表时间t,纵轴代表位移y。通过观察以上的三个波形,我们发现几个特点:1、在某一时刻后,波形总是重复以前的波形。例如蓝色的波形,在t1时刻后,又开始重复前面的波形。绿色的波形在t2时刻后也在重复前面的,同样,紫色波形在t3时刻后也在重复。这里的时刻t就叫做该波形的周期。2、每个波形在y轴上都有一个最高点和最低点,这个最高点或最低点代表了位移的偏离值达到了最大值,这个最大值就叫做振幅。3、假设t1=0.1秒,t2=0.2秒,t3=0.25秒,那么1秒内,蓝色波形震动了10次,绿色波形震动了5次,紫色震动了4次。那么这个次数就叫做频率,单位是Hz。对于蓝色波形来说,频率就是10Hz,同理,绿色5Hz,紫色4Hz。
对于声音来说,我们平时还会经常听到音量、音调、音色这三个词。音量指的就是波形的振幅,音调指的是波形的频率。关于音色,举个例子,你是不是一下子就能听出钢琴和古筝的区别来,那是因为它们的波形不一样。我们的耳朵听到的声音的频率范围20Hz-Hz(20kHz),低于20Hz的叫次声波,高于Hz的叫超声波,下面的图中列举了几种常见的动物的声音频率:
接下来,为大家介绍下声音是如何存入计算机,也就是关于声音的编码。在这里主要介绍波形编码中的脉冲编码调制(PulseCodeModulation,PCM编码)。
PCM通过采样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。
采样:一次振动中,必须有2个点的采样,关于为什么有2个点采样,我在视频课程中已经介绍了,这里不再赘述。人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。
量化:每个声音样本若用8位存储,样本只能存储0-个信息,每个声音样本若用16位存储,则可以存储0-个信息,说明量化精度越高,声音质量越好。
编码:量化后的抽样信号十进制数字信号,应将十进制数字代码变换成二进制编码。
常用的采样率:
8kHz为电话采样。
11.kHz能达到AM调幅广播的声音品质。
22.05kHzFM调频广播所用采样率。
44.1kHz音频CD,也常用于MPEG-1音频(VCD,SVCD,MP3)所用采样率。
48kHzminiDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率。
声道
声道可分为单声道和双声道(立体声)。单声道一次产生一组声波数据,双声道一次产生两组声波数据。
比特率(数据传输率)
表示每秒的数据量,一般以bps为单位。
比特率(bps)=采样频率(Hz)x量化位数(bit)x声道数
声音数据量(Byte)=比特率(bps)x持续时间(s)/8
例如:CD唱片采样频率44.1kHz,量化精度16位,双声道,计算一小时的数据量多少?
x16x2x/8=B≈.6M
MIDI、Wav、Mp3格式
MIDI(MusicalInstrumentDigitalInterface)乐器数字接口,它用音符的数字控制信号来记录音乐。一首完整的MIDI音乐只有几十KB大,几乎所有的现代音乐都是用MIDI加上音色库来制作合成的。
WAV是微软公司开发的一种声音文件格式,标准格式化的WAV文件和CD格式一样,是44.1K的取样频率,16位量化数字,因此在声音文件质量和CD相当。
MP3是利用一种音频压缩技术,由于这种压缩方式的全称叫MPEGAudioLayer3,所以人们把它简称为MP3,MPEG音频文件的压缩是一种有损压缩。
如果你觉得本文对你有帮助,请帮忙转发给需要的朋友。