当前位置:首页 > 新闻资讯 > 科技生活 > 新闻
影音不分家,无损音频知多少?
  • 2014-8-15 18:28:19
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:张晓明
  • 作者:
【电脑报在线】1080P已成为标准,4K正在高速普及,8K也悄然出现。高清视频正掀起一场飓风,鼓动着视频行业的变革。但影音不分家,在高清视频普及的同时,要什么样的音频,才配得上高清的表现?而出色的音频不仅是配合影像出现,极致的音乐表现也一直是HiFi发烧友的追求。


@李剑峰

 

       1080P已成为标准,4K正在高速普及,8K也悄然出现。高清视频正掀起一场飓风,鼓动着视频行业的变革。但影音不分家,在高清视频普及的同时,要什么样的音频,才配得上高清的表现?而出色的音频不仅是配合影像出现,极致的音乐表现也一直是HiFi发烧友的追求。

    还原音色真实,无损压缩是先锋

        由于数码信号的转换,我们接触到的音频文件,大多都是经过压缩的。音频文件体积可不小,双声道16bit 44.1KHz采样频率的原始音频文件,每分钟就是10MB左右。如此庞大的文件,别说在网络带宽不足、存储介质昂贵的时代会产生极大的使用困扰。如果音频文件不进行压缩的话,那么2Mbps的宽带仅能勉强满足音乐实时播放的需求,而8小时的音乐足以将8GB闪存的手机容量用得所剩无几。

        那么什么是有损压缩呢?就如字面显示的那样,就是在压缩过程中对原有信号会产生一定损失的压缩方式,比如我们最经常使用的MP3就是一种有损压缩方式。有损压缩主要利用的是人耳的遮蔽效应,比如人耳对低频不敏感,这时就可以减少低频取样的比特率。另外人耳难以听到与强信号同时发音的、频率相近的弱信号,这样就可以把弱信号屏蔽掉。同时对音乐中的回声、弱信号等,也都进行屏蔽。

而在高压缩率如128Kbps以下的MP3文件中,还对高音部分进行了削波处理。从波形光谱图中就可以看出,128K MP3文件中15kHz以上的高音几乎被削去。凭借这些措施,有损压缩以放弃音乐细节表现能力,甚至牺牲部分高音为代价,可以将音频文件压缩到原来1/10大小,例如128KbpsMP3,指的就是其码率只有128Kbps,这样一分钟文件大小只有960KB(128Kbps/8x60)。因此在带宽和存储都捉襟见肘的时代,以MP3为代表的有损压缩是绝对的主流。

 

图:128Kbps MP3(下)在波形光谱图中就可以发现,其细节与高音较之源文件(上)丢失严重

 

图:APE无损压缩(下)与源文件的波形光谱图几乎一致

 

但随着存储和带宽问题的缓解,让无损压缩音频应用的瓶颈得到缓解。而厂家和使用者对音质的重视,平板、手机所配的耳机音质的提升这些因素,也让有损压缩高音差、细节丢失的缺陷暴露无遗,在这种情况下,无损压缩音频正逐渐普及,扮演音频升级的“高清”角色,如苹果系统的ALAC文件,PC上的APE、FLAC文件等等。

既要做到无损,还要压缩文件空间,那无损压缩是怎么做到的呢?其实无损压缩主要是依靠减少文件中的冗余来实现压缩目的。例如在音乐中我们会发现,左右声道的配音往往是一样或者相似的,分别存储无疑会浪费空间,而无损压缩则依靠建立中点数据,即两个声道平均值和差点值的方式来存储两个声道的文件,这样就可以大大减少左右声道数据相同带来的冗余。

而在数据存储时,以往的数据往往使用的是固定字节方式,即每一个信号都用16bit字长表示。但我们知道,数字前的0是没有意义的,如11000011,数值是一样的,前面诸多的0就显得多余了。而无损压缩使用了不定字节的存储方式,将数据中无用的零去除,并用赖斯编码方式来进行数据位的判断。就可以在无损的情况减少数据量。同时无损压缩是可逆的,即可以通过反运算,得到与源文件一模一样的音频文件。当然如果只是减少冗余数据,也就限制了其压缩率。一般情况下,无损压缩方式的压缩比只有2:1左右。

 

索尼Hi-Res,让音乐纤毫毕现

        无损压缩中的无损,只是针对已经数字化后过的文件而言。而不是说,它和原来的使用一模一样,完全无损。我们知道,声音是一个模拟信号,在电脑中则需要把它变成数字信号。以往模拟信号数字化主要有两个规格,即CD使用的16bit 44.1kHz以及DVDPC使用的16bit 48kHz,表示将模拟信号的大小分为16bit65536级),以每秒钟44.1KHz48KHz的速度,检测模拟信号的电压,看其最接近哪一个点,将这一点的电压用数字信号记录下来。而在播放时,连接这些采样点的信号,就还原成模拟信号。但这样的模数化,也会引起一些失真,毕竟16bit65536级别,并不能精确描述模拟信号的当前电压,在数字信号转化为模拟信号时,就会造成波形畸变。而44.148KHz的采样频率也偏低,我们知道,人耳最高可以听到20kHz的声音,如果用44.1KHz48KHz取样的话,那意味着一个波形,只有两个取样点,在这种情况下,怎么可以保证波形不失真呢?

 

图:模数化采样示意图

图:由于采样点少,在高音采样时,传统音频有明显波形失真,而Hi-Res更接近原波形。

 

        要想要减少数字化时的失真,就必须提高采样精度和采样频率,这也就是索尼近期推出Hi-ResAudio高品质音频的原因。Hi-Res Audio将模数化的采样规格提高到24bit 192KHz,4倍的采样频率提升。这样即便是高音信号,也可以获得较为精准的波形。而采样精度由16bit增加到24bit,那可不是提高1/2,要知道24bit可以产生1600万级的电压,比16bit的65000级电压增加了256倍,这样采样的电压精度大大提高,模拟波形畸变的情况自然也就大大降低。

图:Hi-Res标志

        采样精度的大幅提升,使音乐在源头上就实现了“高清”的目标,让音乐的精度大大提高,细节纤毫毕现。当然这也要付出文件体积膨胀6倍,一分钟未压缩音频文件高达70MB。不过,这对追求极致表现的发烧友来说,并不会造成太大的压力。

 

本文出自2014-08-18出版的《电脑报》2014年第32期 A.新闻周刊
(网站编辑:shixi01)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交