PSP音频全攻略之初识有损压缩格式

发布时间:2007/8/4 11:08:13 来源:电玩巴士 作者:bao122300

作者:Joylin1984    

    最近,我发现越来越多的玩家又开始关注PSP影音方面的研究。其实,我觉得不能把PSP看作单纯的掌机,它更像一部“掌上娱乐终端”。

    我当初选择了PSP,就是看中了它的影音功能。我是一个Protable Audio小烧,所以,对PSP的音频功能也很好奇。而且,我想与大家分享我的看法。

------首先,作为一部Protable Audio,其解码芯片的能力将影响整体的效果。PSP并不是专业的Protable Audio,所以对机器的原声不能要求过高,但SONY的功力深厚,PSP的音频潜力还是很大的。在此,我不想评论PSP的原音音质,这是有局限性。我想告诉大家的就是,在有限的条件下,发挥PSP的最大潜力。


------PSP的硬件解码较好,这是我们能进一步提高音质的基础。作为一部Protable Audio,数字音频格式是他的灵魂,而数字音频格式的核心就是算法。PSP的储存介质空间有限,如果用无损压缩格式(WAV/*.plm)聆听音乐,就因其体积较大而显得捉襟见肘。

所以,在此我主要介绍有损压缩格式——MP3( MP3PRO)、WMA、AAC(*.3gp/*.mp4/*.m4v)ATRAC3/ATRAC3+(*.aa3)。------先来明白音频压缩的原理。

    利用人耳听觉的心理声学特性(频谱掩蔽特性和时间掩蔽特性等)以及人耳对信号幅度、频率、时间的有限分辨能力,编码时凡是人耳感觉不到的频率不编码、不传送,即凡是对人耳辨别声音信号的强度、声调、方位没有贡献的部分(称为不相关部分或无关部分)都不编码和传送。对感觉不到的部分进行编码时,允许有较大的量化失真、并使其处于听阈(即人耳所能听到的最低音量)以下,人耳仍然感觉不到。音频的压缩就是利用这些特点来工作的。

PS:心理声学的几个基本概念:

1、等响度曲线

    人的听觉的灵敏度随着频率而改变。即通常两个功率一样但频率不同的音调听起来并不一样响。通过等响度曲线,我们可以看出,人耳对4KHz的频率最灵敏,即在4KHz下能被察觉出来的声音压力水平(响度),在其他频率下并不能被察觉。这就给在一些不太灵敏的频率下失真提供了条件。

2、屏蔽

    我们上高中物理时学过屏蔽。就是强的声音信号把弱的声音信号覆盖,导致我们无法察觉。而且,当两个声音在时间和频率上很接近时,屏蔽效应就会很强。因此,我们可以在编码时对被屏蔽的部分不编码、不传送。这样,音质依然没有大的损失,人耳也不易察觉。

3、临界频带

    对于人类的听觉来说,对声音的感知特性并不是以线形频率为尺度来变化的(人的听觉还没那么好),而是可以用被称为临界频带的一系列有限的频段来表达。简单的说,把整个频带划分成几段,在这每个频段里,人耳的听觉感知是相同的,即心理声学特性都是一样的。

----言归正传,编码的精髓就是算法。下面我就谈谈几种主流编码及其算法。-------


1、MP3( MP3PRO)

    MP3应该算目前应用最广泛的有损压缩数字音频格式了。它的全称是MPEG(Moving Picture Experts Group)Audio Layer-3。1987年德国Fraunhofer研究院研制成功的一种有损压缩数字音频格式,并于1989年取得专利。起初,它并不完善,它更像一个编码标准框架,留待人们去完善。1992年,这一技术并入了MPEG规范,并有了正式名号——MP3。

    MP3能生存到今天,它的发展仍未止步。2001年6月14日,法国汤姆森与美国RCA两家公司联合推出了一种新的压缩格式:MP3PRO。MP3PRO是基于MP3技术改良而来,它利用了Coding Technologies公司开发的编解码增强技术。当制作MP3PRO文件时,编码器将音频分为两部分。一部分是将音频数据中的低频部分分离出来,通过传统的MP3技术编码得出正常的MP3音频流。此举使MP3编码器专注于低频段信号的压缩从而获得更好的质量,而且使原来的MP3播放器也能播放MP3PRO文件。另一部分则是将分离出来的高频信号进行编码并嵌入MP3流中。传统的MP3播放器会将其忽略掉,而新的MP3PRO播放器会将其还原出来并进行组合,得到高质量的全带宽的声音。通过这项技术,使得MP3PRO 64Kbps 的编码率便可提供128Kbps的MP3相同的质量,且具有相差无几的音质,而体积只有MP3 的一半大小。
   
    PSP就支持MP3PRO,而且支持MP3PRO的格式转换软件也很多,大家可以去网上找找。有兴趣的话可以试试,绝对比mp3强啊。如果你想追求高品质的音乐,那我并不推荐MP3编码。


2、WMA

我觉得WMA挺垃圾,所以就不说了。


3、AAC(*.3gp/*.mp4/*.m4v)

    AAC是高级音频编码(Advanced Audio Coding)的缩写,它是由Fraunhofer研究院、杜比和AT&T共同研发的。AAC是MPEG-2规范的一部分,它适用于从速率8Kbps的单声道电话音质到160Kbps多声道的超高质量音频范围内的编码。AAC与MP3相比,增加了诸如对立体声的完美再现、码流效果音扫描、多媒体控制、降噪优化等MP3音频格式所没有的特性,使得在音频压缩后仍能完美地再现CD音质。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容性、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。


Sonicstage 4.0支持抓取CD音轨为AAC(/*.3gp)

比特率:320kbps/256kbps/192kbps/160kbps/128kbps/96kbps/80kbps,AAC的操作很简单,你可以直接把AAC(*.3gp)拷贝到[MUSIC]即可播放,但AAC(*.mp4\*.m4v)要拷贝到[VIDEO]才能播放,大家可以体验一下。


4、ATRAC3/ATRAC3+(*.aa3)

    我想早年玩MD的朋友都知道SONY专为MD量身定做的ATRAC音频格式算法,后来又广泛应用于SONY的 Network Walkman和其他便携音频设备。"ATRAC3plus"代表“自适应转换声音编码3+”,是一套基于心理声学原理的音频压缩技术,从ATRAC3格式发展而来,到2002年这项技术才日趋完美。这一技术是把MD随身听的体积缩小到很小的理论基础。

    要分析 ATRAC3/ATRAC3+,我们先要谈谈它的大哥——ATRAC算法。当数字音频数据被压缩时,通常都会把一定数量的量化噪音带入信号。为了不让这些信号被人耳感知,通常的做法是,音频编码把信号分解为一组单元,每组单元都对应着特定的时间频率范围。编码器会依据前文提到的心理声学原理来分析,对重要的单元进行高精度编码,对不敏感的单元可以保留一些量化的噪音但不影响人耳的感知质量。解码时,量化频谱会根据比特分配重新建立,然后合成音频信号。

    ATRAC也不例外,但有一些改进。ATRAC还应用了子频带译码和转换译码技术,输入的信号被分配得到不均匀的强调重要低音区的频率分割。另外,ATRAC使用一个可变块长度改变输入的信号,这可以确保在稳定通过时高效的译码,不会在瞬间通过时影响时间的分辨率。具体说,输入的信号在5.5125KHz和11.025KHz被分为3个频带。子频带的分解使用QMF (Quadrature Mirror Filters积分映射过滤器)来完成;这3个频带被MDCT(Modified Discrete Cosine Transform 变址离散余弦变换——类似于通常的快速傅里叶变换,《高等数学二》和《数理方程》中有相关介绍。) 转换成频谱值,MDCT允许块之间有达50%的交迭,使得在维持临界采样时能提高频率解析度。块的长度可以根据信号的种类改变,这就是ATRAC的自适应部分(这一做法主要是为了利用屏蔽掩盖初始量化噪音)。

当ATRAC算法发展了10年,已经满足不了市场的需求,SONY于2002年8月推出了新的算法——

    ATRAC3/ATRAC3+。其核心算法较ATRAC没有本质的大改变,只是采用了改进的频带分离过滤和MDCT,并使用增益调节、音调成分分离、联合立体声(Joint-Stereo)等技术,使得音频压缩数据的体积进一步缩小。


PS:下面我介绍一下用组棒听ATRAC3音乐的最简方法:

    用sonicstage CP(或sonicstage 3.4)将CD音轨(或MP3、WMA文件)转换为ATRAC文件,其中包括ATRAC3、ATRAC3plus两种格式。注意:在转换时千万不要选择添加复制保护,否则由于版权保护信息不正确,PSP将不能播放文件。这是关键的操作!!!!!!!!!!!!!生成的ATRAC文件的后缀为.oma ,我们只要将后缀改为.aa3即可。然后将ATRAC 文件拷贝到[MUSIC]目录(或其子目录)里,这时你的PSP将能够完美播放ATRAC3音乐。


5、AAL(ATRAC Advanced  Lossless)

    AAL是ATRAC Advanced  Lossless(自适应声学转换高级无损编码)的缩写,是SONY新开发的一个音频压缩格式其特点是无损压缩,不损失一点音频信息,一张CD可以压缩到原来的30%--80%但目前PSP还不支持ATRAC Advanced  Lossless,但我相信在PSP3.0里极有可能对其支持。目前,其技术资料我还没有见到,所以暂不作分析。

-------结束语

    我想大家都会问我写的这些有什么用?我认为一个音乐文件从录制到播放,有3个重要环节:编码(算法)、解码(硬件解码器)、输出(耳机、耳塞)。这每个环节都对最终我们聆听到的声音音质有着重要的意义,缺一不可。今天,我谈的是基础的编码(算法),希望大家能找到最适合你的编码,我个人的看法是AAC 256Kbps 和ATRAC3plus 256Kbps 。AAC的算法是“精致”,ATRAC的算法是“巧妙”。在今后几天里,我将和大家谈谈 输出(耳机、耳塞),敬请等待,希望大家喜欢。

提示:支持键盘“← →”键翻页 阅读全文

相关推荐

评论