珠海做网站多少钱,廊坊首位关键词优化电话,如何搜索asp网站,网站支付功能怎么做speech codec (G.711, G.723, G.726, G.729, iLBC) 各种各样的编解码在各种领域得到广泛的应用#xff0c;下面就把各种codec的压缩率进行一下比较#xff0c;不正确之处望各位同行指正。 Speech codec#xff1a; 现主要有的speech codec 有: G.711, G.723, G.726 , G…
speech codec (G.711, G.723, G.726, G.729, iLBC) 各种各样的编解码在各种领域得到广泛的应用下面就把各种codec的压缩率进行一下比较不正确之处望各位同行指正。 Speech codec 现主要有的speech codec 有: G.711, G.723, G.726 , G.729, ILBC QCELP, EVRC, AMR, SMV 主要的audio codec 有: real audio, AAC, AC3, MP3, WMA, SBC等各种编解码都有其应用的重点领域。 本文主要对speech codec相关指标进行总结 ITU 推出G.7XX系列的speech codec, 目前广泛应用的有G.711G.723, G.726, G.729. 每一种又有很多分支如G.729就有g.729A, g.729B and g.729AB G.711: G.711就是语音模拟信号的一种非线性量化细分有二种:G.711 A-law and G.711 u-law.不同的国家和地方都会选取一种作为自己的标准. G.711 bitrate 是64kbps. 详细的资料可以在ITU 上下到相关的spec下面主要列出一些性能参数 G.711PCM方式PCM脉码调制 Pulse Code Modulation ? 采样率8kHz ? 信息量64kbpschannel ? 理论延迟0.125msec ? 品质MOS值4.10 G.723.1: G.723.1是一个双速率的语音编码器是 ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法 其目标应用系统包括H.323、H.324等多媒体通信系统目前该算法已成为IP电话系统中的必选算法之一编码器的帧长为30ms还有7.5ms的前瞻编码器的算法时延为37.5ms编码器首先对语音信号进行传统电话带宽的滤波基于G.712再对语音信号用传统8000-Hz速率进行抽样基于G.711并变换成16 bit线性PCM码作为该编码器的输入 在解码器中对输出进行逆操作来重构语音信号高速率编码器使用多脉冲最大似然量化MP-MLQ低速率编码器使用代数码激励线性预测ACELP方法编码器和解码器都必须支持此两种速率并能够在帧间对两种速率进行转换 此系统同样能够对音乐和其他音频信号进行压缩和解压缩但它对语音信号来说是最优的采用了执行不连续传输的静音压缩这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带宽之外这种技术使发信机的调制解调器保持连续工作并且避免了载波信号的时通时断。 G.726: G.726有四种码率, 32, 24, 16 kbit/s Adaptive Differential Pulse Code Modulation (ADPCM)最为常用的方式是 32 kbit/s但由于其只是 G.711速率的一半所以可将网络的可利用空间增加了一倍。G.726具体规定了一个 64 kbpsA-law 或 μ-law PCM 信号是如何被转化为40, 32, 24或16 kbps 的 ADPCM 通道的。在这些通道中24和16 kbps 的通道被用于数字电路倍增设备(DCME)中的语音传输而40 kbps 通道则被用于 DCME 中的数据解调信号尤其是4800 kbps 或更高的调制解调器。 G.726 encoder 输入一般都是G.711 encoder的输出64kbps A-law or u-law.其算法实质就是一个ADPCM 自适应量化算法。
G.729: G..729语音压缩编译码算法 采用算法是共轭结构的代数码激励线性预测(CSACELP)是基于CELP编码模型的算法能够实现很高的语音质量长话音质和很低的算法延世算法帧长为10ms编码器含5ms前瞻算法时延15ms其重建语音质量在大多数工作环境下等同于32kb/s的ADPCMG.726MOS分大于4.0编码时输入16bitPCM语音信号输出2进制比特流译码时输入为2进制比特流输出16bitPCM语音信号在语音信号8KHz取样的基础上16bit线性PCM后进行编码压缩后数据速率为8Kbps具有相当于161的压缩率。 G.729系列在当前的VOIP得到广泛的应用且相关分支较多可以直接从ITU网上得到source code 和相关文档。 G.729CS-ACELP方式Conjugate Structure Algebraic Code Excited Linear Prediction ? 采样率8kHz ? 信息量8kbpschannel ? 帧长10msec ? 理论延迟15msec ? 品质MOS值3.9
iLBC(internet low bitrate codec): 是全球著名语音引擎提供商Global IP Sound开发它是低比特率的编码解码器提供在丢包时具有的强大的健壮性。iLBC 提供的语音音质等同于或超过 G.729 和 G.723.1并比其它低比特率的编码解码器更能阻止丢包。iLBC 以13.3 kb/s (每帧30毫秒)和15.2 kb/s (每帧20毫秒)速度运行很适合拨号连接。 iLBC的主要优势在于对丢包的处理能力。iLBC独立处理每一个语音包是一种理想的包交换网络语音编解码。在正常情况下iLBC会记录下当前数据的相关参数和激励信号以便在之后的数据丢失的情况下进行处理在当前数据接收正常而之前数据包丢失的情况下iLBC会对当前解码出的语音和之前模拟生成的语音进行平滑处理以消除不连贯的感觉在当前数据包丢失的情况下iLBC会对之前记录下来的激励信号作相关处理并与随机信号进行混合以得到模拟的激励信号从而得到替代丢失语音的模拟语音。总的来说和标准的低位速率编解码相比iLBC使用更多自然、清晰的元素精确的模仿出原始语音信号被誉为更适合包交换网络使用的可获得高语音质量的编解码。 此外大部分标准的低位速率编解码如G.723.1和G.729仅对300Hz——3400Hz的频率范围进行编码。在这个频率范围里用G.711编解码所达到的语音质量就是传统PSTN网络进行语音通话的效果。 iLBC充分利用了0——4000Hz的频率带宽进行编码拥有超清晰的语音质量这大大超出传统300Hz——3400Hz的频率范围。 广受欢迎的Skype网络电话的核心技术之一就是iLBC语音编解码技术Global IP Sound称该编码器语音品质优于PSTN而且能忍受高达30%的封包损失。 总的来说在相同的包交换通信条件下iLBC的语音质量效果比G.729、G.723.1以及G.711更好声音更加圆润饱满且丢包率越高iLBC在语音质量上的优势就越明显 目前在国际市场上已经有很多VoIP的设备和应用厂商把iLBC集成到他们的产品中。如Skype, Nortel等。在国内市场上目前尚无VoIP厂家正式推出支持“iLBC”的网关设备迅时公司 率先推出支持“iLBC”的中继网关和IAD设备。 audio codec 通常采用参数编码基本思想是提取speech的特征参数解码端由这些特征参数计算出最后输出的波形。
speech codec 通常采用波形编码基本思想是用一个编码后的波形去拟合原始波形失真小但带宽大。 1. 波形编码 波形编码是最简单也是应用最早的语音编码方法。最基本的一种就是PCM编码如G.711 建议中的A 律或μ 律。APCM、DPCM和ADPCM也属于波形编码的范畴使用这些技术的标准有G.721、G.726、G.727 等。波形编码具有实施简单、性能优良的特点不足是编码带宽往往很难再进一步下降。 2. 预测编码 语音信号是非平稳信号但在短时间段内一般是30ms具有平稳信号的特点因而对语音信号幅度进行预测编码是一种很自然的做法。最简单的预测是相邻两个样点间求差分编码差分信号如G.721。但更广为应用的是语音信号的线性预测编码LPC。几乎所有的基于语音信号产生的全极点模型的参数编码器都要用到LPC 如G.728、G.729、G.723.1 建议。 3. 参数编码 参数编码是建立在人类语音产生的全极点模型的理论上参数编码器传输的编码参数也就是全极点模型的参数- 基频、线谱对、增益。对语音来说参数编码器的编码效率最高但对音频信号参数编码器就不太合适。典型的参数编码器有LPC- 10、LPC-10E当然G.729、G.723.1 以及CELPFS- 1016等码 本激励声码器都离不开参数编码。 4. 变换编码 一般认为变换编码在语音信号中作用不是很大但在音频信号中它却是主要的压缩方法。比如MPEG 伴音压缩算法含著名的MP3 用到FFT、MDCT 变换AC- 3 杜比立体声也用到MDCTG.722.1建议中采用的MLT 变换。在近年来出现的低速率语音编码算法中STC正弦变换编码和WI波形插值占有重要的位置小波变换和Gabor 变换在其中有用武之地。 5. 子带编码 子带编码一般是同波形编码结合使用如G.722 使用的是SB- ADPCM技术。但子带的划分更多是对频域系数的划分这可以更好地利用低频带比高频带感觉重要的特点故子带编码中往往先要应用某种变换方法得到频域系数在G.722.1 中使用MLT 变换系数划分为16 个子带MPEG 伴音中用FFT 或MDCT 变换划分的子带多达32 个。 6. 统计编码 统计编码在图像编码中大量应用但在语音编码中出于对编码器整体性能的考虑变长编码易引起误码扩散很少使用。对存在统计冗余的信号来说统计编码确实可以大大提高编码的效率所以近年来出现的音频编码算法中统计编码又重新得到了重视。MPEG 伴音和G.722.1 建议中采纳了哈夫曼变长编码 更多资料你链接 www.itu.int http://www.ilbcfreeware.org/documentation.html#presentations http://itbbs-arch.pconline.com.cn/topic.jsp?tid2648071 http://bbs.sdgb.cn/ShowThread.aspx?PostID11843 http://en.wikipedia.org/wiki/G.726 http://www.itu.int/rec/T-REC-G.726/e