简述网站开发步骤,国家企信网官网登录入口,网站登录系统怎样做,微信网站 影楼原创#xff1a;转载需附链接#xff1a; 音频客观感知MOS对比#xff0c;对ViSQOL、PESQ、MosNet#xff08;神经网络MOS分#xff09;和polqa一致性对比和可信度雁阵_machine-lv的博客-CSDN博客谢谢#xff01; 本文章以标准polqa的mos分为可信前提#xff0c;验证vis…原创转载需附链接 音频客观感知MOS对比对ViSQOL、PESQ、MosNet神经网络MOS分和polqa一致性对比和可信度雁阵_machine-lv的博客-CSDN博客谢谢 本文章以标准polqa的mos分为可信前提验证visqol、peqq、mosnet与polqa的一致性以及visqol的可信度验证主要用于 编解码、 降噪、回声消除等算法的感知效果进行打分从而促进算法的迭代和可信度 一、评价方式 主观评价 优点主观测试是音频评价的黄金准则最符合人的实际听感。缺点主观评测费时费力测试者太少、测试者不规范等都会带来测试误差常用方法AB-TEST MUSHAR 客观打分 优点方便测试和开发人员快速验证语音的相对质量方便日常工作提升开发和测试效率缺点不能够完全符合人的听觉感知存在听感好打分低的情况常用方案有参考POLQA, PESQ, VISQOL和无参考ITU-TP.1201传统方法和MOSNET的AI打分 二、PESQ 和 VISQOL测试对比 对比维度 基础对比Visqol和polqa支持16khz和48khz打分 visqol支持频带和时间帧打分pesq支持8khz和16khz打分mosnet支持16khz的帧输出打分 两者与POLQA的一致性对比 visqol和polqa的一致性更高 pesq颗粒度不够 mosnetAI无参考模型表现最差 注SMD48和SMD49SMD50和SMD51SMD271和SMD272这三对音频各对的音源相同并且每对的后者都针对前者做了过认证优化。 音量的影响音量差异影响不大但是当降低-18db开始分数降低 混响的影响 混响音响较大加入混响分数就开始降低但是混响大小影响有规律 噪音的影响噪音影响很大加入噪音分数就明显降低但是不同信噪比变化有规律 频带缺失的影响频带缺失影响打分较大但是不同的频带模型还是能够匹配降低不同的分值 2. 总结 visqol和polqa有较高的一致性可能有幸存者偏差但是拿到的数据是我们过认证的随机音频visqol也存在和听感不符合的打分例如加入轻微混响和噪音都会对打分有影响但是混响和噪音的影响随着RT60和SNR的变化是有规律的如果在降噪和混响模型的测试也具相对意义可以进行研发的自测