声音的主观评价方法

2019-12-20 21:01:40·  来源:海德声科 HEAD acoustics  
 
心理声学的研究都是从实验开始的。通过观察人对声音中某种激励(stimuli)的响应(response)来总结出一套规律
心理声学的研究都是从实验开始的。通过观察人对声音中某种激励(stimuli)的响应(response)来总结出一套规律。现阶段比较成熟的心理声学参数研究主要有响度、尖锐度、语言清晰度等等。但是对于一些更加复杂的参数,比如声品质,还是难以只用一个通用公式就表达出来。因为由于工况或者受众的不同,会存在很大的变数。因此只能通过大量的实验研究,总结出适用于该工况/受众的规律。设计实验的关键在于设计评价方法,其中最复杂也是最重要的部分是如何选择合适的评价方法。实验包含三个主要元素:激励(stimuli,即声源)、激励的性质(比如强度、舒适度等),以及响应(response)。
Paired Comparison 成对比较法
 
顾名思义,就是将测试对象两两分组并进行比较。一般每一次比较都只针对待测声音的某一个性质(比如强度、清晰度等等)。测试者需要根据提示在这两个声音中做出选择,有时候也可能会提供A=B的选项,即代表A音和B音的性质难以区分。很多时候大家都不会使用A=B这个选项,这就会带来一个影响[1]:假设一,有两个喜好完全相反的群体,最后的结果是一半人选A一半人选B;假设二,A和B相差不大,测试者都随机选择,最后的结果也差不多一半人选A,一半人选B。这两种完全不一样的情况最后的结果却是一样的。同时Parizet[2]也在研究中发现,如果在过程中使用强制选择的话也降低最后结果的可靠性。
在评价一个声音的未知属性时,成对比较法是一个非常合适的工具。一方面两个声音进行直接比较非常简单,测试者无需经过很多测试,结果的可靠性比较高;另一方面,在设计实验的时候也不需要事先定义好评价量级,因为未知属性的量级往往是不太好定义的。
 
成对比较法还有一个优点,就是可以剔除一些不稳定测试者的结果。例如有ABC三个声音,测试者甲最后给出的结果为A>B,B>C,C>A,结果构成了一个环,我们称之为circular traids,也就是该结果中存在circular error。Parizet[3]提供的解决方法是,计算每个测试者的稳定性参数(coefficient of consistence)。
其中该测试者c为出现circular traids的数量,t为激励音的数量,。当这个参数小于一定的极限值的时候,就判定这个测试者的结果不可靠,在最后的统计结果中将这个测试者剔除。
当然成对比较法自身也是有缺点的。首先,如果测试对象很多,测试过程会非常长。其次,成对比较法提供的结果只有排序,没有精确的打分,这对之后metric的设计可能会产生一定的影响。如果需要将简单的排名转换为更加精确的打分,现阶段主要通过Bradley-Terry-Luce模型[4]或者Thurstone模型[5]进行转换,但是这两种模型也都是建立在一定假设前提之下的。Thurstone模型就假设数据是按正态分布的,而Bardley-Terry-Luce模型则假设数据呈logistic分布。如果测试对象中对比属性非常低(接近于0)或者非常高(接近于无限),那么使用上述转换方法就会产生不准确的结果了。
 
Ranking 排序法
 
将一组声音按照某个性质(声音品质等)进行排序,和成对比较法一样,排序法给出的结果也只有排序,没有具体的打分,并且现阶段也没有很好的模型将排序结果转换为得分。排序法是最简单也是耗时最短的一种评审方法,但结果的参考价值也最低。如果同时进行排序的样本数越多,排序的难度也就越大。耳朵的回声记忆时间一般为5-10秒,所以当听到后面的样本时,很有可能已经忘记前面样本的感受了。因此在选择对比样本数量的时候,需要根据评审的难易程度以及评审员的经验来选择合适的样本数,这样才能保证评审结果的准确性。
 
Category Scaling 等级评分法
 
即将声音的某个性质的强弱分为固定的几个等级,并且给每个等级赋予文字定义,最后评分者在这些等级中进行选择。一般来讲这些等级都是等距划分的,比如评价一个声音的响度,我们可以按照“无法感知->非常安静->安静->中等->响->非常响->极度响”这几个等级来划分。这种方法的运用十分广泛,因为一方面对于评测者来讲比较好操作,所有的选项都有文字的注释,概念比较清晰;另一方面,该测试可以直接返回打分的结果,比如按照等级的划分分数分别为1->n,对于数据的后处理来说也比较方便。当然,法无完法,不同声音的性质不等距分布,以及不同等级之间的具体划分等,都是该方法存在的问题。
 
对于标度的选取,有双极(Bipolar)和单极(Unipolar)之分[6]。顾名思义,双极标度有两个极点,例如描述声音的响度时,可以覆盖到极响->极静;单极用于形容某种性质的单边程度如何,例如一段声音的安静程度,可以从非常安静->完全不安静。在选择标度的时候,首先要看该性质是否具有两极性,若有两极性,则可以选择双极标度以很好地反映出声音该性质的趋势以及程度如何;如果该性质有自然0点存在的话,比如可听度,完全听不到就是自然0点,此时就可以使用单极标度了。
现阶段有一些性质的标度已经被标准化了,如VDI 2563的车辆内部噪声分极,以及ISO 15666的环境噪声强度划极,或者是DIN 16832对于强度评级的划分等等。随着研究的深入,这些预定义划极将会越来越多,也会为声品质开发研究人员提供更多有价值的参考。
Semantic Differential 语义细分法
 
04、主要由一组子性质组成,将某个感兴趣的性质拆分为与之可能相关的子性质,设定好这些子性质的标度(一般为bipolar),随后测评者对这些子性质进行打分,最后从这些打分结果中找出相关性较强的子性质,相当于将几组Category Scaling结合在一起。该方法比较适用于声品质参数的设计开发。
Interview 问卷调查

该方法实际上已经不属于评测环节了,更多的是对评测者信息的收集,如年龄、性别或者工作领域等。不同的群体对声音的感受和需求也是不一样的,比如年轻人对于车可能更喜欢有激情一些的声音,而年长一些的可能更加注重于声音的舒适性。通过Interview环节收集评测者的信息,然后再将他们进行分组,最后将不同组的结果进行单独处理。
以上几种方法都会被使用到,其中成对比较法和语义细分法被使用得最为广泛。在实际的运用中可以采用多种方法相结合,比如先使用成对比较法,提供一个比较稳定的排序关系,然后使用语义细分法,对其精确得分进行补充。
[1] Johansson, A.C., Hammer, P., Nilsson, E. (2001). Aspects on three methods for paired comparison listening tests, ICA 2001, Proceedings, Rome, Italy.
[2] Parizet, E., Hamzaoui, N., Sabatié, G. (2005). Comparison of some listening test methods: A case study, Acta Acustica united with Acustica, Vol. 91 (2), 356-364.
[3] Parizet, E. (2002) Paired Comparison Listening and Circular Error Rates. Acta Acustica united with Acustica.
[4] Luce, R.D. (1959). Individual choice behavior: A theoretical analysis.
[5] Yhurstone, L.L. (1927). A law of comparative judgement, Psychological Review, Vol. 34, 273-286.
[6] Fiebig, A. (2015). Cognitive Stimulus Integration in the Context of Auditory Sensations and Sound Perceptions.
 
关于我们
海德声科(HEAD acoustics China)是全球领先的声学解决方案及声音与振动分析领域供应商HEAD acoustics GmbH在中国设立的子公司。HEAD acoustics凭借其在声学领域的专业性和相关软硬件研发的先驱地位,在NVH、声学和语音音频质量的测量、分析和优化领域广受赞誉。其产品和服务广泛用于汽车、电信,IT设备、办公用品和家电行业的制造商和研究机构,以及在声音环保领域的企业与院所等。
 
联系我们
 021-6878-8055
 HEADChina@head-acoustics.cn
 
 
分享到:
 
反对 0 举报 0 收藏 0 评论 0
沪ICP备11026917号-25