ABX盲听测试简介

时间：2020-09-08 12:12:02

关键字：音质 mp3编码 abx 盲听测试

手机看文章

扫描二维码
随时随地手机看文章

[导读] 　　人们平常听音乐，受到来自各方面因素影响着我们的实际听感。这些因素包括线缆、扬声器甚至软件解码器本身。那我们如何才能分辨出这些因素带来的究竟是正面的还是反面的影响呢？　　ABX测试可

　　人们平常听音乐，受到来自各方面因素影响着我们的实际听感。这些因素包括线缆、扬声器甚至软件解码器本身。那我们如何才能分辨出这些因素带来的究竟是正面的还是反面的影响呢？

　　ABX测试可以带给我们答案。ABX测试是音频应用方面常见的用于衡量或比较相同性质的对象之间不可量化的特性（比如音质）的方法。

　　在这种测试中，测试人会获得三个分别被标记为A、B和X的音源。A和B是用作参考的，它们一个是被处理过的，另一个是未被处理过的，比如说，一个是原始的WAV文件，另一个是从WAV文件压缩得到的mp3文件。X是未知的音源，它可能是A，也可能是B。测试人必须通过聆听比较它是A还是B。右图是一个典型的ABX测试软件的界面。

　　由于选择只有两个，不是选A就是选B，有50%的机会选对，因此单纯的一次测试并不能说明问题。需要进行统计分析，也就是说，需要进行不止一次的测试。通常的做法一般要求测试人对一个测试重做15遍，每次测试时都会从A和B两者中随机抽出一个作为X。根据所有的测试结果进行分析，便可大大减少碰巧选对的可能。从概率上看，一次测试选对的机率是50%，而重复做16次测试都选对的机率则是50%的16次方，即65536分之一。换句话说，如果A和B之间的差异非常的小，测试人根本就听不到区别，则测试人的平均结果应是一个趋向于50%的值。如果A和B之间存在着明显的差异，则测试人的平均结果应有明显的倾向性。

　　比如，我们需要比较两对喇叭的音质。显然，他们应该具有不同的表现。我们把测试进行7次后，会有128分之一的机会获得一个虚假的正确答案，即根据测试结果进行统计后得到的汇总结果与实际情况相比是错误的。在统计学上，这种情况被称为“第一类错误”。该类错误发生的可能性随着测试次数的增加而减少，测试次数每增加1次，发生错误的可能性就随之减少2分之1。。

　　现在，我们在CD播放机旁边放上一个手镯，然后再进行测试。可以说，这应该对音质不会有任何影响。我们把测试重复40次，成功分辨出音质不同的可能性是2 的40次方分之1。可以说，出错的几率是非常小的。但如果测试结果证明放和不放手镯的确会产生音质上的差别，那必须有一个解释：可能是测试人听到操作人员在移动或放下手镯时发出了声音；或者每次手镯放在播放机旁边时操作员的动作都会变慢；又或者其它各种各样的非听觉因素导致出现这样的结果。

　　关于统计方面的事情，估计也没有谁有兴趣深入讨论，就此打住。但从以上的简单解释中，我们可以提炼对于ABX盲听测试的一些规则：

　　1、想验证实际上不存在的事情是不可能的。如果你对一件事情有疑问，比如对认为某个音频编解码器会影响音质，你应该通过测试去证实，而不是基于任何假设去想当然。

　　2、测试应该以双盲条件进行。单盲测试意味着你除非通过实际聆听否则无法分辨出X究竟是A还是B。双盲测试则意味着测试过程中操作员和测试人都不知道X是 A还是B，以避免可能出现有意或无意的操作员暗示。也即需要第三人专门负责进行切换。在计算机上有相当多的软件可以进行ABX测试。

　　3、确保测试人只有在测试完成后才知道结果，包括正式测试前可能会进行的试验性测试。否则的话，则应改为在每一次测试之后测试人都能知道结果，并能随时决定中止测试。

　　4、测试必须是首次进行。如果不是的话，之前进行的所有测试结果都应一同被汇总考虑。

　　5、测试人可以保留意见，即测试过程中可以在对自己的判断不肯定时保留意见，并要求暂停，待后再续。

　　6、测试过程必须是可重现的，根据相同的测试过程得到的测试结果也应当是一致的。

　　7、测试过程中的时序也是一个要考虑的方面。比如在连续的测试过程中，应给予相同的时间间隔等，以免测试人的判断受不同的时序影响而作出猜测。

　　当然，测试结果也不一定就是“X是A”或者“X是B”这么简单。比如在MP3编码的音质测试中，测试人还需要选择X对A和B的相似度，并由此计算出MP3编码的音质效果。由此还可以扩展出其它测试方法来。下图是一个关于不同的MP3编码器音质对比的ABX测试结果图。