MP3是如何骗过你耳朵的？( 三 )

我们用一个动画来举例子，当一个频率从低到高的噪音经过一个正弦音的时候，这个声音会被噪音掩盖。
听起来就是这样：
再比如你上课的时候，想用一声咳嗽来掩盖自己放屁的声音，那你最好要满足三个条件，一是咳嗽声的时长大于等于屁声，二是咳嗽声的响度要大于等于屁声。三是要保证二者的频率接近。这三个条件都满足，才是一次出色的掩蔽。
那这和MP3有什么关系呢？MP3的算法就是利用了人耳的这种特性，将歌曲中不同频率里被淹没的声音瞬间，给丢掉了。这样就可以在减少文件体积的条件下，最小程度的损失音质。

文章图片

文章图片
时间掩蔽temporalmasking但这还不够。
当我们听到一个噪音戛然而止的之后，实际上会有一个100-200ms的逐渐减弱的掩蔽效果。在噪音完全停止后的这段时间里，比他更小的声音会被掩蔽，我们是完全听不见的，就像我们的耳朵需要200ms的时间回复知觉一样。
不光如此，噪音还会掩蔽在它之前的声音，虽然只有50ms ，但对于感官来说已经是相当长的一段时间了，这意味着我们的大脑需要50ms的缓冲才能报告到意识里。
而这个前后过程，就叫作时间掩蔽。

文章图片
MP3压缩算法的核心，就是利用一个精心迭代了许多年的人体听觉心理学模型，把音乐里的每一个瞬间对应在MP3文件格式里的每一帧（FRAME），检查这个帧内，上述两种掩蔽作用所发生的频率和时间段，把那些被掩盖的，我们听不到的音频信息统统丢掉。
这个过程并不单纯是精确地，机械式地判断，它的底色其实是感官上的把控。
在MP3算法测试初期，测试人员需要在海量的歌曲中找出MP3压缩算法的问题。它们要在各种歌曲的MP3和无损版本之间对比，而且每听一首歌他们都要评级，一共有四个等级，分别是：听不出区别、有一点区别、有点难听和非常难听。特别是最后两个选项，可以说是非常主观的判断了。
这意味着MP3算法的发明和改进，实际上把人的主观评判作为考量的目标之一。我们不能说这种算法是完全主观的，它也不是绝对客观的，所以它的效果也不可能在所有歌曲中都是平均的。
Vega和音频编码标准之战
说到这，就不得不提MP3发明过程中的一个小故事。在MP3压缩算法测试的最后阶段曾遇到过一个大难题，当时Brandenburg和他的同事们觉得自己的算法已经非常牛逼了，几乎在所有的双盲测试中都很难听出区别。
有天他无意中看到杂志上说大家喜欢用SuzanneVega的歌曲Tom'sDiner来测试自己的音箱，而他正好在弗劳恩霍夫实验室（Fraunhofer）看到了这张CD,于是他就把这首歌上传到了电脑上。
这首歌非常简单，是一个纯人声，没有伴奏的歌曲。但当他通过MP3的压缩算法处理这首歌之后，却得到这样一个效果。
在MP3较低的比特率下， Vega的声音变得沙哑，不自然。于是在之后的一年时间里，研发团队又对MP3算法做了几千次的微小调整， Brandenburg说自己至少听了三千遍这首歌，可能比地球上任何人听得次数都多。
最后他们成功压缩了这首Tom'sDiner ，也通过这首歌，真正完善了MP3的压缩算法。
许多年之后， Brandenburg真的遇到了Vega ，而且还现场听她唱了那首Tom'sDiner 。尽管已经听了无数遍，但他说，这首歌依然很好听。