
文章图片

文章图片

如何将声音翻译成没有灵魂的0和1? 。 我们来看看熟悉的设备:计算机声音、视频、MP3、广播和流媒体、各种算法等等是如何工作的 。
本文没有实用价值 , 纯属娱乐 。
一点点物理知识声音是空气中的振动 。 就像水面上的波浪 , 在空气中 。 气压进入耳朵 , 耳朵里有敏感的部分 , 可以微妙地感受到空气的振动 。 这些振动被人们感知为声音 。 外太空没有声音 , 因为没有空气 。
频率 。 振动越快 , 我们感知到的声音就越弱 。 一个人感知的振动从每秒 20 次到每秒大约 2 万次不等 。 换句话说 , 这被称为振荡频率:赫兹 。 也就是说 , 我们听到的范围是从 20 赫兹到 20 千赫兹 。
相比之下 , 狗听到的频率
振幅 。 振动越强 , 声音越大 , 反之亦然 。 你可以想象这是池塘表面波浪的高度:可能有小的涟漪(安静的声音) , 也可能有很大的强大波浪 。
将声音分成几段
现在让我们这样做:我们将第二个部分分成 4 个部分 , 并为每个部分找到幅度值:
我们在一秒钟内测量了四次波的状态 。 这称为采样 。
我们测量了四个点中每个点的幅度值 , 相对而言 , 收到了四个数字:+30、-50、-50 和 -60 。 从理论上讲 , 如果我们通过电流并将这四个电压施加到扬声器上 , 我们将能够再现相同的声音 。 但是有几个问题:
? 由于我们只在四个地方测量 , 错过了整个振荡 。
?我们最终会得到与原始声音相比非常失真的声音 。
以 4 的速率采样 , 对于声音来说太少了 。 要获得至少可以理解的语音 , 需要将一秒分成 8000 段 , 而对于音乐 , 通常 41000 段就足够了 。
让我们提高采样率:在同一单位时间内将声音切成更小的片段:
现在测量会更加准确 , 产生的声音也会更加自然 。
转换为数字在我们将声音分成小段并测量每个小段的幅度值后 , 我们可以用表格的形式记录下来:
时间????? 振幅
0.01 秒 。 ????5
0.02 秒 。 ????7
0.03 秒 。 ????10
如果我们把整个声音分成相等的段 , 那么时间就不能写了 , 因为我们知道它是如何变化的 , 在一行中写振幅值就足够了:
5 7 10 … ?21
为了让计算机理解这些数字 , 让我们把这些数字翻译成 二进制数系统 。 为简单起见 , 我们假设一个数字恰好占用 1 个字节的内存 , 但实际上 , 分配给该数字的字节越多 , 测量和音质就越准确 。 翻译后 , 我们得到:
00000101
00000111
00001010
…
11101011
计算机已经可以理解并以声音的形式重现现这个序列 。
现在如何播放声音? 使用扬声器或耳机——任何可以“推动空气”(即产生声波)的东西 。 在扬声器会产生空气振动 。
? 对扬声器施加一些电流 。 根据电流的强度 , 扬声器音圈会以不同的方式移动 。
? 要获得这种变化的电流 , 需要一个称为DAC
- 纸质表格|“数字化”助推火箭升空
- 跨境|跨境电商迈入数字化变革期
- meta|促进更逼真AR/VR体验,Meta正在开发全新空间音频工具
- 数字化转型|新一代iPad Pro正在路上 外观、配置大升级
- 疫情期间获近亿元A轮投资,青浦这家企业数字化服务商乘“长三角数字干线”发展快车逆势上扬
- 6月23日消息|讯飞AI翻译笔P20系列发布:单词、课文全能扫
- 物联网|喜马拉雅首推短剧,音频平台入局微短剧赛道
- AI与K12的碰撞:科大讯飞推出适龄专属AI翻译笔
- 矽源特NS4002 是一款3W*2双声道音频功率放大器
- 数字化转型|2000元内有10.3英寸电子墨水屏产品吗?这款售1999元,配置有特色
