“声联网”时代即将来临，你听到了吗？

shutterstock_95091298

鸟类是如何交流的？通过鸣叫。现在，机器间的交流也可以用声音了。一批新型公司现在正制造一种被叫做声联网的东西。

声音简史

我们来回顾一下。声音被当作信号的历史可谓久远。在最早的时候，号角、鼓和钟声鸣起警报的时候，鼓动了集会、指挥军队和城市工人们；响彻整个城市的铃声指引着我们的生活。这些声音主要是为了交流，而音乐性则排到了其次。

在一些似乎不大可能的地方中可以找到模拟声波代码：从莫扎特到舒曼的作曲家们在他们的音乐中隐藏有着独特音频逻辑的音乐玩笑；水下数据解调器引导着海军舰艇；电话网络会使拨号等音变得嘈杂。

对于许多人来说（包括我），第一次体验互联网是调制解调器发出像白头翁吱吱叫的声音，盒式磁带里的 PCM 编码游戏－这些声音不是数据本身而是数据传输的副产品，它们既不是为了在空气中传播也不是为了被人耳听到，而是为线缆设计的。

随着小型音频片段能在移动设备上实时解码，我们来到了有着为进行无线传输而将 URL 编译成记录序列的现代系统的数字时代。在这个无重量感知的数字世界里，很容易就忘记了信息也是一件物品，东西怎么会发不出声音？在现在这个时代，机器也是能发出声音的，而且他们可以交流从图片到支付方式的任何东西。

声联网时代来临

这就是声联网。首先，机器可以通过声音将链接发送到远程网络，此外，机器内的查找表也不需要其它的网络了：因为声音本身就是网络。如今的科技已经足够在可听域范围内或超出这个范围发送少量数据，也能足够好地将每一个创建的链接编码成数秒或更短的音频。

这是个大胆的想法

声音有多种存在形式，首先也是最容易被忽视的就是网络形式。

想想看：这个地球上有着比人还多的微型廉价扬声器。为什么不利用这种无所不在的日常科技呢？我们看到了一个简单而直接地连接大量设备的巨大机遇。

声音可以到达其它网络到不了的地方，而且声音可以和现有的协议一道成为网络生态系统有价值的一部分。我们可以很轻松地重新构造自动取款机、电视、玩具、收音机和平板 —— 只要能传播声音，就能发送数据。

它的原理是什么？

有许多技术可以搭建声联网，大致包括三个方面：

描述：通过选中的已有的信号特征将两个信号区分开来，又称“音频指纹”。这样的例子包括音乐识别服务，像 Shazam 和 Soundhound。极客们，请原谅我举这两个例子：虽然从广义上讲这些技术也可以被称为真正的声联网科技，但即便是音乐也是能为点对点交流而进行重塑的。

添加：可检索但人类难以觉察的特征（也叫“音频水印”）可以被添加到任意一个音频信号中。这样的例子包括在无线广播中利用代码进行听众追踪。有一种方式是利用微小的，不易被人类察觉的快速回音，这些回音通常被人耳听力忽略掉。这种方式被像 InFrasonics, mufin 和 Civolution 等公司使用。它的码率大致相当于上面的指纹方式的码率。

编码：除了在大型线上已知声音库中节取一种声音，或者快速添加水印，完整的音频信号（音高，音色，音阶或振幅）本身就是代码。Chirp 和 LISNR 的多音高系统就是如今被编码得足够强大以避免噪声干扰，失真和压缩的例子。最近发布的 Google Tone 是基于另外一种多频编码方式的。纯代码信号的“清晰听觉”比起前两项技术来有着更快的速度优势。

然而……

所有的方式都有相对的优势和劣势。通常在实用性和工程设计方面有冲突。信号可以包含丰富的数据，但是不堪入耳。信号也可以让人毫无觉察地嵌入到弦乐四重奏中，但编译的数据微乎其微。信号在现实世界中的噪声、混响等声音面前可能显得无比的脆弱。信号可以既不好听也不可靠。

通过声音传送数据必然是缓慢的。通过悦耳的声音传送数据那就更慢了 —— 因此，关键是要发送指针而非文件。声波数据涉及到安全问题：一对多的数据分享相当有用，但不安全（看如何设计）；那如果你只想分享给一个人呢？这是个有趣的挑战 —— 就在我们现在谈论时人们正在研究新的解决方案。

最后也是最重要的一点，我们真的需要声联网吗？我相信是的。声音有多种存在形式，首先也是最容易被忽视的就是网络形式 —— 它是跨越最后那几米距离的桥梁，是去往其它网络无法抵达的地方的媒介。

务必小心

声音本身影响重大。谨慎郑重地使用声音，同时注意保护声波环境至关重要。从耳机漏音到街道噪声，再到声波用户界面，我们已经有了太多随意而嚣张的噪音污染，而这些却在事后回想时被认为仅仅是按键提示音。

作为音频极客和音效设计师，我们在设计发送的声音时花费很多心思，而且我们明显地会在自然界，尤其是鸟类语言中塑造我们的音频声音。声联网要有一种人性化的交流方式：也就是一种通过将人耳放在第一位也是最重要的地位来尊重用户的方式。

声音无处不在

是时候兴奋了。老实说声联网的机遇大得令人难以置信，从现有的应用程序到便捷的资源配置。现在重新构造语音，音乐和数据分享的声音设计这些都有潜力，我们公司在这方面比较活跃。

新的硬件会加快对它的理解：愈来愈便宜的手机专用 DSP(数据信号处理) 芯片，以及因始终在线的接收功能以及无需用手操作的用户界面而需联网的设备，加大了声联网产品的覆盖范围和效率。我们已经看到音频被应用在通过收音机发送比特币的支付方式中，在教室通过图片或网页分享以便将地图发送到手机上。我们才刚刚开始。总之，从非智能手机到门铃，只要有声音的地方就有数据。

声联网的时代来了，有一件事是肯定的 —— 你还不是什么都没听到。

“声联网”时代即将来临，你听到了吗？

你可能会喜欢

马来西亚的电动汽车之路，从足够可期到任重道远

2024 Lucid Air Grand Touring 拥有更快的充电速度和节能热泵

Sensor Tower：《Monopoly GO!》登顶 3 月全球手游收入榜，全球吸金 2.77 亿美元

Counterpoint：高通骁龙 8s Gen 3 将推动 AI 智能手机发展