lizhifei副本

编者按:最近,大大小小的厂商都加入了智能音箱战局。那么,智能音箱是不是一门好生意,这会成为硝烟弥漫的战场还是歌舞升平的乌托邦?为此,动点科技近期推出了专题【智能音箱的理想国】,我们将从硬件、评测、市场、投资人和它背后的人工智能、语音识别等方面进一步呈现它。作为此次专题系列文章之七,动点科技采访了刚刚发布智能音箱的出门问问创始人李志飞,在他眼中,智能音箱会是什么样的形态呢?

随着亚马逊的智能音箱Echo销量逼近千万,这家公司在语音硬件上的成功极大刺激了国内外一大波科技公司,他们纷纷开始布局语音交互领域。有媒体曾根据内部人士提供的数据称,国内已经有超过200多家公司正在研发类似Echo的智能音箱,其中便不乏京东、阿里、腾讯、喜马拉雅、小米这样的大公司。而就在上周,出门问问,这家被谷歌相中的中国创业公司也推出了自己的智能音箱产品——问问音箱,正式加入这场战局。

那问题也就来了:出门问问为何还要加入这场血腥的战局?它将如何应对竞争?针对这些问题,我们跟出门问问创始人李志飞聊了聊。

“语音交互其实并不新鲜,美国科技史上有很多科技巨头做了探索,比如IBM、Google等等,然而这些公司之所以没能做出一款具有海量用户的语音类产品,主要是因为IBM专注在PC,而Google关注于移动手机,但是这两个设备都没有成为语音交互设备,使得他们基本错失了这个机会。”李志飞认为,亚马逊Echo的成功主要就在于它找到了音箱这个具体的场景,“音箱没有触摸屏不能触屏操控,必须做对话式交互。”

李志飞表示,出门问问之所以做智能音箱,在某种程度上的确是受到了Echo大获成功的影响。不过他也认为即使没有Echo,做智能音箱也是迟早的事。“出门问问2012年成立时就说要定义下一代人机交互,(研发出门问问语音助手)开始做语音交互探索,但我们很快发现语音技术在手机上是非常难成功的,所以从2014年上半年开始,我们把语音交互放在软硬结合的产品里面去,这和亚马逊做音箱的思路非常相似。”据了解,在问问音箱之前,出门问问已经发布了智能手表、智能汽车后视镜等软硬件结合的一系列产品。

入局和机会

虽然一直想做智能音箱类产品,但在入局的时间点上,李志飞认为作为创业公司很难独自开创一个新的品类,因此入局时间不能太早。直到后来Echo大获成功并被媒体与消费者大量关注,他才认为该是自己入局的时间了。“AI或语音交互是灵魂,但是灵魂得有载体,而这个载体其实并不一定必须是音箱,尽管今天最容易推广的载体就是智能音箱,如果做一个智能镜子就不会有那么多人关注了。”

而关于中国用户能否养成使用智能音箱的习惯,李志飞表示:“在美国,很多人反馈音箱很多时候是小孩子在用的,因为他们不能用手机,不懂输入,也还不识字,语音输入成了最没有门槛的输入方式,中国也会有这样一个过程,当然,还是有很多人会拿音箱来听音乐的。”

李志飞告诉动点科技,出门问问于去年8月正式考虑做智能音箱,并于今年4月份进行了展示,直到几天前正式发布。按照当初的计划,它应该是中国第一个可量产的智能音箱产品,但这个行业的火爆完全超出了他的想象,“我们很快发现还是来晚了,在四月份发布会之后市场上出现很多智能音箱,这个不可怕,最可怕的是BAT也进入了这个领域,而且他们是非常严肃在做相关的产品,这其实是我们始料未及的,说百箱大战也不为过。”

不过,虽然问问音箱的发布时间晚于天猫、小米等同类产品,那来得晚就代表错过机会了?对此,李志飞最初也是比较忧虑的,“当时我就去跟工程师和产品设计团队说能不能快一点。”然而硬件研发都是有一定规律的,想要速度就意味着产品质量性能上会大大折扣,李志飞并不愿意牺牲质量和性能。

与此同时,李志飞意识到任何一个科技产品从开始到最后成熟都经历过四个阶段:探索期、启动期、高速发展期和成熟期。“如果说美国在启动期后期和高速发展前期的话,中国还是启动期,智能音箱真正能够变得成熟使得老百姓能用是一个非常漫长的过程,所以这种情况下,我们晚两个月、早两个月发布音箱产品又有什么区别呢?”李志飞认为,中国智能音箱还是一个刚刚起步的阶段,顶多每年能有百万台的出货量。

chumenwenwen

价格不是决定性因素

据了解,相对于499元的天猫精灵以及299元的小米小爱同学,问问音箱(上图)按不同款式售价分别为999元和1399元,即使是众筹价也得649元起。这样来看,问问音箱性价比似乎并不高?

对此,李志飞表示:“智能音箱主要有两大成本,一是内容版权,二是AI技术。即使不算硬件材料上的成本,仅仅在版权与技术上的成本加起来可能就达到两百块钱了。过去小米的很多爆品都不存在这两个成本,手环也好,空气净化器也好,它们确实不需要非常高素质的AI科研产品团队做研发,也没有版权的成本。”

“智能音箱这个品类,尤其在用户对它还没有形成足够认知的情况下,是不是可以通过低价把竞争对手比下去,拭目以待,我个人是不太相信的。”

另外,低利润甚至无利润没法支持智能音箱在技术上的持续研发与改进,而实际上,目前的智能音箱远未成熟,还需大量的研发改进。因此,李志飞认为目前的价格战其实是在扰乱市场。

智能音箱能成就五个以上的玩家

在李志飞看来,硬件消费品不像软件产品那样容易形成一家独大的局面,对应的智能音箱行业“一定会有(成就)超过五个以上的玩家”:

  • 1、对硬件产品来说,往往是萝卜青菜各有所好,有人说这个好看,但也有人可能会认为这个太难看。
  • 2、硬件产品的试错成本太高,用户不可能今天花一千块钱买一个产品,明天又买一个别的吧。

另外,李志飞对“保持在前五名”却是非常有自信的:

首先在语音交互技术上,出门问问从2012年开始就在做语音交互方面的研究。出门问问甚至在发布会上表示通过实验,他们发现,问问音箱语音唤醒率比行业平均值高 11%,误唤醒率则是比行业平均值少 3.7 次/20 小时。而在端到端的响应时间上,问问音箱平均响应时间为 2.4 秒,比行业平均值快 23.3%;端到端准确率方面,问问音箱得分 89.5%,比行业平均准 13.8%。

正如前面所述,出门问问在硬件研发上已经有过很多经验,2014年开始,这家公司已经开发了智能手表以及车载后视镜等软硬件结合的产品,而通过做智能手表已经将做智能音箱时可能碰到的坑都填上了。李志飞表示,问问手表去年的销量为20万台,后视镜产品目前销量达到了近五万台。

值得一提的是,问问音箱并没有采用市面上较为普遍的6+1等多麦克风阵列,而是跟Google home一样,采用的是2麦克风阵列方案。一般而言,麦克风越少,想要达到相同的拾音效果,难度也就越大。不过,采用这样的方案也一定程度上说明出出门问问对自身技术的信心。