voice

从苹果的Siri、亚马逊的Alexa到智能音箱的创业大潮,一切的一切都在说明,语音交互正在成为人们日常生活中最重要的人机交互方式之一。

具体而言,语音交互主要可以细分为语音识别、自然语言理解、声音合成等众多技术,其中语音识别与声音合成已经相对成熟,但最重要的自然语言理解离成熟却还有一段距离。

而成立于2016年5月的蓦然认知便是一家以认知计算、自然语言理解技术为核心的人工智能公司。然而,同样觊觎该领域的竞争者可不少:百度、搜狗、科大讯飞、思必驰、云之声等等,这些参与者不仅涉及语音理解,还涉及语音识别或声音合成等相关领域。而在蓦然认知所深耕的自然语言理解细分领域,也有诸如三角兽等在内的竞争者。那么,蓦然认知的杀手锏在哪里?

小而精PK大而全

动点科技此前曾采访过思必驰CMO龙梦竹,她认为同时具有麦克风阵列、语音识别、语义理解、声音合成等“大而全”的技术企业将更容易取得竞争优势。

蓦然认知联合创始人龚思颖则表示,对于一家初创企业而言,由于语音识别与声音合成已经相当成熟,因此完全没有必要再做重复性的工作。为此,蓦然认知在选择创业方向时选中了语义理解这个语音交互领域的“难点和制高点”。

然而是不是做得越全对客户的吸引力就越大呢?这可能需要根据不同的客户分开来看。

  • 首先对于小客户而言,由于资金以及技术能力上的限制,其采用一站式的解决方案是最好、最经济的选择。
  • 对于大客户而言,由于存在着产品更新换代受制于人(技术供应商)甚至企业被绑架的危险。龚思颖认为他们绝对不会采用供应商提供的全链条解决方案。

“相应的,大客户往往会根据自己的需求采购不同企业的技术,有时同一技术甚至还会寻找多家技术供应商,宁愿自己花钱做整合,也不愿意使用别人现成的一站式解决方案,即使要用也只是用其中一部分技术,大客户本身也有资金和技术做整合。”龚思颖发现,大客户最关心的是每一个环节都要掌握在他自己的手中。

“虽然蓦然认知创业的时候专注于自然语言理解,但这并不代表我们不能做一站式的解决方案。”据介绍,蓦然认知目前正在对接整合链条上其他企业的技术,进而为没有整合能力的小客户打造一站式的解决方案。

龚思颖强调自己不会做整个链条上的所有技术。“首先,每一家公司都有着自己的优势和专注点,即使有些公司做得大而全,但并不能将整个链条上的所有细分技术都能做得足够优秀,创业最重要的还是专注;其次,这就意味着与整个链条上的企业为敌,初创企业不能这么做。”

据了解,蓦然认知目前已经开始为客户提供信号处理+语音+ 语义+云端服务自动对接的一站式智能交互解决方案。

对话即应用,干掉APP前端

相信很多人的手机里都有沉睡着长期不用的APP,偶尔用一次,想删却又不能删。包括谷歌的轻应用(Ephemeral Apps)、微信小程序等都在试图解决这个问题,让用户“无需安装、用完即走”。然而,现在看来这些尝试似乎都不算成功。或许,得把取代手机APP的重任交给语音助手了。

蓦然认知目前正在推“对话即应用”的理念,即利用语音技术取代传统APP的前端,后端对接传统服务提供商的服务,用户利用语音即可调用需要的服务,而不用像手机那样下载各种APP。

当然,对话即应用已经成为行业趋势,几乎每家语音企业都在进行相关布局,那么蓦然认知有什么不一样?

龚思颖介绍,蓦然认知目前已经对接了40多个垂直场景,比如团购信息、FM、出租车、天气、机票、火车票、视频、宾馆、微信等等,而且其中服务闭环超过10个。对于这40多个场景,龚思颖强调这些场景并不是简单的打开某个APP,而是指在服务里的一切输入都可以通过语音来实现。“如果只是简单地通过语音打开某个APP,那我们的应用场景可能已经有10万条了。”

另外,利用语音输入取代传统APP前端的输入,自然语言理解异常重要,而要理解自然语言,知识图谱又是关键。“蓦然认知的另一个关键技术便是知识图谱,目前我们已经拥有百亿级的知识条目,这在行业内也算是比较大的了。而且我们更加专注于车载与知识家居场景。”

mor

相较于智能音箱,更看好智能电视与智能车载

面对风风火火的智能音箱创业创业潮,蓦然认知并不为其所动,龚思颖认为由于智能音箱缺一块屏,他们不认为音箱会是一个好的智能家居入口。相反,龚思颖更加看好智能电视运用语音交互技术的前景。

“互联网电视采用语音交互技术非常有必要。由于内容太多,用遥控器上下左右地找某个特定的节目会非常麻烦,同时其又不能像电脑那样用键盘输入,只能用遥控器控制电视屏上的虚拟键盘,这问题又回到了用遥控器选定字母太麻烦上,所以语音输入对互联网电视而言非常有必要。”龚思颖说,蓦然认知的语义理解技术已经运用于暴风TV,而仍处于保密阶段的电视企业其实还有“好几家”。

除了智能电视,蓦然认知目前另一主打领域便是车载,龚思颖认为在车载环境下使用语音技术是最自然而然、最安全的。据称蓦然认知目前正在与国内某大型车厂以及德资车厂合作试图将语音技术运用于前端市场。

天下武功,唯快不破

就像文章前面所说的,蓦然认知有不少竞争对手。对此,龚思颖认为蓦然认知的优势在于比别人跑得快。“比如去年大家都在讨论什么是语音交互的时候,我们其实已经开始动手做了;后来当别人开始谈论多轮交互的时候,我们同样已经把多轮交互做出来了,多轮不是目的,更好的用户体验才是目的,于是我们又第一家接入了订机票、订电影票等功能。”

据悉,蓦然认知目前有50余名员工,今年1月,这家公司已完成由经纬创投和源码资本合投、襄禾资本跟投的1000万美元的A轮融资。

题图来自123RF