曾听见一位对话机器人公司的老总抱怨自己虽然有一个好的算法却苦于没有数据,于是在微信群内广发 “英雄帖”,询问谁能为其介绍大数据资源。可见大数据已经成为人工智能企业创业最为关键的要素,虽不能说得大数据者得天下,但得大数据者至少在创业的道路上已经成功了一半。

当市面上的大多人工智能公司都在买数据时,我们不仅不需要买数据,甚至都已经可以卖了。

图灵机器人 COO 郭家表示图灵机器人最大的优势便是拥有全球顶级的中文对话语库。据介绍,目前图灵机器人已经拥有 40 多万的开发者,积累了 1300 多亿条语料库,而且值得一提的是这是对话语料库,极少有其他公司能达到这样的量级。那么图灵机器人是如何做到的呢?

congdong

一切都得从虫洞语音助手说起。

虫洞语音助手是图灵机器人于 2012 年正式发布的类似于苹果 Siri 的对话机器人,其具备语义搜索、智能问答、语音控制等功能,旨在解决用户生活中遇到的各种问题,帮助用户快速获取信息。作为国内较早的语音助手工具之一,“虫洞语音助手” 于 2012 年 3 月推出第一版,当月就有 40 万的用户注册,产品一炮走红。而到 2013 年 5 月,虫洞日活跃用户度约为 15%,总用户量接近 1000 万。

不过,在面对良好发展势头的同时,图灵也注意到了背后潜藏着的隐患。“我们发现就连 Siri 的体验也都还不够好。” 郭家表示。

据了解,虫洞语音助手能正确地完成用户提出的任务和要求,但也不完善,很多时候虫洞能将连续提出的几个问题进行关联,经常只是机械地对每一个问题进行回答,不能区分用于无聊调戏的聊天模式以及正常使用的问答模式。

尚不完善的体验无法长久地留住用户。据了解,图灵本预期 2013 年虫洞语音助手的用户将增长到 5000 万,但实际上在 2014 年 11 月动点科技对其进行报道时,虫洞的注册用户也才只有 3500 万。显然,纯粹地做语音助手已经不行了或者还不到时候。而图灵其实早就意识到了这一点,为此,他们在 2014 年开放了虫洞语音助手的后台接口,让合作伙伴可以在手机、电视、微信、车载、家居、导航等方面拥有自然语音处理能力,而这便是图灵机器人。

而由 2C 变成 2B 的举动也为图灵带来了第二春。据郭家介绍,2014 年虫洞一开放,数据量便开始飙升,“差不多每月增长 1 万个开发者,1 亿多个用户。”

tuling

大数据促成 “中文语境下智能度最高的机器人大脑”

这是图灵机器人在自己的官网上打出的 Slogan,图灵竟敢打出这么一个扎眼的标语,其实并不是标榜自己的技术有多么好,“现在的人工智能公司最终比拼的其实还是数据,不管是语音识别、语义识别还是视觉识别等算法 95% 以上都是开源的,如果某家公司说我算法好,那只能说他们没有找到一个会看论文文献的人。” 郭家表示,“大家拼的应该是数据。”

也正是在数据方面的积累使得郭家有信心表示图灵机器人是 “中文语境下智能度最高的机器人大脑”。对此,郭家认为可以从两方面说明图灵机器人的 “聪明”:

  • 1、准确率,即能否正确回答用户的问题。我们对比过其他企业的产品,发现我们是最高的。资料显示,图灵机器人在语义识别方面的准确率可达 94.7%。
  • 2、趣味度,用户持续试玩的感受,这方面,我们目前至少排前三。

基于这些,最近图灵机器人被腾讯选中,被集成到了新版的 QQ 中作为 QQ 群里的聊天机器人,辅助群主运营,“腾讯方面一下子上线几十万个群,刚上线最高每秒并发几万次,直接让我们的流量飙升了十多个点。” 郭家说到。不过,此次腾讯一共上线了两款 QQ 群机器人,一款是图灵机器人,而另一款则是微软旗下大名鼎鼎的小冰机器人。

而接入中国最大的流量池之一的腾讯 QQ 之后,图灵方面的对话数据库显然也会与其他竞争对手进一步拉开距离。

基于图灵机器人,打造 Turing OS 机器人操作系统

智能手机的触屏式交互是对传统键盘式交互的革新,为此,才有了安卓等移动操作系统。而到了人工智能时代,触摸式交互也开始落伍了,基于语音以及机器视觉等等的多模态交互才是机器人时代的主流交互手段,这是输入方面的变化;而在输出方面,机器人时代的输出也已经不再只是声音和文字,机器人的肢体动作和表情也将成为输出的重要部分,新的交互方式决定了 OS 的框架,也意味着安卓等系统不适用于机器人,郭家认为机器人的普及也必须有专门为机器人开发的操作系统的助力。

因此,图灵在做好主打语义理解的图灵机器人的同时,还在机器人操作系统方向发力,以期取得更大的价值。据了解,图灵在机器人的基础之上整合打包了其他包括语音识别、图像识别等友商的技术,开发了 Turing OS 机器人操作系统,旨在让机器人开发更加简单,开发者只需要安安心心做硬件,而不用专门找人自己开发系统软件。

另外,郭家认为安卓系统最主要的问题就在于时延。“如果一个机器人要摔倒了,系统必须即时反应,不能有延迟”,所以,Turing OS 机器人操作系统还在 kernal 和 framework 层进行了优化,以达到即时性的要求。

目前,Turing OS 除了在语义识别方面能够达到 94.7% 的准确率以外,人机对话准确率也达到了 88.2%,后者采用情感 TTS 技术,具备 25 种语言情感,包括 468 类情感语言、120 种声音语调、88 套表情动作,官方宣称识别准确率达到了 95.1%,可以像人一样识别和表达情感。

操作系统的竞争是一个巨头之间的竞争,现在包括阿里巴巴、孙正义旗下的软银以及谷歌和微软都在机器人 OS 上有所发力。面对巨头,郭家这样告诉记者,“做 OS 的竞争一定是最顶级的,对我们而言,不要有那么大的压力,将自己喜欢做的事情做好就可以了。”

据了解,图灵目前具有员工 130 余人。2016 年 1 月,其接受了奥飞动漫 5000 万元的战略入股。

题图来自 123RF