很多人用“机器不会有思维能力”的理由来反驳人工智能威胁论,但是NLP(自然语言理解)技术的出现又一次打破了这样的定律。机器通过数据训练,深度学习也可以理解人类表达的模糊的指令并自如的进行对话,目前它们能做到多聪明多智能?近期,动点科技科技接触了基于NLP技术的人工智能生活语音对话助理「玩秘」,创始人余轲曾经说过他们的愿景是:让人类把部分思考的工作交给机器。

玩秘隶属于北京轮子科技有限公司,是一家NLP语音对话助理服务商。玩秘于2018年正式服务于智能音箱小米小爱同学、天猫精灵,于2019年正式服务于小米手机。在2019年8月于上海举办的世界人工智能大会闭幕式上,玩秘作为8家被选中的优秀企业,与上海市人工智能产业投资基金完成了意向性签约。

玩秘通过语言对话与用户交互,与Siri等语音助手的简单百科式问答不同,玩秘强调思考和分析能力,能模仿人类复杂的决策过程,做出基于众多数据和因素的智能决策和推荐。

玩秘选择从生活消费和吃喝玩乐这个领域入手,余轲介绍说是因为与购物和资讯相比,本地休闲生活除了具备人性化需求和丰富供给的特点,还包含时间、地点、场景等更多维度,AI个性化给用户创造的附加值更大,优于传统个性化推荐方法的人工智能架构功效也会发挥得更加充分。

目前,玩秘已经明确了三个主要的B端终端场景:手机、智能音箱、汽车。手机语音助手是玩秘主要的应用场景,针对手机语音助手,玩秘采用GUI(图像交互)和VUI(语音交互)相结合的展现形式,通过多条件指令识别、多轮对话、模糊指令识别等功能,为用户提供深度语义理解交互服务,让用户不用打开任何App即可完成院线观影、订酒店、外卖等服务闭环。

玩秘近期可以做到多智能?余轲举例说,在人性化升级完成后,比如用户发出指令:帮我买两张晚上十点在天幕影城的复联4的票。玩秘获取之后会根据已知的海量院线信息,输出自己的人性化建议:有一个场次是十点半的,但电影结束就凌晨1:30了,会不会有点晚,要不要换成9点半的场次?在此基础上,用户可以进行下一轮对话,比如:9点有点早了;还有别的影院选择么?玩秘会根据进一步的指令做出下一个推荐。除了像这样多条件的指令,还可以向玩秘发起多样化或非模版式的指令,比如询问某个电影怎么样?附近有什么电影院推荐,价钱比对等,玩秘都可以一一作答。甚至用户搞不清想看电影的名字,只要说起其中演员的名字等比较模糊的指令,玩秘也可以理解用户的意图。具体而言,「玩秘」将根据用户特征进行类人脑推理,生成智能化的生活解决方案。随着深度学习训练,「玩秘」将越来越人性化,理解率和应答率也会逐渐提高。

余轲表示,做人工智能语音助理面临两大难点:NLP语义理解和人性化推荐。团队核心的挑战以及技术壁垒便是NLP技术,即机器对人类指令的准确理解。“这是我们首先要做到的第一步,让机器更好的理解人类的意图。”余轲说,人性化推荐则依靠数据和机器学习,核心是在于对用户和POI的刻画,标签经纬度要足够多、足够深,数据来源玩秘则通过与业内知名互联网票务平台、酒旅平台、外卖等合作来获取。

在盈利模式上,玩秘目前主要方向是在用户产生消费以后,从电影票务平台、酒店平台等内容提供商获得服务分成。

目前,玩秘已经覆盖全国95%以上的地级市,主要提供电影和酒店的服务信息。今年6月份,玩秘的功能在小米手机中上线(只需对「小爱同学」说“电影助手”即可通过语音对话的方式很便捷的购买电影票)。除了小米手机之外,中国四大手机品牌中的另外两家也已与「玩秘」达成合作,服务预计将于今年四季度上线。余轲表示,未来人类与机器以及机器人的交互形式一定会过渡到语音对话。与文字编辑、手动按键等现有的方式相比,自然语言传达的信息密度和效率要高得多。玩秘也将深耕吃喝玩乐的生活服务领域,打造生活全场景人工智能服务大脑。

据了解,玩秘目前已经完成了三轮融资,最近一轮是今年一月份由越榕资本领头的A轮融资。创始人兼CEO余轲牛津本科毕业,在斯坦福和普林斯顿分别完成了深度学习专业硕士和博士学位,有10年NLP自然语言理解与大数据分析行业领域研究和行业经验,曾任摩根大通公司的全球人工智能算法交易总负责人(能源与资源);其余核心成员来自平安集团陆金所、思必驰、豆瓣等公司。