狄更斯在对资本主义高速发展的描绘中,有一句经典语录:这是最好的时代,也是最坏的时代。

一个新事物的高速发展所带来的社会变革,几乎是 “危”、“机” 并存。云知声 CTO 梁家恩认为,作为近年来最有关注度的话题——人工智能,也正处于 “最好的时代,也是最坏的时代”。

在云知声首届 AI 技术开放日上海站的分享中,梁家恩抛出这个观点,并进行了解释:“为什么是最好的时代?产业机会已经摆在眼前了。为什么说是最坏的时代?假如还停留在技术 AI 的时代,那这个时代会进入第三次泡沫和寒冬。”   

此次的 AI 浪潮并非首例,这也让很多从业者更加 “小心翼翼”。“过去 AI 经历了三起两落,这些都是在学术 AI 里发生的,其实真正的深度学习带来的产业 AI 才开始。” 他表示,产业 AI 所面临的挑战和问题远远比学术 AI 多,“学术解决的是求真的问题,而从产业角度来说是要改变这个世界。”

简单来说,梁家恩认为目前已经处于产业 AI 的时代,单纯的炫技和刷榜已经不是这个时代所需。“ 未来应该是走向万物智联的时代,而其中最大的捷径则是解决产业问题和创造用户价值。” 他认为,那些厚积的 AI 实力有了喷发的机会,理论热潮已经褪去,裸泳的人工智能企业将无处可藏,真正秀 “肌肉” 的时候到了。

那么如何真正的解决产业问题并且创造用户价值?梁家恩分享了云知声对于该问题的解读以及经验。

首先,产品要能够用到产业具体场景重的基础是,产品足够 “硬核” 且 “适合”。所以在技术能力和产品体系等方面,需要有完备的能力。云知声在 2012 年完成了语音云、深度学习及超算平台的三驾马车构建。在 2014 年,云知声提出了 “专注物联网人工智能服务” 的定位,以及面向物联网的 “云端芯” 概念和产品体系构想,并且在医疗、教育等多个领域的行业应用方面进行了实践。目前,云知声已经构建起了包括异构超算平台、AI 芯片、语音图像交互算法等一系列 AI 体系。

梁家恩喜欢用两个关键词来概括云知声的 AI 哲学。第一个词是 “全栈”。“光有技术不行,我们需要把技术创新和产业闭环打通,这样才能带来产业的变革。” 他说。第二个词是 “硬核”。他表示,全栈可以从两个维度来解读:一是贯通产业价值闭环,即从零到一和从一到十的过程;二是从技术体系来看,云知声最终想打造的是多模态拟人化系统。尽管云知声是依靠语音技术起家的公司,不过,目前,其全栈闭环已经打通,包括感知、认知以及 AIoT 芯片。

此外,梁家恩透露了一组数据:在产品落地方面,云知声在家居方面已经有超过 200 万的出货量,车载方面有 1800 万的车载终端,儿童玩具机器人超过 400 万台,医疗方面有超过 600 家的三甲意愿,有 2.7 亿日调用量。

当然,比较有趣的一点是,在市场上,强调 “全栈式”AI 的企业不只云知声一家。近来年来,随着企业对场景的理解逐渐加深,以及资本对全能型企业的青睐,不论是跑在人工智能赛道前面的,还是一些新兴的初创企业,都把自己的业务往全栈式模式发展。不过,一个算法应用公司要摇身一变成为集算法、芯片、开放平台及硬件产品为一体的全能型,并非是易事。那么,“全栈式” 是否会变为一个噱头?

梁家恩说:“每个浪潮来时都有泡沫。” 他表示,一些公司可能并没有想明白芯片落地到底有多大的作用。但是云知声很早就已经想清楚并做了验证。“所以认识不同,大家做芯片的想法和套路就不一样。” 他认为,在技术型创业路径上,想靠投机取巧是没那么简单的。“这不是玩模式和应用的,从技术层面来讲,想法很重要,但是要把产业变化变成现实才是竞争力。” 他补充道。

什么样的团队适合做 “全栈式”?梁家恩认为关键是要有决心,此外还需要够多的资源和扎实的技术功底,并且对产业有足够深的判断能力。” 用学术做 AI 是不行的。而且,决心不强,你肯定也不会愿意突破。” 他说。

当然,除去一些 “比较迷茫” 的参与者,在全能型选手中,也不乏众多实力派,云知声的优势是什么?梁家恩表示,云知声主要有两大方面的优势:一是在语音交互里整个技术体系里,其有一套完整体系的想法,在规划方面有较大优势;二是目前市场上较多的类似企业都是集中在图像领域,而云知声过去最大的应用积累是语言交互的点比较多。与图像应用相比,通过语音整合多模态的能力更强。从图像延伸到语音会更困难,因为语言的处理以及知识图谱的构建复杂度会高很多。