科大讯飞徐景明:人工智能势不可挡,语言是它的助推器 | 影响力投资峰会

xujingming

投身中国人机交互领域并锤炼多年,科大讯飞在人工智能领域的贡献得到了业界的公认,同时它还掌握着足够的话语权。迄今为止,讯飞开放平台的用户数、终端数已经超过 10 亿,第三方的创业团队已经突破 30 万,国内 80%以上的硬件创业团队都在使用其核心技术。

在科大讯飞产业投资董事长徐景明看来,这样的方式有助于降低企业的应用门槛,无论是 APP、应用抑或是各种设备,都能够具备简单自然的能听会说以及能理解、会思考的能力。

在人工智能时代,中国已经开始超越美国,也就是说中国现在不仅仅在原有的优势上继续保持我们的优势,而且在科学研究和工程化能力方面,也开始走在前面。

谈及人工智能,徐景明在华兴资本 Alpha 主办的 2017 影响力投资峰会上借鉴了《人类简史》的论述, 他认为人工智能突破和人类异曲同工,归根溯源到远古时期,智人能够获得认知的突破,最重要的原因就是语言得到了广泛应用,它的出现使人类从生物进化演变为文化进化,“这是一个非常大的突破,这也是为什么我们推崇从语言的角度来探讨人工智能的发展”。

xujingming2

在整个 IT 产业发展的浪潮中,人机交互技术起到重要的引领作用。“从最初纸袋打孔技术,到后来键盘输入,再到操作系统,最后到触屏设备。”在他眼中,苹果的伟大之处在于其触屏的交互技术获得真正突破,所以致使智能手机得到了迅速普及。

徐景明表示, 人工智能分为三个阶段:运算智能、感知智能、认知智能 。他举例称,运算智能的典型,是 1997 年 IBM 深蓝机器人凭借强大的计算和存储的能力,战胜了国际象棋大师卡斯帕罗夫;感知智能,是机器具备感知能力,徐景明坚信,机器的感知智能一定优于人类;而以 AlphaGo 为代表的认知智能,自主学习了上百万的棋谱之后,在通过逻辑推理、自主决策形成了结论,与人类的认知非常类似。

人工智能在全球掀起了新一轮的高潮,目前是处于高级感知智能和初级认知智能的阶段。进入万物互联时代后,交互方式会越来越简单、自然。在麻省理评选的 2017 年的全球十大科技突破中,科大讯飞的强化学习排在第一。

谈及语音智能的发展程度,他感慨道,在语音合成方面,业界最看重的是自然度指标,“满分 5 分相当于播音员的评价标准,4 分是常人的普通话标准,3 分是及格线”。1995 年国家“863”评测第一名的系统合成效果不足 3 分,在 2016 年,科大讯飞将这一数字提升至 4.6。

徐景明分析说,语音合成如何将每个字词自然地拼接到一起,匹配好中间的能量、时长、音高等复杂参数,和真人说话相媲美,有正常说话的抑扬顿挫,这是最难以解决的事情。

除此之外,语音识别是另一关键技术,讯飞的识别准确率达到了 97%、98%,而在高噪音环境下的语音识别,则是业界普遍难以逾越的门槛,但讯飞做到了这一点。在 2015 年宝马全球语音测试中,讯飞在车内的高噪环境下,赢得了第一名,指数比第二名高出 12%,这也是目前国内唯一可以在汽车中有效使用的系统。

在认知智能方面,讯飞建立了“六龄童阅读理解”,旨在使机器达到 6 岁儿童的认知水平,徐景明表示:“6 岁的儿童具备了正常的逻辑推理能力和判断能力,而 6 岁孩子开始上学以后,大量的知识学习对他来讲是极具挑战的。”因此,一旦机器达到 6 岁儿童的认知能力后,后面的知识对它来说顺理成章。

值得一提的是,科大讯飞在自动阅卷技术上达到了专家老师的水平,针对江苏高考智能阅卷系统,对机器评价和人工评价分别做了对比测试,结果显示,机器在语文作文的一致率是 92.8%,英文则是 94.57%,而人工低于 90%。而在湖南省研究生的智能阅卷验证中,作文项机器也远远优于人工。

徐景明透露,科大讯飞的智能阅卷用到了两大核心技术,可以让机器识别学生的手写体,并达到 95%以上的准确率;再让机器通过深度学习,对考生的作文水准进行判断。

今年年初,中国政府将人工智能写入了《政府工作报告》,7 月份,国务院颁布了《新一代人工智能发展的规划》。谈及未来产业的发展机遇,徐景明认为,人工智能发展的两条主线,一个是以 DNA 为代表的深度神经网络算法的进步;另一个是脑科学和类脑科学的研究。DNA 深度学习算法的突破已经深刻地影响和改变各个行业。

他还指出,人工智能改变世界的三要素:核心技术的突破、大量的行业数据以及行业经验和专家知识。

不得不说,人工智能的到来比想象中的更快,“那么多人最初都不看好 AlphaGo 能够战胜李世石,但从做人工智能的角度来看,我们非常清楚它一定会赢掉李世石,这个过程是不可逆转的,一定会到来的。”

(照片由云摄影 V.Photos 拍摄提供)