34284401 - army of robots
图片来自123rf

去年,美国白宫发布报告《国家人工智能研究与发展策略规划》。报告中提到,从2013年到2015年SCI收录的论文里,“深度学习”的文章增长了约六倍,同时强调,“按文章数计算,美国已不再是世界第一了。”相应的,报告显示中国在2014年和2015年超过了美国,居于领跑者的位置。

那么,在人工智能领域研究超越美国的中国到底有多强?本文就带大家认识一些在人工智能领域知名的华人面孔(不限于中国国籍)。

陆奇

luqi

陆奇最近因为加盟百度而成为业内红人,其实,这位此前极为低调的大牛却是“硅谷最有权势的华人”。

陆奇是复旦大学87届计算机系的精英,1998年,陆奇加入雅虎公司,2007年晋升为雅虎执行副总裁。2008年8月,陆奇离开雅虎,并于次年1月正式加盟微软任网络服务集团总裁。在他带领下,Office系列软件成为微软的现金奶牛,2013年仅office为微软带来的收入就超过25亿美元,相当于Facebook整个季度的营收。陆奇所带领的Exchange、Skype、必应搜索、必应应用、MSN及广告等平台在内的产品研发与相关团队运营正是微软转型的中枢。

陆奇除了在学术界发表过一系列高质量的研究论文,还持有40多项美国专利。

傅京孙

fujinsun

傅京孙是浙江丽水人,1949年去台湾,是美籍华裔模式识别与机器智能专家,美国工程科学院院士,台湾中央科学院院士。

傅京孙是句法结构模式识别领域的开山鼻祖,句法结构模式识别使用小而简单的基元与语法规则描述和识别大而复杂的模式,通过对基元的识别,进而识别子模式,最终识别复杂模式。而且,这个表达还支撑了自底向上或自顶向下的计算的过程。另外他出版了5本专著和18本编著,发表过约400篇论文。很多人都认为,如果诺贝尔奖中有电脑模式识别这一项﹐那么此项奖项殊荣将非傅京孙莫属。

1973年,其与其他人组织了第一届国际模式识别会议(ICPR),后来演变成国际模式识别学会IAPR。他创办了IEEE模式分析和机器智能(PAMI)会刊,这是目前计算机视觉和相关领域最权威的一本期刊。目前,国际模式识别学会IAPR设立了一个傅京孙奖,作为终身成就奖,是模式识别的最高荣誉。

黄煦涛

huangxitao

黄煦涛是继傅京孙之后, 在计算机视觉、模式识别、多媒体等领域最资深的华人科学家。主要从事信息和信号处理方面的研究工作,发明了预测差分量化(PDQ)的两维传真(文档)压缩方法,该方法已发展为国际G3/G4FAX压缩标准;在多维数字信号处理领域中,提出了关于递归滤波器的稳定性的理论;建立了从二维图象序列中估计三维运动的公式,为图象处理和计算机视觉开启了新领域。

由于在运动估计领域的研究黄煦涛被授予HONDA终身成就奖,他还在图像序列处理及数字电视、模式识别和计算机动画方面的应用有开创性和持续性的研究贡献,被授予IEEE Jack S.Kilby奖章及智能机器联合会信息科学奖;另外由于在图像处理、模式识别和计算机视觉领域作出的开创性研究贡献,包括:多维数字滤波器的设计和测试、数字全息摄影、文件和图像的压缩技术,以及人脸、手、躯干3D建模、分析和可视化,多模态人机界面,多媒体数据库等,黄煦涛被全球IT业界誉之为计算机视觉之父。

2001年11月,黄煦涛当选为中国工程院外籍院士。

李飞飞

577dbc761c005

李飞飞是人工智能领域少有的女性学者,尤其在图像识别领域可谓是一个家喻户晓的人物。

让机器看懂世界是人工智能行业长久以来的目标。然而,虽然人看世界好像很简单,我们可以轻易识别什么是猫什么是狗,但对于计算机而言,他们对此却非常困难。不过,好在近年深度学习技术的出现,让计算机视觉技术也有了极大的发展。但深度学习只是一个通用技术,而为了更好更准确地应用于图像识别则需要开发者做更多的算法优化。目前像谷歌、微软、百度这样的科技巨头都有在该领域研究。

然而,如何评价这些巨头算法的优劣?这就需要对这些算法进行“跑分”评测,而这便需要一个巨大的测试数据库。

作为全球计算机视觉领域的知名专家,李飞飞的主要贡献在于参与建立了两个被 AI 研究者广泛使用来教机器分类物体的数据库:Caltech 101 和 ImageNet,而后者,目前已经成为了全球最大的图像识别数据库。

依据 ImageNet 数据库,斯坦福每年都会举办一个视觉识别挑战赛。而参加这个比赛的参与者便是像谷歌、微软、百度这样的科技巨头。就在过去几年中,系统的图像识别功能大大提高,出错率仅为约 5%(比人眼还低)。可以说正是该比赛的存在不仅为我们找到了图像识别领域最好的算法,同时也促进了图像识别的发展。显然,李飞飞对计算机视觉乃至整个人工智能的发展都是最大的功臣之一。

吴恩达

Andrew Ng

吴恩达是斯坦福大学计算机科学系和电子工程系副教授,人工智能实验室主任。吴恩达主要成就在机器学习和人工智能领域,他是人工智能和机器学习领域最权威的学者之一。

2010年,时任斯坦福大学教授的吴恩达加入谷歌开发团队XLab,2011年,吴恩达在谷歌成立了“Google Brain”项目,这个项目利用谷歌的分布式计算框架计算和学习大规模人工神经网络。这个项目重要研究成果是,在16000个CPU核心上利用深度学习算法学习到的10亿参数的神经网络,能够在没有任何先验知识的情况下,仅仅通过观看一周无标注的YouTube的视频自主学习到识别高级别的概念,如猫,这就是著名的“Google Cat”。

同时,吴恩达还是免费大型公开在线课程项目Coursera的联合创始人,Coursera提供在线提供免费的网络公开课程(其中有大量关于人工智能的课程)。Coursera 的首批合作院校包括斯坦福大学、密歇根大学、普林斯顿大学、宾夕法尼亚大学等美国名校。截止2014年底,Coursera注册人数便已经超过了1000万人,其中很多人便来自中国。可以说,正是吴恩达让很多人真正认识到了机器学习。

2014年5月16日,百度宣布吴恩达加入百度,担任百度公司首席科学家,负责百度研究院的领导工作,尤其是Baidu Brain计划。吴恩达加盟百度被认为是中国互联网公司迄今为止引入的最重要外援。

黄广斌

huang

新加坡南洋理工大学(终身)正教授.被汤申路透评为“高被引学者”(工程,计算机科学),新加坡总统科学奖被提名人(2016)。

其最大的贡献便是针对半监督机器学习存在的学习速度缓慢、不确定性递增等问题,提出一种基于极端学习机的半监督学习方法,即Extreme Learning Machines (ELM,超限学习机)。仿真结果表明,其能够显著提高半监督学习的速度并有效减小对标记样本的依赖程度。

在深度学习测试一交通路牌标志识别库上,国防科大研究人员只用一个CNN做特征提取+ELM分类,达到25个DNN组合的最佳准确率(99.4%),训练时间从深度学习GPU上的37+小时缩短到CNN+ELM在PC上的5+,小时(ELM的训练时间是28分钟)。

马毅

mayi

马毅于2006至2011年任伊利诺伊大学厄巴拿香槟分校电子与计算机工程系副教授;于2009至2014年任微软研究院计算机视觉组主任及首席研究员。2014年全职加入上海科技大学信息科学与技术学院。他获得过1999年国际计算机视觉大会David Marr Prize; 2004年美国自然科学基金优秀青年学者奖CAREER Award;2005年美国海军部杰出青年学者奖Young Investigator Award;2011年微软优秀员工金星奖Gold Star Award; IEEE 计算机学会2013年 IEEE Fellow。

马毅的一个重要贡献便是找到了一种进行图像识别的全新方法,在人脸识别等各个领域都有重要应用。

传统上,用计算机进行人脸识别是基于局部区域的特征例如眼睛、鼻子的形状,或者嘴巴宽度等。但是马毅和他的同事证明,一个随机提取的特征点集——一个包含了几百个点的稀疏表示——可以提供足量的信息来确定一幅图像在一个图像集中所对应的对象。这个方法的关键是收集足够的数据,来获得高精确度的识别。

该方法能够实现一些不可思议的事情,比如正确识别戴着墨镜或围巾等有部分遮挡的人脸,或是一些已经损毁的不成样子的照片等。在一个测试中,从一个叫AR的人脸数据库中选出一个包含50名男性和50名女性受试者的集合,这个新算法对男性受试者达到百分之百准确,对女性受试者则有百分之九十五的精确度,而这些受试者当时是戴了墨镜的!

这就是他关于人脸识别的贡献, 利用“稀疏表示(sparse representation)”的分析原理和算法工具,来引领一个能够处理损毁和遮挡的全新的、足够鲁棒的人脸识别方法。并且,所达到的性能不仅远远超过对于计算机视觉的期望,更加超过人类本身的能力所及。

最近两年,人工智能相关创业在国内呈爆发性发展态势,相关专家极多,动点科技将在了解其具体贡献之后再度出文,敬请期待!