AlphaGo 战胜围棋世界冠军李世石之后,国内涌现出了多个人工智能围棋程序的玩家,包括绝艺、神算子、先知围棋以及我们今天的主人公天壤围棋等。

  • 2017年8月,在第一届“中信证券”杯世界智能围棋公开赛上,天壤智能围棋首次参赛即成为一匹黑马,与腾讯的绝艺、日本的 DeepZenGo 和台湾的 CGI 一起杀入了前四强;
  • 2017年12月,在第一届围棋 AI 龙星战中,天壤获得了第三名的好成绩,仅在腾讯绝艺、DeepZenGo之后。

人工智能围棋是否只能用于娱乐?天壤围棋又是凭借什么一跃成为行业黑马?正值 2050 大会临近,动点科技对天壤围棋创始人薛贵荣进行了采访。

王坚挖来的交大副教授

在创立天壤智能之前,薛贵荣曾就职于阿里巴巴,先后任职阿里云计算资深总监、阿里巴巴研究员、阿里妈妈大数据中心负责人、阿里妈妈首席数据科学家等职务,负责研发了阿里搜索引擎(即后来的神马搜索)、DMP 平台、展示营销技术平台等。与此同时,他还是阿里巴巴集团首席技术官王坚博士亲自从上海交大挖来的一员大将。

据了解,在入职阿里巴巴之前,薛贵荣是上海交通大学计算机系副教授,具体的研究方向包括:信息检索算法、Web 挖掘、用户行为分析、迁移学习等。曾在国际会议和国际期刊发表论文70多篇,并获多项美国专利,研究成果被国际同行他引达6000余次。

薛贵荣
薛贵荣

关于王坚的挖人,薛贵荣依然记忆优新。

当时王坚从微软亚洲研究院离职并加盟阿里巴巴不久便找到了时任上海交大副教授的薛贵荣,说要与上海交大合作做研发。薛贵荣被王坚要做一个可以搜索全世界网站的搜索引擎的伟大目标所吸引,于是开始走近阿里并于两年之后正式加盟。

直到 2016 年,在阿里已经工作 7 年半的薛贵荣有了创业想法才从阿里离职。据介绍,当时王坚也为薛贵荣找了很多其它岗位以期留下这位大将,但薛贵荣去意已决,王坚对此也深感惋惜。

决心做最亲民的 AlphaGo

薛贵荣并非围棋爱好者,但却选择了做 AI 围棋程序,究其原因,他表示这也是“缘分”所致,“当时 AlphaGo 和李世石的五番对局刚刚结束,AlphaGo 论文出来,我们就想试一试。”

关于其中的难点,薛贵荣谈及了他们遇到的第一只拦路虎——作为不太了解围棋的团队怎么才能彻底吃透 AlphaGo 的论文,“AlphaGo 论文的每句话都知道意思,但要看懂论文的深层含义,并看懂 AlphaGo 是怎么做到的花了我们很长时间。比如论文提到 AlphaGo 用‘对打’的方式生成了 3000 万盘的数据,那么,AlphaGo 是采用什么具体的方法做到这一点的?系统参数是如何配置的?就这么一段话我们差不多要花一个月半个月的时间来探索。”薛贵荣表示,天壤为了实现与 AlphaGo 类似的功能,光大的系统迭代就有 6 到 7 次,而小的迭代几乎每天都在进行,即便如此,天壤围棋从 2016 年 10 月开始组建团队研发,到去年 8 月首次亮相,也还是花了接近一年的时间。

“而且完全复现 AlphaGo 也不可能。”算法上的创新难度可见一斑。

另外,薛贵荣还介绍道,围棋其实是一个“往后算”的游戏,越顶级的高手往后算的步数就越多,玩家不仅要考虑自己怎么下,还要考虑以对手的水平能力他可能会怎么下,并从中选择几十步之后对自己最有利的位置落子。“因此,很多传统 AI 围棋程序其实都是在比算力,谁在单位时间里算的步骤越多,便越有机会获胜。”

然而,天壤围棋的创新是集中提升模型的预测能力来降低系统对算力的要求,而这也是天壤围棋最大的优势之一。“我们采用深度强化学习的方法,将原来 40 到 50 层深的预测运算降低到了现在的20层左右。虽然腾讯的绝艺在文章开头的两次比赛中都胜过了天壤围棋,但腾讯绝艺起步比我们早一年左右,而且计算资源也比我们高很多倍,做实验的机会也比我们多很多次。”

薛贵荣还通俗地介绍了降低算力要求的原理。“就像我已经知道不管你怎么落子,我赢的可能性都更大,那么,我就没必要算那么多了。”

除了娱乐,AI 围棋程序还能如何商业化

2017年5月27日,尽管柯洁几乎将 AlphaGo 逼到了极限,但后者仍以 3:0 的成绩获胜。赛后,AlphaGo 之父哈萨比斯宣布 AlphaGo 退役。而此时的 AlphaGo 也只是跟人类高手下了 68 盘棋,绝大部分围棋爱好者都没有尝试过与 AI 围棋对局的那种体验。

“在现实中,作为一个围棋初学者,你想跟职业九段的人请教几乎是一件不可能的事。首先,职业九段没有那么多;其次,他们也没有那么多时间跟你下;更关键的是,他们也不愿意跟你下,因此我们建立了一个围棋网站,任何人都可以在上面找到与自己水平相当甚至九段的 AI 程序进行对弈。”薛贵荣表示,天壤智能希望通过长时间的对弈训练,帮助人类提升围棋水平。而这,也是天壤围棋亲民的体现。

然而,AlphaGo 的成功也同样令人思考,打败了人类的 AI 围棋应用除了接着与人下围棋之外,还有什么用?

“天壤智能目前在将 AI 围棋的原理与技术扩展运用到其他领域中。”薛贵荣说到,他为此还专门介绍了天壤智能的另一个项目——天钻系统。天钻系统可通过动态的智能化决策来实现电商的运营自动化、营销自动化和分析自动化。

薛贵荣还告诉动点科技,天钻系统在本质上与下围棋其实是一样的,都可以定义为动态环境下的大空间决策优化问题。广告位、投放人群、投放时间、投放定价与广告创意等元素的组合跟围棋的棋局一样,都具有海量的组合,而且一旦做出选择,上一刻最好的答案在这一刻可能就不是最好的答案了。因此,天壤围棋的方案同样有助于商业营销问题的解决。据介绍,天钻系统能够帮助服务的电商带来 80% 的 ROI 提升。

另外,薛贵荣表示,他们也正在尝试将同样的技术用于城市大脑交通信号灯的控制,做到不仅保证单个路口的畅通,更能保证整个城市交通的顺畅。薛贵荣表示,天壤智能还将在商业、零售、交通、教育、金融等几个行业推动该项人工智能技术的落地。

AlphaGo 离强人工智能其实还很远

在 IBM 制造的深蓝计算机以穷举法战胜国际象棋大师之后,围棋因为暂时无法被穷举出所有玩法的特点而被称之为人类最后的智慧堡垒。然而,AlphaGo 却轻易攻克了这个堡垒。“以前大家都说 AI 解决围棋的事至少是十年后,第一次听说 AlphaGo 要跟李世石下的时候,我们并不认为 AlphaGo 能赢,但它却赢了。”薛贵荣表示,AlphaGo 对人工智能算法影响非常大。

不过,他还认为 AlphaGo 离自带情感、能够处理各种各样情景问题的强人工智能还有很长的距离。

所以,人类暂时不用担心被机器取代。


与其担心被机器取代,不如来2050围观天壤围棋千人人机大战,甚至亲身参与其中,体验一把与九段围棋高手酣畅淋漓的巅峰对决!在即将到来的2050这个科技盛宴中,薛贵荣将会从AI 围棋切入,形象化深入解读人工智能在搜索、推荐、营销、派单和路径规划等实际问题中的应用。来2050吧!和全世界年青人一起,相遇新知,迸发改变世界的新生力量!亦或许,你也有超前设计的想法和创新,这里有超过 10,000 平米的展示空间,超过 100 个展位,等待你的登舱!

题图来自123RF