忽如一夜春风来,千树万树梨花开。随着AI产业的迅速发展,越来越多的企业都投身到了AI淘金这股浪潮中,而其中最为耀眼的便是AI芯片。

2016年5月,谷歌发布自主设计芯片TPU(张量处理器),同年英特尔也发布Nervana AI处理器,去年,Deep Mind投资的Graphcore公司也推出了IPU智能处理器;而就在国外企业纷纷研发AI芯片的同时,国内企业也同样没有闲着:在寒武纪推出神经网络处理器NPU(今年其又被重命名为机器学习处理器MLU)之际,深鉴科技则做了一款基于FPGA平台的DPU(深度学习处理器),就连地平线也推出了嵌入式大脑处理器(BPU)……

为什么会突然出现这么多CPU、GPU的兄弟?

众所周知,目前业内最为人所知、应用范围最广的芯片是CPU和GPU。

其中,CPU出现的历史最长,在电子设备中的作用也最为重要,但由于其仅用于串行计算,所以在需要海量计算的AI场景下,其数据处理能力已显然不够,而且雪上加霜的是,处理器的性能每18个月就能翻倍的摩尔定律也已几近失效,想要依靠摩尔定律提升CPU的性能已经不太现实。

而就在此时,因为具有并行计算能力而拥有更强运算力的GPU开始被人们重视,并被广泛用于人工智能领域。从此,人工智能有了GPU在算力方面的支持,人工智能也迅速进入应用阶段。甚至有人表示,没有GPU,就没有这一波AI浪潮。

而GPU领域的绝对霸主英伟达也因此扶摇直上,成为了当今人工智能领域最为成功的企业:2015年,英伟达的市值是100亿美元,而目前其股价已暴涨至1300亿美元。

然而,GPU虽然帮助人工智能走过了蹒跚学步的初级阶段,但人工智能接下来的要走的路却不一定适合由GPU来走了。

  • 首先在云端,数据中心最大的成本支出一般都是电力成本,因此,能耗压力是迫使GPU让位的重要原因。比如,根据谷歌去年4月曝光的数据,当时,TPU 已经在谷歌数据中心内部使用大约两年,并依靠TPU打败了李世石。( 根据谷歌的一份论文显示TPU 平均比Nvidia K80 GPU或 Haswell CPU 快15~30倍,性能功耗比高出约 30~80 倍,不过英伟达对此反驳,认为谷歌是在拿TPU和旧的GPU进行比较,因此不客观。不过必须了解到的是,一般而言芯片功耗越高性能越强,因此,拿功耗高出很多的GPU与相对低功耗的TPU相比较,其实也不公平)。
  • 其次便是在终端,随着用户越来越关心个人隐私安全与时效性,此前以云端为基础的人工智能正逐渐部分或完全被终端智能所取代。而终端智能则要求芯片同时具备高性能与低功耗的特征。

虽然GPU在处理很多人工智能问题时已经很高效了,而且GPU作为通用芯片可以适应各种不同的应用场景,但GPU在运行不同场景中的程序时,芯片的整体性能其实是很难完全发挥出来。其实也可以说,没有任何单一的 AI 系统能够在任何场景完美地工作。因此,AI 在不同场景中的应用,都需要针对场景的需求,在功耗、延迟、数据吞吐量、加速器方案的选择上做出调整和优化,使其能够完美运行适应特定应用场景的算法——于是,各种CPU、GPU的兄弟便诞生了。

另外,地平线算法VP黄畅还表示即使是在同一细分应用场景下,只要深入行业,就会发现算法依然会有所不同。而这便意味着市场需要更多种类的AI芯片。

总的来说,AI芯片在此时出现是顺应时代发展趋势的。

技术与落地,决定AI芯片生死的关键

虽然目前市面上各种X-PU都因赶上了AI风口而欣喜不已,然而,今天拥挤在身边的是“兄弟”,在明天就可能是敌人了,想想CPU、GPU目前的寡头天下不就是活生生的例子吗?X-PU们真都能笑到最后吗?这也是很多入局者都关心的一个问题。

OnceAI创始人张春亮坚信AI芯片行业不太可能出现一两家企业统治全部AI芯片的情况。“比如现在的通信市场,有追求高性能高速率的5G标准,但其也必然再来高功耗(的问题)。所以小数据量传输但低功耗的窄带需求量也越来越大。而且还有像wifi、蓝牙、红外之类的不同场景间的传输协议。”张春亮在知乎上回应认为市场非常大,而且市场需求也不可能统一,因此,“AI芯片以后很有可能深化出像PIC/AVR这样的低功耗低计算力的芯片,还有像Intel/amd这样的高计算能力高功耗的芯片,或者像arm适用于移动场景的芯片。”

“AI和任何一个新兴的技术都一样,引起市场广泛关注的时候都会有很多大佬以及创业公司进入到这个市场,然后开始做芯片。我其实觉得这是一件有趣的事情,因为只有这么多的公司从不同的角度去看待技术,去研发他们的技术,才能给市场带来真正的变革,然后才能把这些技术真正的落地。”英特尔新技术业务Movidius产品业务拓展负责人 Gordon虽然很认可当前AI芯片的大量崛起,但这并不意味着现在所有但AI芯片企业都能活到最后,AI芯片行业跟其他行业一样,也都将有一个优胜劣汰的过程:

  • 首先,做AI芯片的技术难度不小。“怎么把合理的架构和应用场景结合起来,把芯片的性能、功耗和使用场景结合起来,做出一个非常好的产品,这实际上对每个企业都是巨大的挑战。” 为了说明这一点,Gordon还透露了一个他的经验:很多企业可能买了很多IP,以为把它组在一起就能达到好的性能,但实际上这些产品并不一定能有市场。
  • 其次,也是最关键的,那就是市场化与产品落地。Gordon就强调落地是一个“非常重要”的事情。Gordon认为做芯片在技术上虽然有难度,但只要找到合适的人,其实也会有很多人都能做,但创业的本质并不是要做出一款技术上的好产品,而是要解决行业特定问题,从而赚钱养活自己。“而这里的问题就是你对产品的开发到底有多深的理解,一个是架构,一个是平衡,如何在性能、功耗、延迟等方面做好取舍,再一个就是对市场的理解,决定做那个行业等。”

而该观点也得到了黄畅的认同,“只是做芯片是远远不够的,关键还是应用的落地,所以地平线是把算法和芯片结合在一起迭代优化,针对应用场景全程推动落地。”黄畅如此表示。

给国内AI芯片创业公司的建议

Gordon表示,英特尔其实是众多AI芯片创业公司的巨大竞争对手,“我们虽然进来的晚,但我们在芯片领域有着多年的研究,慢只是慢在软件以及与场景的结合上。”Gordon认为英特尔一个重要优势便是与行业有着非常紧密的结合,因此,Gordon认为英特尔想要后来者居上其实也并非不可能。

不过,面对巨头,中小AI芯片创业公司也并非没有成功的可能性。目前,市面上有一个观点就是像英特尔这样的大企业因为精力有限,无法覆盖所有的细分场景,因此,小企业便有了得以生存的夹缝。

而该观点也得到了Gordon的证实:虽然英特尔非常看重垂直,但英特尔也会评估哪个垂直可能会先起来,或者有更大的市场,从而排优先级。“比如对某些行业,我们就必须要满足其需求,而对另一些行业,我们则只是尽量满足其需求,对第三种行业,那可能就是爱用不用了。”Gordon认为对于像英特尔这么的大企业“必须学会取舍”。

另外,Gordon也为国内的AI芯片企业提了一些具体的建议:

  • 首先,要找对人,找对场景非常了解人,并可以跟产业结合,那就有机会成功。而如果只是纯做技术,不跟产业、应用结合,那就走不了多远。
  • 其次,选择行业是不要一窝蜂地盲干。“国内做AI的企业都集中在非常窄的几个领域,比如所有人都恨不得要去做安防的,但在海外,我们就看不见这种情况,海外企业会非常专注于自己擅长的行业,而这也是很容易做成绩的方法。”

另外,ARM的崛起也能给予大家一定的参考。

ARM公司1978年在英国成立,1985年,设计了第一代32位、6MHz的处理器,它支持的指令比较简单,虽然功能远不如英特尔处理器强大,但是功耗小、价格便宜。不过,当时处理器行业的霸主是英特尔,占据着PC处理器市场绝大多数的市场份额。ARM处理器能力不足,根本无法撼动英特尔在PC处理器的市场份额。

因此,ARM找到了嵌入式设备市场,但是整个20世纪90年代,ARM公司的业绩平平,处理器的出货量徘徊不前。但在而在2007年之后,随着智能手机时代的到来,ARM处理器迎来了快速增长,有资料显示目前全世界95%的智能手机和80%的相机都用到了ARM的技术。目前ARM也已经成了嵌入式芯片领域的实际标准。ARM也因此成为了一家能够与英特尔抗衡的企业。

显然,ARM的成功经验就是找准方向,然后就是咬定青山不放松地等风来,这对AI芯片企业而言,显然也是一个好建议。

题图来自123RF