编者按:本文来自于微信公众号 “量子位”(微信公众号:QbitAI), 动点科技经授权发布。

不鸣则已,一鸣 “很吓人”!

刚刚,华为 AI 战略完整披露。

2018 华为全连接大会上,华为轮值董事长徐直军一口气高密度发布:华为 AI 战略、华为 AI 全栈全场景解决方案、华为自研统一达芬奇架构的 2 款 AI 芯片……

去年因 AI 改掉集团使命愿景的华为,现在,全面打响进军 AI 的战斗!

首次公布 AI 战略

今天之后,再有人说华为没有 AI,可能徐直军就要不高兴了。为了 AI,华为连集团的愿景都变了。

去年年底,华为确定的新愿景和使命:万物互联的智能世界,为了智突出智能,还将这次大会的主题定为 “+智能,见未来”。

大会的前 20 分钟,徐直军就讲了一个道理:AI 太重要了。

作为一种通用技术,人工智能对未来的影响和价值不容小觑,也是构筑未来竞争力的关键,徐直军说。“AI 人才与需求之间,连 1% 都满足不了。” 徐直军说,非凡和冷静之间,是巨大的落差。

在现场,徐直军首次公布了华为的 AI 战略:

  • 投资基础研究:实现安全可信、自动自制的机器学习基础能力
  • 打造全栈方案:打造面向云、边缘和端等全场景、独立及协同的全栈解决方案、提供充裕的、经济的算力资源,简单易用,高效率,全流程的 AI 平台
  • 投资开放生态和人才培养,面向全球伙伴合作,打造开放生态,培养人才
  • 解决方案增强:把 AI 思维和技术引入现有产品和服务
  • 内部效率提升:利用 AI 优化整个内部管理

全栈全场景 AI 解决方案

接下来,徐直军发布了华为全栈全场景 AI 解决方案,这一方案将数据获取、训练、部署等各个环节囊括在自己的框架之内,主要目的是提升效率,让 AI 应用开发更加容易和便捷。

全场景包括:消费终端 (Consumer Device)、公有云 (Public Cloud) 、私有云 (Private Cloud)、边缘计算 (Edge Computing)、IoT 行业终端 (Industrial IoT Device) 这 5 大类场景。

重点在于全栈,包含四个部分:

一是 Ascend (昇腾) ,AI IP 和芯片,皆是基于达芬奇架构。芯片分为 5 个系列,Max、Lite、Mini、Tiny、Nano。

二是 CANN,全称为 Compute Architecture for Neural Networks (为神经网络定制的计算架构) ,是高度自动化的算子开发工具。

根据官方数据,CANN 可以 3 倍提升开发效率。除了效率之外,也兼顾算子性能,以适应学术和行业应用的迅猛发展。

三是 MindSpore 架构,友好地将训练和推理统一起来,集成了各类主流框架 (独立的和协同的) :

包括 TensorFlow、PyTorch、PaddlePaddle、Keras、ONNX、Caffe、Caffe 2、MXNet 等等。

这一架构全面适应了端、边、云场景。

四是 ModelArts,这是一个机器学习 PaaS (平台即服务) ,提供全流程服务、分层分级 API,以及预集成方案。用于满足不同开发者的不同需求,促进 AI 的应用。

此前,华为曾经发布了面向政府、企业的华为云 EI,以及面向智能终端的 HiAI 这两套解决方案。而今天发布的全栈全场景 AI 解决方案,将为两者提供更加完善的支持。

昇腾 910:计算密度最大的单芯片

在 “达芬奇计划” 中预热已久的华为自研云端芯片,现在终于暴露在聚光灯之下了。

徐直军说:“外界一直在传华为在研发 AI 芯片,今天我要告诉大家:这是事实!”

这款属于 Max 系列的昇腾 910,被徐直军称为是 “计算密度最大的单芯片”,采用 7nm 工艺制程,最大功耗为 350W。

昇腾 910 具体的性能数据很强,半精度为(FP 16):256 Tera FLOPS,整数精度(INT 8):512 Tera FLOPS,128 通道 全高清 视频解码器- H.264/265。

芯片的性能怎么样?华为和友商对比了一下。这场 battle 的参赛选手包括谷歌 TPU v2、谷歌 TPU v3、英伟达 V100 和华为的昇腾 910。

“可以达到 256 个 T,比英伟达 V100 还要高出 1 倍!”

若是集齐 1024 个昇腾 910,会发生什么场景呢?徐直军表示,会出现 “迄今为止全球最大的 AI 计算集群,性能达到 256 个 P,不管多么复杂的模型都能轻松训练。”

这个大规模分布式训练系统,名为 “Ascend Cluster”。

不过,说了这么多,昇腾 910 庐山真面目到底长什么样?徐直军表示 910 的面市时间是明年的第二季度,在华为云上推出。所以要想一览花容,还得明年见了。

不知道英伟达听了慌不慌。

昇腾 310:高效计算低功耗 AI SoC

以为部署在服务器端的 910 就是华为大招的全部?Naive,徐直军这次带来的,还有一张部署在边缘设备的芯片。

“这是一款极致高效计算低功耗的 AI SoC。” 徐直军这样说,从西服里掏出来一个芯片。

边缘端的昇腾系列成员不少,按照功耗由小到大排列,这四款芯片型号分别为 Nano、Tiny、Lite 和 Mini。一口气找来四个英文中描述 “小” 和 “轻” 的单词来命名昇腾系列,华为在取名上还是下了不少心思。

其中,Nano、Tiny、Lite 三款型号今天都……没有到场,徐直军表示它们 2019 年才能出来亮相。唯一来到现场的 Mini 仍然采用了达芬奇架构,半精度为 8 TeraFLOPS,整数精度为 16TeraFLOPS,拥有 16 通道全高清视频解码器,最大功耗为 8W。

相比昇腾 910,边缘系列的昇腾芯片用武之地要亲民得多,智能手机、智能附件、智能手表等边缘设备,都是边缘系列的昇腾芯片的容身之所。后续,华为还将推出一系列 AI 产品。

OMT:华为朋友圈

之前,早有传闻称微软将采用华为最新推出的 AI 芯片。今天,微软全球资深副总裁、微软亚太研发集团主席洪小文现身大会现场~