云服务和平台一直是是微软在人工智能领域的核心竞争力,然而在算力层面,微软已经被英伟达扼住咽喉,导致相关业务成本居高不下;而谷歌在深度学习、自然语言处理和机器视觉技术方面的优势以及强大的数据处理能力和多种机器学习工具的支持等方面,相较于微软仍具有一定的优势。

在对手面前,微软不甘于落入下风。据 The Information 报道,一位知情人士透露,微软计划在下个月的年度开发者大会上推出该公司首款为人工智能设计的芯片。微软的这款芯片是为训练和运行大型语言模型(LLM)的数据中心服务器设计的。

微软的数据中心服务器目前使用英伟达的 GPU 为云客户提供先进的 LLM,包括 OpenAI 和 Intuit,以及支持微软生产力应用程序中的人工智能功能。此举若成功实践,可以降低成本并减少对英伟达的依赖。

微软掌握软件业务先机,但芯片仍需补足

2019年,微软向OpenAI投资了10亿美元,并为其旗下产品的模型训练提供了全方位的云服务支持。如今,经过4年的投入,微软的押注终于看到了成效。一直缺乏通用落地场景人工智能技术,由ChatGPT引爆并在全球科技圈掀起了巨浪。

随后,微软迅速推进OpenAI的工具商业化,计划将包括 ChatGPT、DALL-E 等人工智能工具整合进微软旗下的所有产品中,并将其作为平台供其他企业使用。这些产品包括且不限于Bing搜索引擎、包含Word、PPT、Excel的Office全家桶、Azure云服务、Teams等。

9月26日,微软此前预告的全新AI助手“Microsoft Copilot” 随着新版本的Windows 11 推出,成为个人与组织在 Windows 11、Microsoft 365、Edge与 Bing 搜索引擎中全新的AI助手。

这是微软基于OpenAI大语言模型的人工智能补充工具——这一重要工具旨在帮助企业用户更好地组织所有数据并与之进行交互操作,这代表着微软正在向生成式AI实现“货币化”全面进军。

摩根士丹利7月就有分析师表示,几条初步趋势线表明,微软在企业软件领域的地位最强,可以从生成式人工智能中获益。他们还预计,按最低渗透率计,到2025财年(人工智能)可为公司带来高达900亿美元的增量机会。

除了软件,早在今年 4 月,就有消息称微软正在研发一款 AI 服务器芯片,代号为“雅典娜 (Athena)”。该芯片的研发其实从 2019 年左右就开始了。据The Information 报道,在开发 Athena 的同时,微软从英伟达订购了至少数十万张 GPU 来支持 OpenAI 的算力需求。微软希望 Athena 能够与英伟达的 H100 相媲美。

谷歌AI底蕴深厚,不甘落于下风

美国当地时间 8 月 29 日,谷歌云举办 Google Cloud Next ’23 年度大会,推出了全新的 TPU 产品 ——Cloud TPU v5e,它是 AI 优化的基础设施产品组合,并将成为迄今为止最具成本效益、多功能且可扩展的云 TPU。

在活动上,谷歌还宣布将 Meta 和 Anthropic 等公司的 AI 工具(如 Llama 2 和 Claude 2)添加到其云平台上, 在云产品中集成强大的生成式 AI 能力。目前包括 Llama 2 和 Claude 2 在内,谷歌云客户可以使用 100 多个强大的 AI 模型和工具。

谷歌曾表示,目前公司90%以上的AI训练工作都是通过谷歌自主研制的TPU芯片完成的。其AI训练的过程是:通过给模型输入数据,使其能够用类似人类的文本回应、并具备生成图像等功能。

上个月,据报道,知情人士称,谷歌计划最早于 2027 年放弃博通公司(Broadcom),转而自主研发 AI 服务器芯片。该知情人士称,今年早些时候,谷歌与博通在芯片定价问题上未能谈拢。为此,谷歌决定放弃博通作为其 AI 芯片 tensor processing units(TPU)的供应商。

对此,谷歌高管已经进行了广泛地讨论。这意味着,谷歌将自主设计其 TPU 芯片。据预计,此举可帮助谷歌每年节省数十亿美元的成本。当前,谷歌正大举投资于人工智能的研发。与其他类型的研发相比,人工智能的研发尤其昂贵。

英伟达供应压力使大厂有可趁之机

今年8月,百度、字节跳动、腾讯和阿里巴巴向英伟达共订购了价值50亿美元的芯片。但业内人士表示,仅有10亿美元的A800 GPU处理器,能在年内交付。

AI的爆发,使得算力市场对A100 和 H100 等高端 GPU渴求,供不应求成为常态,这给英伟达和其制造商台积电带来巨大生产压力。今年第一季度的财报会上,英伟达创始人黄仁勋就表示,订单多到不可思议,公司核心目标就是生产更可能多的先进芯片。

然而由于英伟达在算力市场上一枝独秀,芯片紧俏导致价格上涨幅度太大,H100 GPU现价约为 29 万元人民币,差不多涨了一倍。据路透社报道,2022年OpenAI营收2800万美元,亏损为5.4亿美元(约合人民币37亿元)。亏损的主要算因就是算力开销。

知名研究公司Forrester Research的高级云计算分析师Tracy Woo表示,人工智能的繁荣正在给云计算供应商带来更大压力,迫使他们开发自己的芯片:你可以从英伟达购买,但当你看到谷歌和亚马逊这些巨无霸时,会发现他们有资本设计自己的芯片。

结语

算力的稀缺和英伟达芯片高昂的价格已成为制约 AI 发展不容忽视的因素。AMD预计,2027年全球数据中心 AI 计算市场规模将超过1500亿美元。目前,英伟达占据全球数据中心AI加速市场82%的份额,而且以95%的市场占有率垄断了全球Al训练领域的市场。

面对这样一个万亿级规模的市场,无论是微软谷歌等大厂、半导体企业,还是依赖算力哺育的中小AI公司,都不想看到英伟达一家独大。