5月30日,华为宣布推出参数规模高达7180亿的全新模型盘古Ultra MoE,这是一个全流程在昇腾AI计算平台上训练的准万亿MoE模型。据悉,盘古团队提出Depth-Scaled Sandwich-Norm(DSSN)稳定架构和TinyInit小初始化的方法,在昇腾平台上实现了超过18TB数据的长期稳定训练。在训练方法上,华为团队首次披露在昇腾CloudMatrix 384超节点上打通大稀疏比MoE强化学习(RL)后训练框架的关键技术,使RL后训练进入超节点集群时代。 你可能会喜欢 别再妖魔化游戏了!最新研究:它正偷偷治愈无数孤独成年人2026/06/23 10:49 Steam Machine 售价公布,性能不如 PS5 还更贵2026/06/23 10:08 GCash母公司推进菲律宾IPO,新加坡修订单一家族办公室框架|SEA Now2026/06/22 16:36 索尼谈未来游戏开发:让 AI 负责打杂,设计师才能专心搞创意2026/06/22 10:44