5月30日,华为宣布推出参数规模高达7180亿的全新模型盘古Ultra MoE,这是一个全流程在昇腾AI计算平台上训练的准万亿MoE模型。据悉,盘古团队提出Depth-Scaled Sandwich-Norm(DSSN)稳定架构和TinyInit小初始化的方法,在昇腾平台上实现了超过18TB数据的长期稳定训练。在训练方法上,华为团队首次披露在昇腾CloudMatrix 384超节点上打通大稀疏比MoE强化学习(RL)后训练框架的关键技术,使RL后训练进入超节点集群时代。 你可能会喜欢 XBOX 的咸鱼翻身,难道要靠发布会上不提索尼?2026/06/03 16:39 亚马逊高管:AI 已越过恐怖谷,普通观众难分辨2026/06/03 10:51 最便宜的苹果电脑爆了,MacBook Neo 三周卖出 110 万台2026/06/03 10:43 莫言硬核发声:AI 无法取代作家,它是靠偷师人类长大的2026/06/02 11:15