蚂蚁集团提出进一步降低成本的大模型训练方法，未来或将开源分享

近日，蚂蚁集团Ling团队发表了一篇技术成果论文。该技术论文最大的突破在于提出了一系列创新方法，以提升资源受限环境下AI开发的效率与可及性。实验表明，其3000亿参数的MoE（混合专家）大模型可在使用国产GPU的低性能设备上完成高效训练，性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。

3月24日，蚂蚁针对外媒对蚂蚁百灵大模型训练成本的报道回应称，蚂蚁针对不同芯片持续调优，以降低AI应用成本，目前取得了一定的进展，也会逐步通过开源分享。