据外媒援引AI Singapore(AISG)发布的信息,新加坡国家人工智能计划最新版本的“Sea-Lion”大语言模型已停止采用Meta模型体系,改为基于阿里云的通义千问Qwen架构构建。最新版本Qwen-Sea-Lion-v4由阿里云提供技术支持,并依托Qwen3-32B基础模型完成训练。

在基础信息方面,Qwen3覆盖119种语言与方言,总训练数据量达36万亿词元,是通义千问系列的最新一代。阿里云指出,Qwen3-32B在本次合作中额外接受超过1000亿个东南亚语言词元训练,以增强区域语言理解能力,同时也为模型的“高级后训练阶段”提供技术支撑。AISG贡献了开源区域性数据集,并承担本地语言任务的数据整理与评估。

根据公开评估结果,Qwen-Sea-Lion-v4目前在参数规模低于2000亿的开源模型中排名“东南亚语言模型综合评估排行榜”(South-east Asian Holistic Evaluation of Language Models)首位。该模型已在AI Singapore官网及Hugging Face平台提供下载。

资料提到,新加坡于2023年12月启动总额7000万新元(约合3.81亿元人民币)的国家级多模态大模型计划,由新加坡国家研究基金会(NRF)提供资金并获资讯通信媒体发展局(IMDA)支持。