在ChatGPT爆火一个季度后,国内AI大模型开始集中爆发。从技术的角度来看,大模型发端于自然语言处理领域,以谷歌的BERT、OpenAI的GPT为代表,参数规模逐步提升至万亿,同时用于训练的数据量级也显著提升,带来了模型能力的提高。

而目前国内大模型普遍在B端起步,企业开始思索如何将已有的大模型规模“做小”,以更小的参数,做更有效率、更适合垂类的场景。未来,具备技术与产业的双重优势的大模型,将作为基础的平台支撑无数智能应用。

百花齐放的大模型

在月前百度发布了文心一言大模型,之后国内众多企业陆续跟进,并依据各家特色和产业规划推出了各自的大模型。

4月8日,在人工智能大模型技术高峰论坛上,华为云人工智能领域首席科学家田奇介绍了盘古大模型的进展及其应用状况,包括NLP大模型、CV大模型、多模态大模型与科学计算大模型。盘古大模型将重点发展细分场景的落地应用,为煤矿、水泥、电力、金融、农业等行业赋能。

4月10日,商汤科技在上海的技术交流日上不仅展示了“日日新SenseNova”大模型体系下的语言大模型,还展示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,并公布了商汤依托AI大装置SenseCore实现“大模型+大算力”融合创新的研发体系。

当日,昆仑万维宣布,其和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型“天工”3.5 发布在即,“天工”作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景。

4月11日的阿里云峰会上,阿里云智能首席技术官周靖人正式宣布推出大语言模型“通义千问”。据他所说,通义千问是一个超大规模的语言模型,具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇在峰会上表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造。

据阿里云智能CTO周靖人介绍,未来每一个企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。

AI的新拐点

2022年12月以来,OpenAI 所提供的 GPT 接口,让外界看到MaaS(Model-as-a-service,模型即服务)在商业模式上的可能性,大语言模型可以作为一项服务来被调用。从模型最初的研发、数据的清洗,到模型的训练、测试,以及模型整体能够进入到一个统一的模型标准网站,能够让用户快速查找模型、使用模型,降低模型使用门槛。

北京智源人工智能研究院理事长张宏江在月前的演讲中表示,“技术瓶颈和商业化难题构筑AI行业起伏周期,商业化受阻成为AI“第三次浪潮”难点;而大模型成为新拐点,大模型的能力基础设施化趋势渐显,相信未来几年将带动众多技术与产品突破。”

他认为从“大炼模型”到“炼大模型”是一个范式的转变。未来的APP的开发将是在大模型的基础上“大模型+微调”的流水线运作方式,向产业提供源源不断的智力源。相比以前既做APP,又炼小模型的方式,释放掉重复造小模型的人力等资源浪费,极大降低开发成本,使边际成本趋零,带来百倍甚至千倍的生产力提升。

微软云2022年就形成了三条轮动增长的曲线,其中智能云增速超20%,企业软件增速超40%,AI大模型增速超100%。企业客户通过微软的公有云Azure租赁GPU算力,调用大模型,再输入数据训练自己的小模型去改造业务。

《2022中国大模型发展白皮书》也建议,对于行业用户,第一,各行业技术买家都应该尽早拥抱大模型;第二,在合作方面,主要关注大模型与自身业务的适配性;第三,应与头部厂商联手打造行业标杆。

国内大模型尚需沉淀

大模型经过几年的发展,在研发技术上已经较为成熟,但在全球范围内,大模型的落地都还处于早期阶段。国内大厂所研发的大模型固然有内部业务的落地场景,但整体上尚未形成成熟的商业化模式。

阿里张勇指出,大模型是一场“AI+云计算”的全方位竞争,超万亿参数的大模型研发,并不仅仅是算法问题,而是囊括了底层庞大算力、网络、大数据、机器学习等诸多领域的复杂系统性工程,需要有超大规模AI基础设施的支撑。

近日,昆仑万维在回复监管部门关注函时表示,数据规模和质量是人工智能能力的一个重要参数。研发过程中需要获取足够数据用户模型训练,并且进行模型更新迭代,具有一定的不确定性,若技术研发进展不及预期,可能导致产业化进程缓慢。

在应用实践商业化不及预期方面,该公司表示,如果产品不能有效与应用实践相结合,将对其进展产生影响。后续能否顺利实现商业化存在较大的不确定性。

回复提及,生成式人工智能(AIGC)、人工智能是产业的热点,未来商业价值显著,众多科技巨头公司在此领域布局,未来行业竞争可能会进一步加剧。同时预计随着国内产品上线,相关网络安全、数据安全等政策将延伸适用到人工智能算法领域,将对该类产品研发增加一定政策风险。

总结

大模型在内容创意生成、对话、语言或风格互译、搜索等方面的能力,将为各应用领域带来百花齐放的助力。而大模型基础平台,在数据层、模型层、中间层、应用层,都蕴藏着巨大发展机遇。

然而,在大模型创业的热潮下,一些容易被忽视的问题也浮现出来了。无论是大厂还是初创企业,在这个过程中都需要更加重视数据准备、算力支持、人才储备和风险管控等问题,才能在商业化上取得更好的成果。