本文作者:张炯

星图比特(StarBitech)创始人、中国通信工业协会信息化科技创新委员会委员、上海技术交易所专家库专家、《一本书读懂Web3.0》《一本书读懂NFT》联合作者。

人工智能聊天软件ChatGPT已成为中国科技和商业界的热门话题,国内各科技大厂也争相证明他们有类似的人工智能能力或正在开发类似的服务。动点科技英文版近日采访了星图比特CEO张炯。该公司是一家总部位于上海的数字内容资产创业公司,公司已得到了微软加速器的赞助。张炯解释了为什么中国科技巨头正在争相推出自研的ChatGPT类的服务。以下是采访内容:

1.中国科技公司为什么要开发自研的类似ChatGPT一样的AI聊天机器人?比如百度已经宣布会在三月份上线类似的产品文心一言。

三个方面,第一是市场端,目前ChatGPT对国内用户是不开放的,国内的用户没法像海外用户一样随心所欲的使用,而从市场层面必然会有一个中国的ChatGPT出现。第二是技术端,目前市场上可见的大模型(LLM)例如ChatGPT的基础模型GPT-3.5基本都是英语为母语训练的,中文基准的自然语言处理(NLP)的效果还是稍逊于英语基准的,所以有个中文基准的模型出现会进一步提升用户效果。第三是数据安全,AI的内容生成本身是基于大量数据训练的结果,并OpenAI已经逐步从一个公益性的项目向市场化转变,未来出于利益等因素可能存在不确定性,还有就是中国大陆要求所有的数据都是本地化保存,这点OpenAI在国内又没有团队,数据的本地化保存和维护就很难达到监管要求。

2.中国的自研的AI聊天机器人能和国内外的竞争吗?为什么?

短期来看还是很难,OpenAI在2019年获得微软的投资后,就进入大规模GPU集群训练的阶段,据说OpenAI自有的英伟达A100就有大几千块,微软的10亿美金投资更是几乎都是Azure的云资源,而就在前不久微软又开始和OpenAI进行下一轮的融资和合作,也就意味着3年可能就烧了10亿美金的云资源用作训练,这种体量的投资在国内的互联网圈内是非常少见的,特别是底层技术,国内大的投资更多发生在应用端。但长期来看,中国有更优秀的算法工程师、统一的大市场、丰富的应用场景和数据源,阿里云、腾讯云相比起微软Azure也更是有成本优势,所以中国的自研的AI聊天机器人在如此多的优良条件下成长,未来也必然更加强大。

3.在大数据和模型方面,您认为国内准备好了吗?

大数据方面中国走的是很远的,国内的各类场景信息化程度都很高,数据源丰富,并且相关的产业链也完整。但模型方面就略显不足,目前像ChatGPT的基础GPT-3.5这样的都是大模型,大模型前期投资大、见效慢,在以前对国内的投资者来说就不是优选的标的,所以也就少数的大型互联网公司会参与,但投资也是有限的,进展缓慢。不过这也是机会,我相信ChatGPT这一波对国内的产业投资者也好,互联网公司也好都是警示,之后应该会迎来更大的投入。

4.您预计中国的自研的AI聊天机器人在应用和法规上会有什么不同?请举例说明。

目前中国大规模应用的聊天机器人与NLP的子任务相关,如机器翻译、智能客服、问答系统等。随着LLM的发展,中国也将普及基于LLM的AI聊天机器人。中国自研的聊天机器人在应用上至少需要满足以下要求;首先在交互层面机器人需要适配中文习惯的表达方式,也就是说要理解人类表达的命令。另外,在沟通阶段,为了达到无障碍沟通,机器人需要具有中国文化和历史等相关的知识,并且使用符合中国语言风格和表达方式进行交流,比如同一个词语在不同语境下表达不同的意思和情感。再者,聊天机器人需要根据中国的用户需求和社会现状提供个性化的服务,比如中国特有的支付方式、民族习俗等。

中国自研的聊天机器人需要满足中国的法律法规;首先是数据安全法(《中华人民共和国数据安全法》),主要保护个人信息的安全,防止信息泄漏和滥用;第二是网络安全法(《中华人民共和国网络安全法》),核心是保护网络安全,防止网络攻击和诈骗行为等;第三是个人隐私保护法(《中华人民共和国个人信息保护法》),防止个人信息的非法获取、利用和传播;再者是信息服务管理办法(《互联网信息服务管理办法》),规范互联网信息服务活动,促进服务健康有序发展。随着聊天机器人的普及和中国法律和政策的不断完善,相信未来针对聊天机器人会有更全面和更有针对性的法律法规。

5.您的团队使用过GPT吗?您觉得这个工具有什么挑战和局限性吗?

1)模型是基于大量的文本数据进行训练的,如果这些数据中存在偏见,那么模型也会表现出来,如模型中的中文语料较少,尤其是对中国历史、文化和社会了解甚少,导致模型会出现偏差信息的输出。

2)模型的全局理解能力不足,虽然GPT可以做一些上下文的连贯性,但是对于全局信息的理解尚且不足。

3)缺乏语言多样性,GPT的训练大部分是基于英文的,所以对其他语种的兼容性和理解力不足。

4)计算成本大,GPT是一个非常大的神经网络模型,模型的参数量在数百万到数千万之间。模型的大小在数十 MB 到几个G之间,甚至有上百GB,对于这样的模型训练和推理,需要大量的计算资源和时间支撑。

6.您的团队使用过中国自研的AI语言模型吗?哪一个?请问他们和GPT相比有什么区别?

目前中国自研的AI语言模型。

1)某些可以支持不同的声音回复,GPT的应用目前不支持。

2)语言支持上,国内更加偏向中文沟通,GPT对英文理解较深。

3)在应用领域,国内更偏向对话生成,功能单一,而GPT是一个语言生成模型,可以用在文本生成、代码编写等。

4)在沟通上,国内目前更加倾向短句沟通,GPT对长句的理解已经很强。

7.您团队在使用AI语言模型中,最希望实现但还未能实现的功能有哪些?

虽然现在基于LLM的聊天机器人已经取得了惊人的表现,但是在某些方面仍需要提升;第一是对语境和情感的理解,如同一词汇不同语境表达不同的意思,机器人的理解尚不足,需要用户不断切换表达方式。另外就是上下文的连贯性,针对同一主题连续沟通上连贯性不足。再者就是创造性不足,目前的聊天机器人更多的是对已有知识的整合和关系梳理,还不能满足独立思考创造新想法的需求。

8.请您介绍一下您的公司,成立时间,主要关注什么领域和提供什么服务和产品,以及未来的一些发展计划?

上海星图比特信息技术服务有限公司(StarBitech)成立于2015年,由上海树图区块链研究院与风语筑(603466.SH)联合投资的一家原生智能数字内容资产科技公司。公司位于上海漕河泾开发区微软加速器,致力于为个人和企业提供算法驱动的原生数字资产智能创作发行服务。公司核心产品灵境智能数字资产管理云(AI-DAM)是基于AI生成技术(VAE、Tranformer、Bert、Stable Diffusion等)根据业务需求生成文本、图像、音视频等内容,并通过Layer2区块链技术形成数字资产,从而助力元宇宙数字商业的发展。公司已有合作伙伴:招商银行、华为、LVMH、上海市公安静安分局、上海技术交易所等。

公司日前已获得微软和OpenAI的赞助,将根据中国历史、文化和语言特色,发挥团队在中文自然语言处理和本土合规领域的优势,围绕GPT、DALLE算法以及强化学习的加持,将在对话机器人、视觉内容创作、营销内容创作等国内垂直领域开展AIGC服务,为营销、游戏、动漫、文旅、政府等行业提供人工智能赋能。