图片来自123RF

过去数据行业像是一座座孤岛,不同类型或来源的数据之间难以打通融合。那么,该如何搭建它们之间的桥梁呢?

马云曾在一次演讲中说道:“人类正从 IT 时代进入 DT 时代”。

在数据时代里,我们的衣食住行,甚至一举一动都会产生大量数据,而数据代表着价值。当前,各大公司纷纷布局数据产业,数据的价值受到社会各界前所未有的重视。那么,数据行业存在着哪些机遇和挑战呢?

从事数据行业十余年的榕树网络基金会主席龙凯表示,数据行业正处于大变革时期,过去数据行业像是一座座孤岛,不同类型或来源的数据之间难以打通融合。行业里有以银联为代表的消费类数据,还有三大运营商为代表的位置轨迹数据、上网行为数据,以及各互联网巨头和超级 APP 为代表记录海量用户线上行为的数据等,这些不同超级数据源之间彼此关联,但又相互独立。

为了打破数据行业之间的固有隔阂,就需要一个定位独立、易于信任的中间第三方来做数据融合,提高数据利用率,挖掘更大的价值。致力于打造数据价值链网络的榕树网络,扮演的便是中间连接方的角色,其通过对数据的连接、治理、融合为用户提供数据服务。

做数据融合的“后厨”

据龙凯介绍,榕树网络希望打造一个基于大数据的人工智能产业链平台,一个让所有数据参与方能够深度融合和协作的生态共同体。而实现这个生态共同体需要三个步骤:数据链接,数据治理和数据融合。

数据连接是榕树网络的基础,负责将各种数据源接入到榕树网络中。与普通的单一数据源连接不同,榕树网络通过连接不同数据源,从而针对个体能够采集融合其在多个场景产生的数据,如运营商数据、金融机构数据、电商平台数据、移动互联网数据等,进而得到更为全面立体的数据。

数据治理也叫数据加工,通过对复杂数据的清洗、整理、标签化等达到数据精简化、标准化的目的。如运营商非结构化的网上浏览日志,电商半结构化的用户点击行为等,都可以通过数据治理清洗成结构化数据,从而更加容易地将数据标签化。

数据融合是通过对加工后的数据进行融合与建模,并得到全新结论的过程。如某个体是共享单车 APP 重度用户,近期突然开始关注婴幼儿用品,通过数据建模,可能计算出该个体购买汽车的意愿。

数据服务是将上述三步所得到的数据,设计成数据产品,对外提供服务。例如提供用户兴趣爱好查询服务,特定人群圈定服务等。龙凯形容这个过程就像是一个“中央厨房”的概念:“原来的数据行业就像是混乱的后厨,散乱的数据就是散乱的原材料,很难炒成一盘好菜。我们就像是厨师,负责不同来源的菜品梳理好,洗好择好,再做出不同口味的菜品放到前台,大家各取所需。”

大数据与区块链的碰撞

数据行业为何多年来一直处于割裂状态?归根结底还是因为各个掌握数据源的企业之间的不信任,对于数据之间的真实性和是否对等性存有质疑,以及数据交换之间尚无明确规则。即使出现像榕树网络这样第三方做数据融合工作,仍不能确保完全信任。直到区块链技术的出现,让榕树团队找到了解决方案,区块链的共识机制和不可篡改性完美地契合了这一痛点。

榕树网络通过契约关系形成智能合约或智能资产,区块链成为数据价值链中的一个万能账本。链上记录保证任何数据无法被非合规复制、截流、沉淀或修改,数据价值不存在被盗用及弱化风险,从而极大降低了数据源对榕树网络的信任成本。另一个优势就是突破突破地缘和时间限制,提高各参与方的透明性、延展性和效率,促使产生更大的数据流动性和更高的数据价值。

在数据连接层面,为保证让各大数据源的接入方和应用方放心的使用源头数据,榕树网络将构建数据源评价体系,并将进入评价体系内的数据源评分结果实时上链。数据代理方或数据的使用企业可以实时查看各类数据源的评分等级并据此选择接入的数据源,数据源也可以依据自己的评分不断的去优化完善自身的数据精准度。

在数据治理层面,榕树网络通过社区达成共识的数据治理规范,来发布和运营数据治理众包平台。数据方可以将待处理的数据包发布到平台上,通过众包的形式发布任务,由社区参与治理。数据源方支付数字资产给众包治理参与者。平台会将数据治理的结果保存到区块链上,保证各方利益。“相当于我们把巨大的数据清理任务分拆成一个个很小的任务分发给社区成员来做,完成之后会有奖励。”龙凯解释道。

在数据融合层面,榕树网络则建立联盟链予以解决。不同于榕树网络公链,联盟链具有部分去中心化、可控性强、交互速度快等特征。榕树联盟链为成员共有,各节点分布在各成员中,易达成共识,有利于区块链的高效运行和更新迭代。联盟链核心数据限于成员及其用户按权限设置可见,可以满足特定场景的隐私性需求。

数据安全与隐私保护

谈及数据,总绕不开数据安全和隐私保护问题。龙凯告诉动点科技,在授权管理方面,榕树网络开发了互信通的服务,用户上链之后,自己的信息被整合使用或者被查询调用的时候都会收到通知,经过本人允许之后,信息才可以被使用。对于隐私保护,榕树网络使用一种特殊“脱敏”技术。原始数据中含有个人隐私信息的,比如手机号、身份证号等,会通过单向加密算法它变成一个不可破解的 ID ,在这种情况下,隐私信息便不会被泄露了。不仅如此,为了符合 GDPR 的要求,榕树网络还需要保障公民的“被遗忘权”不被侵犯。

数据安全也是榕树网络一直以来非常重视的方面,在打造过国有控股子公司的龙凯及其团队认为建立完整严格的规范制度是保证数据安全的护城河。技术范畴也会有专门的技术团队做严格把控,不同级别的人和不同层面的流程都具有相应的规章制度。

据了解,榕树网络目前已完成了据连接平台的搭建,已经逐步接入了优质的超级源,并根据数据的不同属性和标签划分为“黑曜石”、“蓝曜石”等系列产品。

龙凯透露,接下来榕树网络工作重心将放在第二层数据治理环节。社区众包平台正在搭建中,初始版本将很快在国内上线。而社区的建立在于用户能否达成共识,并自觉的完成分发任务,龙凯坦言这也是榕树网络目前重点研究和亟待解决的课题。

近期,国内政策对于通证相关的监管日趋严格,谈到如何规避政策风险,龙凯表示:“榕树网络的业务都是可以落地的业务,从数据连接、数据治理到融合分发都是可以去实际解决数据行业中真正的商业问题,所以我们对此完全有信心。”

据悉,榕树网络基金会在新加坡于 2018 年 3 月成立,项目则是在今年 1 月份上线。CEO David Zhou 为加拿大籍,毕业于滑铁卢大学,同时也是高维资本外部合伙人。龙凯为该公司的中国区负责人,毕业于北京大学和斯坦福大学,也曾是 Oracle 中间件首席工程师、银联智惠创始人。此外,榕树网络目前正与国内的汽车、保险、银行等客户探索合作,产品已在客户端进行测试和打磨,八月份正式上线。