玻森:语义理解+企业信息查询,用“火眼金睛”照亮企业风险 | 创业

跟曾经大热的“互联网+”一样,人工智能的价值其实也并不仅仅在技术本身,而是在于技术与行业的结合,即“AI+行业”。

当然,看见这个趋势的企业并不在少数,市面上也早已出现了一大批AI+视频监控、AI+客服……的AI公司。我们今天将要介绍的则是一家AI+企业信息查询的公司:玻森数据。

据了解,玻森数据的AI+企业信息查询工具名叫“风报”。

风报不乏强大竞争者

说到企业信息查询类工具,笔者首先想到的是企查查、企信宝、天眼查等产品。对于风报与这些产品的区别,玻森数据COO 顾佳庆表示,首要区别是产品定位不一样。

“风报从一开始就旨在为企业级客户、金融机构、律师及会计事务所等专业机构提供企业情报及风险管理服务。”顾佳庆介绍二者的区别就像是“数据搜索查询”和“数据处理分析”之间的区别。

“其他查老板查关系的2C类产品,主要提供一些基础的信息罗列和汇总,可基本满足个人用户的需求,不过看似能够获取很多的数据,但其核心还是在玩工商数据。工商数据相对容易获取,且比较容易汇总和展示。”顾佳庆表示风报作为一款2B类产品,可以在数据的全面精准及深度分析上满足B端客户更高的需求。

而风报之所以能够做到这一点,主要归功于他们拥有NLP自然语言处理能力。

“NLP技术的深度处理能力,有助于企业高效获取精准数据,智能提取各类实体(如公司、关联、标签等),智能解析司法诉讼、企业事件等数据关联,这是风报的核心优势之一。”顾佳庆表示,企业信息涉及大量的裁判文书等非结构化文本,提炼关键信息要进行去重、实体抽取、分词、清洗及分析等,而这些不是依托简单的信息汇总就能完成的,首先就需要有NLP能力。

据了解,基于NLP语义分析的关联分析是风报最重要的优势之一。“风报的关联分析不仅仅是提供企业的单一直线关联,而是将企业、人、事件等层层揭露,提供了多重交叉关联关系,并可追溯其关联路径,进而有利于挖掘潜在的疑似关联。”

“比如通过我们的高级关联导航,用户可以去查询公司和其抵押公司的关联关系,举个例子如果发现两家公司通过多家金融机构相关联,很有可能是一家金融机构对自己不信任,逐级介绍,或者数额太大,风险也太大,一家机构消化不了,就多家机构互相介绍,从中抽成或分担,那就有可能表明该公司在资金运转上存在诸多问题。”玻森方面介绍称基于NLP的关联分析可以有效地发现企业运营等方面的风险。

顾佳庆强调风报的目标客户是更加高端的B端用户,“2B类产品,需要我们对行业的理解更为专业、透彻,对数据处理服务能力更为严谨、深入,如果有人认为我们跟其他2C类的产品是一样的,那这个人就绝对不是我们的目标用户,我们的目标用户是那种一看见我们的产品,便会发现我们更加深入的分析能力正是他们所急切需要的。”一般而言,评价一个产品好坏并不是看创始人说什么,而应该看用户是否愿意为这个产品买单。而实际上,“风报已经得到了包括中国平安、远东租赁等在内的超过500家长期付费用户的支持,他们在前期的采购时也会做比较,但最终选择了我们,这也证明了我们的产品价值。”顾佳庆自豪地表示。

核心壁垒:中文语义分析能力

据介绍,风报所运用的NLP技术是由其创始团队于2012年开始研发,2013年正式上线了BosonNLP中文语义开放平台,各行各业的用户都可以通过该开放平台分析他们的数据,而这便是玻森另一项极具潜力价值的业务。

技术上,根据玻森提供的一份包括BosonNLP在内的11款开放中文分词引擎的评测结果显示,BosonNLP的分词准确度实属上乘:

“而且,在国内自然语言处理最权威的比赛-NLPCC公开赛上,玻森数据还曾连续两年获得中文分词与词性标注两项比赛的第一。”顾佳庆此外还表示玻森在自然语言情感分析领域也具有一定的优势:“玻森NLP情感引擎提供行业领先的篇章级情感分析。基于上百万条社交网络平衡语料和数十万条新闻平衡语料的机器学习模型,结合自主开发的半监督学习技术,我们的正负面情感分析准确度达到80%~85% ,而经过行业数据标注学习后准确率更是可达85%~90%。”

因此,作为一个底层的、通用的技术平台,BosonNLP依旧是玻森目前的重点,不过在现阶段,BosonNLP只有与具体行业结合才能出最大的价值。而风报则是玻森通过BosonNLP的基础引擎,结合行业经验,对产业生态做进一步的深度分析加工,为产业提供商业级的应用服务。

关于BosonNLP的其他应用,顾佳庆现阶段的设想是用户先用BosonNLP做数据的初步处理,之后再通过产业生态做进一步的深度分析加工。不过,由于产业生态的完善还需要时间,顾佳庆认为5至10年之后,BosonNLP有望成为玻森的核心业务之一,是名副其实的潜力股。

据了解,玻森目前有员工约60人,已经有过三轮融资,最近在做B轮。

题图来自123rf