作为大数据领域的创业公司,可能首先需要解决数据来源的问题。TalkingData CEO 崔晓波分享道,虽然他们也通过SDK等方式获取APP的部分数据,但这些数据距离产生价值还比较远。目前移动端有价值的信息,仍来自与第三方的交易,并且在国内有不少可提供数据的第三方。

 

在大数据具体应用的领域上,TalkingData把重心放在已经开始盈利的游戏行业以及面向B端企业客户提供服务。

 

以下是崔晓波分享的部分内容摘录:

 

移动数据分析和互联网数据分析,一个很大的不同在前端,包括采集,清洗,纠错等。由于移动网络的脆弱性,尤其在中国,整个无线宽带各方面不是特别发达,以及移动数据上报的异步,大量的客户端使用等,去年做移动端的行业比较辛苦。

 

从移动设备采用数据,由于大量不规范手机的出现,实际上那个数据是很混乱的,比如说运营商统计,比如说中国移动香港,中国移不动,山寨机都是乱写的,所以需要大量的工作去做规范,变成真正对客户是可读的信息。

 

有价值的信息仍来自跟数据拥有方的交易

 

从数据价值的角度,TalkingData对整个移动互联网能够采集的数据,分成三类:

 

第一类叫网络基础信息数据,包括你的终端信息,你的网络信息,甚至包括WIFI和IP网点信息,这属于网络基础信息。这一部分数据有价值,但是要做大量的深加工。

 

第二类叫应用相关的信息,大量嵌入移动信息里面去,打开多少次,使用多长的时间,留存多长时间,活跃怎么样,去年我们跟很多应用商店的合作伙伴,包括广告合作伙伴和我们做了测试,实验基本都是失败的,这个数据质量离用户转化还很远,很难带来直接的效应。

 

很多人认为,你们覆盖了那么多的应用和设备,有SDK放在应用里面,他们的应用很有价值,其实恰恰不是这样子。现在移动互联网是一个封闭的体系,互联网是开放的,所以你通过分析页面可以大家上下文的信息,比如说牛总点击了新闻,分析了页面,可以知道你点击的是什么样的页面。移动端就不同,你每天用大众点评,但是我不知道你喜欢吃川菜还是粤菜,由于封闭性和非标准化,很难帮助我们识别信息。

 

真正有价值,是第三类的信息,包括跟客户交易的信息,大量的合作伙伴得到了很多信息,这是中国的国情。比如说在国外,大的这种数据平台想去跟谷歌去合作,这基本上是不可能的,国内有很多的第三方,你可以拿到很多的浏览信息,我们有很多的地图伙伴给我们做合作,我们交换了数据,这是对我们有价值的。

 

【关于数据的价值问题,阿里巴巴副总裁梁春晓的看法与崔晓波类似,他认为,我们现在的数据(电子商务里面的数据,金融服务里面的数据,乃至于各种社交网络里面的数据),这些数据本身是运营产生的,也就是在当初在产生这些数据的时候,一点都没有考虑到以后还要分析这些数据。所以这就带来了一个很大的困难,我们经常会想象,这些数据我们直接拿来就可以做成各种各样的面包,蛋糕和面条,但是你要知道你面对这些数据并不是面粉,离面粉还有很大的距离,实际上还是地里的麦子,你要把这些麦子怎么转化成面粉。】

 

侧重游戏、广告和传统企业类客户

 

从数据开发的角度,具体到移动互联网的领域,现在移动互联网就关注两块,第一块因为从去年开始,移动游戏开始赚钱了,大家肯定很关心,因为只要是这些企业开始赚钱了,实际上就变成了很大的广告主和资金提供方。

 

再就是大家也关心移动广告到底发展的情况是怎么样的。移动游戏还处于一个很粗犷的运营阶段,大家获取用户的成本好象还不是那么高,我用一种非常暴力,或者粗犷的手法去推广,也能赚钱,到下半年可能不行了,现在有很多移动游戏投不动了。有一些特殊题材的游戏,还有军事题材,他买不到用户,他去买用户按同样的价值,他会赔死,需要业内提供比较精准的信息。

 

我们还有很多的企业客户,平安也是我们比较典型的企业客户之一,他们在移动广告投放非常困惑,他们需要一个专门来做数据加工的。