jixianyuan

极限元,是一家成立于2014年8月的人工智能企业,与很多主打行业通用解决方案的人工智能企业不同,极限元重点为垂直行业进行人工智能的个性化深度定制,其业务包括为腾讯、360、搜狗提供语音合成定制化服务,为网信办提供音视频有害信息监测服务,为语文出版社提供语音识别以及口语评测服务,为电信部门提供语音防诈骗服务等。

同时,极限元也是业内少有的集语音识别、语音合成等智能语音技术与计算机视觉技术以及大数据分析技术于一身的企业,可以更好地为客户提供一体化的解决方案。

一生二,二生三,三生万物

这指的是极限元的语音智能、机器视觉以及大数据分析三项自成闭环的技术体系。

将自己的技术免费开放出去,让更多的人使用,当用户数达到一定的量之后,再通过直接收费或其他方式盈利。在QQ等平台型产品大获成功之后,平台化运营也已经成了越来越多企业创业的首选方案。极限元在2014年创业之初也走了这条路,然而,理想很丰满,现实却很骨感。

极限元的“一”是智能语音技术。“我们是以语音技术起家的,创业之初便获得了语音合成、语音识别等相关技术发明专利,并推出了‘智能语音云平台’,开放API接口,提供多种智能语音技术解决方案,智能硬件以及APP等企业只需要在线接入我们的云平台就能轻松获取相关能力。”然而,极限元联合创始人马骥却发现,“虽然有可能产生优质客户资源,但大部分客户都是付费意愿不高的个人开发者或者初创团队等。”

“无法收到费,而平台的运维却又要花费大量的资金。”马骥认为,在市场需求并不明显的情况下做平台并不是一个普通创业企业所能做的。那么,谁能做平台?只有那些有大资源支持的企业。“如果企业能得到一些大的资源支持,做专、做平台当然很好,你可以将产品做得比较极致,市面上没有可以取代你的产品,你便得以快速成长起来。”然而,这对于当时需要考虑造血能力的极限元而言并不现实。

因此,极限元转向为没有技术开发能力的企业做人工智能相关的个性化定制服务。比如为语文出版社提供语音识别以及口语评测服务等,为电信部门提供基于语音关键词检索的诈骗电话识别应用等。而在为企业做定制化服务的过程中,极限元开始意识到仅仅是语音智能并不能完整地满足客户的很多需求。“客户想要解决的某一问题,可能涉及到语音、图像、文本等各种数据,仅仅只是提供语音技术是远远无法一站式解决用户问题的。”所以,极限元在又做了包括机器视觉以及大数据分析方面的很多综合方案。于是“一”得以生“二”,“二”又得以生“三”。

  • 极限元的机器视觉技术可用于涉黄涉暴等有害信息检测,二维码、数字字符、文字等形式的广告检测,以及证照识别的图像识别技术;用于AR、VR或游戏控制的手势识别技术,其可以跟踪识别实时视频中出现的手势;另外还有人脸特效工具等。
  • 极限元的大数据分析技术则是在为直播平台建设主播工具的过程中得到了市场的检验。据了解,极限元为经纪公司建立的主播工具可跨平台管理主播,分级下达直播任务,其中的观众行为分析系统可以了解观众的喜好焦点,准确判断观众的付费意愿,提升互动率,增加主播礼物收益。

而有了这三项马骥所定义的“自成闭环”的能力之后,马骥认为自己将能够为各行各业的客户提供全套、完整、更丰富的行业解决方案,“三”得以生“万物”,这是其面对市场竞争最大的优势之一。

而且值得一提的是,“我们刚开始的时候也担心转型在技术上是不是很难,但真正做的时候,我们才发现有了智能语音技术的基础,图像这一块做起来反而更加简单了。”

人工智能的竞争,归根到底还是人才的竞争

“从2000年初一直到2012年左右,这10余年来语音技术等人工智能技术基本处于停滞阶段,直到2012年之后深度学习被用于语音、图像等人工智能领域,而且效果还相当不错。这才让行业焕发二度春。”马骥表示人工智能人才的断层是制约行业发展的最大阻碍之一,“这些年来语音技术便冷门,使得相关人才比较紧缺,目前国内能提供优秀声学技术人才的也就声学所、自动化所、清华大学、中科大等少数机构, 每年毕业的语音相关的博士也就几十个,完全不够众多的公司抢。”

为了抢夺人才,极限元跟清华大学、自动化所都有合作,其中更与自动化所成立“智能交互联合实验室”,在实验室内培养、储存一些技术人才。“一方面是专利技术共享,另一方面,他们毕业的人才也可以很便捷地进入我们公司,第三,我们遇见的一些难题可以直接交给他们来研究,毕竟他们研究前沿科学比较多。”马骥如此表示。

在吸引人才方面,“要么给的钱多,要么给他的未来预期(期权股权等)比较大。做好这两点之后,就看员工个人的取向了,有人想要稳定一点的那就去大公司好了,有人想闯一闯那就来创业公司。总之,我们每年也还是会有一部分人才被吸引进来。”

举例来说,极限元CTO、中科院自动化所副研究员温正棋先后在日本和歌山大学和美国佐治亚理工学院进行交流学习,在国际会议和期刊上发表论文十余篇,获得多项关于语音及音频领域的专利。其“具有个性化自适应能力的高性能语音处理技术及应用”获得北京科学技术奖。在语音的合成、识别、说话人识别等领域都有着多年深入研究经验,并结合深度学习技术开发了多款语音应用产品。

在技术实力方面,马骥坦诚表示极限元并不具备技术壁垒,其壁垒在于对客户需求的理解与满足。“这次人工智能热潮的主要任务其实是将人工智能技术与各个行业具体结合,从而变革这些传统产业,而这就要求对行业客户的需求非常了解,我们是最早意识到这一点的企业之一。”

另外,马骥还表示,“技术差距肯定是有的,但到解决具体问题上,差距反而并不明显了。在具体问题具体分析上,小企业反而要比大公司灵活。”

不死盯70%的市场,要广泛撒网,精准捕捞

通过建设技术平台,以B2B2C的形式,平台型的通用技术提供商有机会覆盖70%的市场。不过,在马骥看来,平台型企业的这70%市场其实并不稳定。“比如直播鉴黄市场今年就出现了很大的萎缩,一方面是直播平台大量倒闭,二是大的平台开始自建团队,研发了自己的直播鉴黄应用,它们不希望自己的数据外流。”

因此,马骥认为以客户需求为导向的个性化定制才是人工智能技术商业化的正解。

“国内的BAT、科大讯飞等大公司在资源上会比较有优势,而且它们的涉及面也更广,但他们的缺陷主要在于只能解决一些通用型的问题,我们也常开玩笑称‘解决全人类的问题就交给它们来做,我们只解决小众问题’,比如为了拿下一些客户,我们可以满足其在细枝末节上的一些需求,这是主打通用型技术的大公司所不具备的能力。”马骥如此表示。

当然,发展速度受限是做行业定制的企业共同面临的最大问题,不过,塞翁失马焉知非福,“企业也可以从这些细枝末节的个性化定制中更早地发现行业新的普遍性需求,从而抓住机遇,跟上节奏。”

“因此,为了更好地应对竞争,我们应该尽早地进入到行业里面去,而且进入行业越早,面临的竞争也就越少,当你已经取得了企业的信任之后,其他竞争者即使想超越你也得花费很大的时间成本。”马骥表示。

同时,极限元也是希望通过这种“广泛撒网”的方式,为以后的“精准捕捞”做准备,极限元希望在这种摸索中找到一条正确的道路,从而做一些直接2C的产品,“我们的目标不是要做那拥有70%市场第一个B,而是要直接绕过中间的B,与后面的更多的消费者直接对接,让用户直接认识我们,形成更强的用户粘性。”

据了解,极限元目前具有员工约50人,2015年12月完成数千万天使轮融资,投资方未透露。而且其去年已经开始盈利,“去年销售额已经达到千万级别,盈利20%左右。”