tupukeji

当文字搜索描述显得苍白无力的时候,基于人工智能的图片和视频内容已逐步成为了用户表达、事件记录分析中不可或缺的部分。“它就像一个痒痒挠,能够到文字搜索难以企及的痒点。”图普科技CEO李明强说道。

图普科技是一家专注图像识别的云服务公司,其主要面向的是B端市场。用户通过接入它的API再上传图片,服务器就能以一定的准确性解读图片。这其中,图普科技主要提供的业务包括智能审核、图片增值、图片搜索和深度定制四大板块。目前日均处理9亿张图片。

说到图片搜索可能大家最先想到的就是淘宝的拍立淘,图片购物搜索功能可谓是购物者解决搜索问题的一剂良药。其实除了淘宝,像国外的ebay、Google,再到国内的华为、京东和其他几个BAT成员也都在该领域有所布局。

不过图普科技却从鉴别小黄图开始发力,该类图片、视频审核也是其主要业务,客户主要包括迅雷、映客、花椒等上百家直播平台。为何要从内容安全审核这块开始切入,而不是去利用AI技术满足用户更好的购物体验呢?

李明强告诉动点科技,这和人的金字塔生存链是一样的。首先要在满足生存和保证安全的前提下,人们才会考虑从心理和任性的角度出发;其次对于一个人工智能企业来说,数据是一个很大的门槛。数据越多,分析的准确度就越高;而准确度高就能吸引更多用户,从而得到更多数据。

xiaohuangrenjianbie

此前,图普科技在做内容审核之前也尝试过智能搜衣的方向,但是该应用场景除了识别出衣物外还需要大量相关厂家及其他数据,既要做到给用户“骑驴找驴”的体验,也要给用户实现“骑驴找马”功能。这跟拥有大量数据积累的互联网大企业相比,要在这个应用场景上布局显然是举步维艰的。后来由于快播事件,他们发现内容审核对很多社交及云平台都是刚需,才做起了鉴别小黄图。目前,通过与今日头条、58同城、迅雷、酷狗等诸多企业合作,图普科技的样本数量已经过亿,并且每周都可以实现模型的一次优化迭代。

在鉴别小黄图上,传统的智能审核方案基本是通过图RGB值(工业界的一种颜色标准)来识别肤色比例,再通过建模识别异常动作、敏感部位等;又或者是通md5(消息摘要算法第五版)的方法过滤。再通过人工去复审,这就需要大量的劳力,工作强度也十分巨大,很容易产生疲劳审核的误判。

图普科技采用的则是深度学习算法,通过模拟人脑神经网络,构建具有高层次表现力的模型,对高复杂度数据形成良好的解读。通过大数据持续训练、频繁的迭代。用李明强自己的话来说,图像识别开放平台就好比一个聪明的孩子,企业用户只要上传各种应用场景下的图片数据来“教他”(数据训练),这个孩子看得越多就学得越好,干活也就越靠得住。据悉,图普科技目前的智能审核服务精确度已达到 99.5%,能有效节省超过90%的人工复审工作。

tupu

虽然目前在人脸识别这块计算机已经超越了人类,但也并非说不会出现问题。应用到不同领域就有不同的问题需要解决,比如在直播领域。李明强介绍说,直播强调的是一个实时性,所以审核也需要做到毫秒级,响应速度得跟上。而图普科技采用的也是基于大规模GPU集群的超算平台,支持亿万级别的图像处理,单张图片响应时间小于0.2s。

当然,内容审核只是一个切入点,图普科技也提供增值服务。比如针对目前主播长相同质化严重的现象,图普科技可以打造专属的个性化推荐系统,提升运营效果。李明强解释道,首先可以通过图像识别对主播进行分类,帮助平台分析进行推荐;其次也可以挖掘主播内容,根据用户习惯进行推送;最后也可以通过识别图像信息帮助用户搜索。

正如一开始提到的,图普的服务主要是通过API接口的形式呈现。用户接入之后,可以自行选择调用的模型、服务需要付费,并按图片的实际调用量收费,具体为25元/万张图片,月付费或包年均可。应用场景上,除了在安全领域,图普科技也在电商、金融大数据方面展开了合作。未来图普科技想要建立的是一个视频时代的连接,开通一个除了文字之外的另一个视频和图像描述的新世界。

据悉,图普科技成立于2014年,创始人李明强是原腾讯项目经理和 T4 技术专家,同时也是微信立项时的创始成员之一。2014年,图普科技获得了北极光数百万美元的Pre-A轮融资。