常言道:“眼见为实,耳听为虚。”,不过,三平科技却认为“眼见”加“耳听”才会得到更准确的判断。

三平科技,是一家致力于成为领先的声音和图像处理的新兴人工智能公司。其通过利用先进的声学定位、声纹识别、语音识别和自然语言处理等技术,与图像处理相结合的综合解决方案,可以更加准确的识别事物,广泛应用到智能交通、安全防护、公共安全、工厂监测等领域。

目前,该公司主要在声学检测领域布局,主要产品为鸣笛抓拍。该产品帮助交通机构,构建了电子警察的雷风耳,可以24小时工作,并且实时反馈监督结果,节约人力资源。众所周知,学校、医院、以及一些特殊的路段一般都标有禁止鸣笛的标志,并且不远处就设置有摄像头。如车辆在禁鸣区违法鸣笛,或者改装的摩托车半夜炸街扰民,这些行为都将被雷风耳记录在案。

据三平科技的CEO王哲介绍,鸣笛抓拍产品是基于国内先进的声呐阵列定位技术,可实时侦测鸣笛声,准确定位鸣笛车辆,自动进行抓拍和车牌识别,实时生成图像音频和视频证据,在线完成证据上传和推送,实现了违法鸣笛不仅“听得见”,而且“看得见”,有效用于现场执法和非现场执法。

这一套“行云流水”的执法辅助系统的核心特点是远距离声音识别和定位。“声音识别和定位技术的应用其实在我们的生活中已经有很多案例,典型应用如智能音箱。不过,目前大部分产品是在近距离、低噪音的室内环境下实现。”王哲表示,相比之下,鸣笛抓拍要在室外且嘈杂的环境下实现,其中需要核心技术的突破。“我们主要的特点是远场多生源的复杂噪音环境下的声音识别和声音定位。”他说。

值得一提的是,三平科技创始团队在集成电路芯片、声学传感器、人工智能算法等方面具有多年经验和积累。“我们的强势并不是在市场或者说营销方面,而是在技术上,团队在声学和硬件方面有大量自主研发成果。”王哲说。所以,该团队也攻破了技术应用的壁垒:一是降噪,三平科技利用麦克风阵列接收声音,先确定声源大致方位,然后把该方向上的声音加强,其他方向的声音减弱,来实现定向降噪。二是定位,不同的声源到每个麦克风的时间是不一样的,三平科技通过一定的算法补偿可以实现同时收到声源,然后再判断信号最强的部分以实现定位。在复杂噪音环境下,实现对鸣笛进行声纹识别及分类。

降噪和定位是声音技术的基础,此外,王哲表示,希望还可以利用声音实现事件监测。“我们希望可以把声音和视频结合,帮助交通及安防领域做更仔细准确及合理的判断。”他介绍道,如商场有很多摄像头,有一个专门的监控室,但仅仅只有三四个人,可能无法及时发现突发情况。如果利用声音和视频结合的方案,可以及时的发现这种情况。“其实大部分意外情况都会伴随着声音,而且是比较响亮的声音。”他说,远距离的安全异常事件检测,以及异常事件的解读,其核心就是为了代替人,降低人力成本,提升效率。

目前,声学检测逐渐地广泛用于工业检测领域,也出现了谛声科技等新兴企业。细分到交通执法领域,也出现了其高科技等少量玩家。不过,王哲认为:“就细分市场而言,我认为还没有达到一个充分竞争的程度,目前还是处在起步阶段。”他表示,市场还存在大量机会。而三平科技的核心特点是,提供了整个系统,将声音识别、定位和图像合成融合,形成了一套完整的解决方案。“我们在技术上也有优势。如多生源定位,以及更高的准确率。”王哲说。

据介绍,目前,三平科技的产品还处在研发阶段,已经有客户在试用。“我们希望通过这个事情积累一些数据。不过,目前也存在一些挑战,如车速太快的情况下,系统无法快速及时的抓拍。”王哲坦言。随后,他补充表示,三平科技将持续且快速地突破这些问题。

据透露,一些摄像头厂商已经表示想与该公司合作。“现在摄像头有一些缺陷,在晚上运行需要加红外线模块,但成本较贵,可以利用声音的功能辅助摄像头在夜晚运行。”他表示;“我们希望像海康威视一样,提供产品和解决方案,由集成商向我们采购方案。”

三平科技于2018年12月底完成中信双创的数百万元种子轮融资。