sogou

8月3日,搜狗公司正式对外发布了搜狗语音交互引擎“知音”。官方表示,该语音交互引擎在识别速度、纠错能力上都有更好的提升,且支持更加复杂多轮的交互。

具体来讲,首先“知音”解决了用户在说话过程中因语速过快而导致的吞音问题,官方表示语音识别错误率相对下降30%以上,语音识别速度提升3倍。

其次,“知音”能够在语音交互的过程中支持用户修正错误的识别结果,用户可以使用自然语言进行改错,比如用户说把“张”修改为立早“章”,或者把“张”修改为文章的“章”。

此外,“知音”还支持多轮对话,处理更复杂的用户交互逻辑,用自然并且用户更容易接受和理解的方式进行交互,以便感知用户语音请求背后的真正需求,从而提供更为便捷的人性化服务。比如用户说我要去首都机场,它会问 T1还是 T2,当用户确定航站楼后,它会问是出发还是接人。

据搜狗CTO杨洪涛介绍,搜狗从2012年开始研发智能语音技术,并于次年开始进行深度学习,目前搜狗的智能语音技术已经成功应用到搜狗的全线产品中。官方数据显示,搜狗搜索日均语音搜索次数增长超过4倍,搜狗手机输入法日均语音输入超过1.4亿次。

杨洪涛表示,自然交互和知识计算是搜狗在人工智能领域的两大战略方向,目前搜狗在AI领域的研发已经全面展开,“知音”引擎将会在物联网、车联网更多场景为用户提供服务,并布局到更多的终端入口。