新型冠状病毒肺炎疫情爆发以来,各大媒体网站、社交平台上关于疫情的话题热度持高涨,社会各界都时刻关注着疫情的最新走向。

为了便于疫情防控和宣传工作的开展,更好地帮助相关政府部门了解疫情舆情的实时动态,以及帮助公众在海量信息中汲取有价值的疫情资讯,RealAI(瑞莱智慧)联合清华大学人工智能研究院共同研发并推出“新冠肺炎疫情AI话题分析平台”,帮助用户随时“触手可得”疫情最新变化。

作为新冠肺炎疫情所有信息的重要入口,该平台通过对多渠道海量媒体信息进行自动抓取采集、识别分析,解决了传统信息检索过程中因消息源头繁杂、消息过多、检索意图不明确而产生的困扰。同时,基于大数据分析和AI建模,自动识别出近期热点话题、新闻追踪和话题导向、地区关注度变化,为用户第一时间推送全网话题最新动态,满足用户对疫情舆情监测的需求,为作出正确舆论引导提供分析依据。

在底层算法支持上,该平台基于清华大学人工智能研究院、计算机系推出的WarpLDA主题提取算法研发。基于蒙特卡洛EM算法,WarpLDA在访存效率、并行度方面相比传统的Gibbs采样算法更有优势,可用于上亿级别文本的主题提取。该成果最早首发于数据库领域顶级国际学术会议VLDB上。