在BEYOND Expo的NVIDIA Inception展区,SlidesOrator是一个小而美,也颇具实用性的项目。它没有机械臂、没有AR眼镜,展台也并不花哨,但它的目标直指每一个打工人都熟悉的场景:如何展示PPT。
用AI做PPT这件事,几乎是伴随着大语言模型的诞生而诞生的。SlidesOrator并不想重复前人做过的事情,他们认为让表达变得“自动而可信”,或许比让AI写出100篇PPT更重要。
SlidesOrator的体验也很简单,用户只需要上传一份PDF格式的幻灯片,它就能自动生成语音讲解内容,并通过3D虚拟数字人完成整场演示。整个过程无需真人录音,也不依赖事先训练。
更重要的是,这并不只是做一场播片式的演示,数字人还可以根据PPT内容实时回答观众提问,模拟一个完整、互动的“AI演讲者”形象。
SlidesOrator团队表示,他们在多语言TTS语音、语义摘要、图文匹配以及3D数字人驱动方面都做了深度优化,力求在不依赖专业团队的前提下,让任何人都可以快速“托管”一场讲演。
目前,这套系统已经应用于教育培训、企业宣讲、产品发布等场景,尤其适合内容高度结构化、需要多语种传播的行业客户。比如在跨国展会、在线公开课、初创路演等场合。团队介绍说,目前他们的服务吸引了很多发展中地区的用户,我在他们的演示中也看到了一些来自越南、泰国等地用户上传的本地语言PPT。