在2016年上半年,一部名为《至爱梵高》的动画⻓片在戛纳影展获得点赞无数。这部动画电影堪称史上第一部全手绘油画⻓片,其制作团队在全球招募优秀的油画家经过为期三周梵高艺术⻛格的培训,最终由一百人的团队用56800幅油画制成了这部电影。不过,如此大的工作量为什么不让计算机批量绘制印象画风格的效果图,而人类只需要去拍下风景照就好呢?AI是否会创造奇迹,作出更惊人的作品呢?
蔡天懿就是抱有这个想法的其中一员,他开创的Versa是一个基于人工智能的短视频与照片编辑器。毫无艺术天赋的你轻轻一点,就能把普通的风景肖像照全都艺术化,就像画家画出来的那样。这听起来是不是很像去年修图界的当红辣子鸡Prisma及同类App的滤镜风格迁移功能呢?
一样也不一样!
一组原图与效果呈现的对比图
Prisma其实完全是沿用的谷歌实验室李飞飞在斯坦福大学发表的一篇公开论文,因为它是开源的所以那套卷积算法的演变只能停留在发表当时的学术阶段。但看似整体非常美好的效果其实细看很多地方是经不起推敲的,这项技术真正的壁垒在于深度学习模型对绘画创作概念的提取上。
Versa的厲害在於应用了CTO赵维杰(原HUAWEI海思芯片算法科技学)提出的Deep Learning理论框架,能够自主学习‘画画’的概念,将细节的生成效果提升了几个等级,做到了人类肉眼可以识别的差距。并且大幅降低了现有AI算法对数据的依赖,将原本数万张图片的训练数据需求量降低到了100张图片以下。”
这种学习效率还包括在生成速度上的体验——像是Prisma需要3、5秒以至更久的渲染过程,但在体验Versa时非常快,蔡天懿认为“是不可能在世界上会有比我们更快的”,现在可感知到所有的耗时全取决于上传和下载的速度,在Versa服务器上渲染控制在两百毫秒以内。
蔡天懿认为,Prisma还差在一点。它并不理解这个图像的内容,所以它不会知道哪里是人脸哪里是后景前景,就像是小孩在拿着一个大画笔到处涂刷上色,但要效果逼真只有是在全局和具体空间上进行融合和迁移才能水到渠成,“就像是一个真正的画家,知道眼睛的画法应该细致描绘,头发那里又应该怎么落笔。”在一个风格下掌握更多形似到神似的细节技巧是Versa的特色之处。
此外,笔者在体验中还发现Versa还在生成的界面上增添几个人为选项——例如焦点和倍数渲染功能,那么追求一键效果自动化的产品又为何要“画蛇添足”呢?
蔡天懿和我们解释了他长久来在格瓦拉担任产品经理形成的体会——设计一方面是希望让用户感受画家的乐趣,该具体的地方具体处理,该抽象的地方抽象处理。在跟很多摄影师去合作的时候,他们认为全自动的体验会丧失某种创作的乐趣,实际上每一个人都应该像设计师可以选择刻画具象的情景,最后出来的作品也有更多惊喜。“AI作为一个画画的人,应该能跟它去做一个多轮对话机制,这才是有价值的AI产品。”蔡强调说。“这样的交流对于算法也是一个学习,它会更加知道哪里是人脸然后分配强化比重。“
至于能不能火,消费市场的兴趣度会不会早已被透支?
蔡天懿似乎显得并不那么在意,他觉得这只是他们AI的一小步,小试牛刀的尝试背后是为了让更多的人看到这套通用学习算法在人工智能和娱乐艺术结合上的价值所在。未来,蔡天懿还计划用它去帮助人们实现更多艺术种类的再创作,比如录一段口哨,选择不同的编曲风格就可以生成专属你的单曲;再比如一个场景的录制,选择焦点是你让算法充当导演和制片帮你配乐帮你剪辑,自己就能组成一个剧组。这些是远的,近的是今年九月Versa会进行迭代,增加短视频⻛格迁移的功能,解决传统⻛格迁移算法在视频应用中的抖动问题,保证了视频连续性和对象一致性。
“就像是爱乐之城最后一组镜头一样(见题图),你可以选择要把具体的那一部分变成艺术化风格,同时保持真人形象就好像是你从卡通世界中走出来一样。”曾经专业特效制作公司花费数月才能达到的效果,Versa的用户最终都可以轻松做到。这也是通用算法最终成熟后的价值体现之处。这个团队致力于将人工智能技术应用于视觉影像的处理中,打造AI时代的创造力工具。
Versa成立于今年四月初,格瓦拉产品合伙人蔡天懿和华为算法科学家赵维杰共同创立了它。已获得600万元天使轮融资,估值4000万。