颤抖吧人类!AI 正占领中日播音主持人行业

HTS Title Arts

“和歌山市今天将会有高温天气,中暑的风险很高。”在 7 月 31 日 日本 NHK 电视台的新闻当中 ,出现了一位看不见形体的虚拟主持人。名叫“奈奈子”的虚拟主播,在日本和歌山市的一家社区广播电台当中就职,她会在整点时随着音乐的节奏,为大家报告当地新闻以及天气信息。

不仅是“照本宣科”,AI 担纲的主持人还可以自己生成内容。前几天发布的第五代微软小冰,和日本广播电台 J-WAVE 与 IBM 合作开发的 AI 助理主持人 Tommy,都陆续在今年 8 月亮相。看来,一些重大的变化正在广播电视业界发生。

“奈奈子”:由电台业余程序员开发而成

我们先来认识一下和歌山“エフエム和歌山”(FM 和歌山)广播电台的播音员“奈奈子”。“她”使用亚马逊出品的语音合成技术,发出的日语语音让一般的日本人听来,根本不会有奇怪的感觉。在人手缺乏的深夜、凌晨和灾害时期,都不会有人值守, 此时可以由“奈奈子”代为广播已经安排好的稿件

当地报纸《和歌山经济新闻》采访了电台 ,在拍摄于该电台播音室的截图当中可以一窥“奈奈子”的真身。“她”实际上是用非常简单的一个 HTML 网页,调用了亚马逊语音技术的 API 代码。在网页当中有一个文本框,输入一些提前编辑好的信息,点击定时,就可以让“奈奈子”在时间到来的时候自动读出。

image

FM 和歌山是一家低成本的社区电台,为社区居民提供应急信息和生活服务。该局的策划负责人山口诚二是“奈奈子”的“父亲”,他是该市土生土长,目前 35 岁。2004 年去美国留学两年后回来,他成为一名软件开发者,在父亲作为理事长的社区电台下工作。

因为 FM 和歌山的频率是 87.7MHz,根据谐音有一个昵称叫“香蕉 FM”(Banana),山口给这个虚拟主播起名也是音近的“奈奈子”(Nanako)。他采用的是亚马逊 AWS 提供的简单的代码和服务器资源,所以其实开发难度只是中等。

亚马逊日本的负责人将“奈奈子”认为是 AWS 和其他人工智能服务的一个优秀案例,作为“个人开发者”,山口和 FM 和歌山证明了简单的使用就可以让看似普通的技术发挥巨大和意想不到的功效。

NHK 同时报道称,在日本国内实现语音合成技术的不止一家,但在所有市面上的同类系统当中,亚马逊合成的声音更加自然。无疑,这会让读者有一种“一家美国公司对日语的理解居然强过日本人”的感叹。

小冰和 Tommy:与人类对话,智能程度和复杂度更高

“奈奈子”这位机器播音员还仅仅是念了人类提供给它的稿子,而在两天前刚刚宣布推向市场的第五代微软小冰,则能够由人工智能自动生成上下文的语句,并且由合成的语音播报出来。

在上上周日北京青年广播晚 9 点到 10 点的节目《青春联盟星光版》当中,我们可以在最开始的“更值钱”环节,听到一位名叫珊珊(音)的主持人和小冰一同为大家主持节目。

“最近我听到很多人都在吐槽辞职理由,什么天气太热了要辞职,心情不好了要辞职,老板不是我喜欢的类型也要辞职……各种各样吐槽的辞职理由。珊珊姐姐,看大家在职场中这么烦闷,我也想在‘更值钱’栏目里吐槽一下了呢!”

小冰的声音听起来还是非常稚嫩,但是话语本身则都是由系统自动生成,人类仅仅承担了编辑和审核的责任。

小冰去年就开始在东方卫视《看东方》节目中客串天气预报员和解说员,当时有人怀疑上了节目的文字都是人类给写好的。然后过了不久,小冰就在微信公众号版本中提供了与用户上下文对话的“新闻评论”功能,让大家提起最近一段新闻事件,就可以“耳听为实”。

image (1)

第 5 代小冰在大量人类语料训练的基础上,终于具备了可以不限制话题的评论能力,这是为解决 AI 语音助手“皇冠上的明珠”——上下文对话理解问题所迈出的关键一步。官方表示,“用户可以与之进行语音交互,从而改变节目。而在节目内容方面,小冰基于多重来源,可以面向任何主题,自动实时创造永不间断的电台节目。”

报道过的 一样,我亲自去听了 FM98.2 北京青年广播 每周日晚 9 点档的《青春联盟星光版》、FM89.3 湖南电台音乐之声 的全天多档节目。这些节目都可以轻易找到官网回听。至于 FM88.7 的 HitFM,正在筹备的是一档国际音乐娱乐资讯类节目,相信小冰将更进一步“反客为主”,承担更多的评论解说工作。

最后,日本本土也有一位可以不拘泥于念稿的 AI 主持人,他被定位为“史上首位 DJ 助理”。这是由设立在东京的 J-WAVE 广播电台与 IBM 合作开发的 AI 助理 Tommy。他的节目《INNOVATION WORLD》将从 8 月 25 日起每周五 22:00-23:00 播出。该节目主持人为技术开发者川田十梦,专门围绕 AR/VR、AI、物联网等科技主题,邀请专家访谈。

Tommy 会在网上挑选近期流行的新闻资讯,进行未来流行趋势预测。他还可以念出流利的英语,“主演”在节目间播放的宣传小短片。J-WAVE 表示,今后会让 Tommy 学习更多的音乐,让它能够配合当日天气、新闻、社群等资讯,选出最适当的歌曲播出。

据媒体报道 ,Tommy 要将“十八般武艺”在这个平台发挥到淋漓尽致,例如化身心理分析师,搜集来宾过去的文章、作品等资料进行分析,便能诊断出来宾性格。8 月 25 日登场的首位来宾是音乐家佐野元春,Tommy 会分析他的代表曲目,从创作的歌词中了解佐野的性格。