HTS Title Arts

“和歌山市今天将会有高温天气,中暑的风险很高。”在7月31日日本NHK电视台的新闻当中,出现了一位看不见形体的虚拟主持人。名叫“奈奈子”的虚拟主播,在日本和歌山市的一家社区广播电台当中就职,她会在整点时随着音乐的节奏,为大家报告当地新闻以及天气信息。

不仅是“照本宣科”,AI担纲的主持人还可以自己生成内容。前几天发布的第五代微软小冰,和日本广播电台J-WAVE与IBM合作开发的AI助理主持人Tommy,都陆续在今年8月亮相。看来,一些重大的变化正在广播电视业界发生。

“奈奈子”:由电台业余程序员开发而成

我们先来认识一下和歌山“エフエム和歌山”(FM和歌山)广播电台的播音员“奈奈子”。“她”使用亚马逊出品的语音合成技术,发出的日语语音让一般的日本人听来,根本不会有奇怪的感觉。在人手缺乏的深夜、凌晨和灾害时期,都不会有人值守,此时可以由“奈奈子”代为广播已经安排好的稿件

当地报纸《和歌山经济新闻》采访了电台,在拍摄于该电台播音室的截图当中可以一窥“奈奈子”的真身。“她”实际上是用非常简单的一个HTML网页,调用了亚马逊语音技术的API代码。在网页当中有一个文本框,输入一些提前编辑好的信息,点击定时,就可以让“奈奈子”在时间到来的时候自动读出。

image

FM和歌山是一家低成本的社区电台,为社区居民提供应急信息和生活服务。该局的策划负责人山口诚二是“奈奈子”的“父亲”,他是该市土生土长,目前35岁。2004年去美国留学两年后回来,他成为一名软件开发者,在父亲作为理事长的社区电台下工作。

因为FM和歌山的频率是87.7MHz,根据谐音有一个昵称叫“香蕉FM”(Banana),山口给这个虚拟主播起名也是音近的“奈奈子”(Nanako)。他采用的是亚马逊AWS提供的简单的代码和服务器资源,所以其实开发难度只是中等。

亚马逊日本的负责人将“奈奈子”认为是AWS和其他人工智能服务的一个优秀案例,作为“个人开发者”,山口和FM和歌山证明了简单的使用就可以让看似普通的技术发挥巨大和意想不到的功效。

NHK同时报道称,在日本国内实现语音合成技术的不止一家,但在所有市面上的同类系统当中,亚马逊合成的声音更加自然。无疑,这会让读者有一种“一家美国公司对日语的理解居然强过日本人”的感叹。

小冰和Tommy:与人类对话,智能程度和复杂度更高

“奈奈子”这位机器播音员还仅仅是念了人类提供给它的稿子,而在两天前刚刚宣布推向市场的第五代微软小冰,则能够由人工智能自动生成上下文的语句,并且由合成的语音播报出来。

在上上周日北京青年广播晚9点到10点的节目《青春联盟星光版》当中,我们可以在最开始的“更值钱”环节,听到一位名叫珊珊(音)的主持人和小冰一同为大家主持节目。

“最近我听到很多人都在吐槽辞职理由,什么天气太热了要辞职,心情不好了要辞职,老板不是我喜欢的类型也要辞职……各种各样吐槽的辞职理由。珊珊姐姐,看大家在职场中这么烦闷,我也想在‘更值钱’栏目里吐槽一下了呢!”

小冰的声音听起来还是非常稚嫩,但是话语本身则都是由系统自动生成,人类仅仅承担了编辑和审核的责任。

小冰去年就开始在东方卫视《看东方》节目中客串天气预报员和解说员,当时有人怀疑上了节目的文字都是人类给写好的。然后过了不久,小冰就在微信公众号版本中提供了与用户上下文对话的“新闻评论”功能,让大家提起最近一段新闻事件,就可以“耳听为实”。

image (1)

第5代小冰在大量人类语料训练的基础上,终于具备了可以不限制话题的评论能力,这是为解决AI语音助手“皇冠上的明珠”——上下文对话理解问题所迈出的关键一步。官方表示,“用户可以与之进行语音交互,从而改变节目。而在节目内容方面,小冰基于多重来源,可以面向任何主题,自动实时创造永不间断的电台节目。”

报道过的一样,我亲自去听了FM98.2 北京青年广播每周日晚 9 点档的《青春联盟星光版》、FM89.3 湖南电台音乐之声的全天多档节目。这些节目都可以轻易找到官网回听。至于FM88.7 的 HitFM,正在筹备的是一档国际音乐娱乐资讯类节目,相信小冰将更进一步“反客为主”,承担更多的评论解说工作。

最后,日本本土也有一位可以不拘泥于念稿的AI主持人,他被定位为“史上首位DJ助理”。这是由设立在东京的J-WAVE广播电台与IBM合作开发的AI助理Tommy。他的节目《INNOVATION WORLD》将从8月25日起每周五22:00-23:00播出。该节目主持人为技术开发者川田十梦,专门围绕AR/VR、AI、物联网等科技主题,邀请专家访谈。

Tommy 会在网上挑选近期流行的新闻资讯,进行未来流行趋势预测。他还可以念出流利的英语,“主演”在节目间播放的宣传小短片。J-WAVE表示,今后会让Tommy 学习更多的音乐,让它能够配合当日天气、新闻、社群等资讯,选出最适当的歌曲播出。

据媒体报道,Tommy要将“十八般武艺”在这个平台发挥到淋漓尽致,例如化身心理分析师,搜集来宾过去的文章、作品等资料进行分析,便能诊断出来宾性格。8 月25 日登场的首位来宾是音乐家佐野元春,Tommy 会分析他的代表曲目,从创作的歌词中了解佐野的性格。