12 月 10 日,实时互动云服务开创者及引领者声网 Agora 在北京发布了首款定义轻互动直播场景的 “极速直播” 与可降低 50% 直播带宽成本的 “低码高清” 两大新产品,同时声网还对面向智能硬件、VR/AR 等自编解场景的 “实时码流加速产品-RTSA” 进行全新升级。

极速直播:定义低延时、强同步的 “轻互动” 直播场景

直播已成为当下主流的社交与媒介方式,并为社交、游戏、电商等行业带来了更多创造力。来自艾媒咨询的报告显示,预计至 2020 年度,中国在线直播用户将达 5.26 亿,中国直播电商市场规模将达 9610 亿元,同时 2020 年前三季度新增近 2.5 万家与直播相关的企业,较去年同步增长 565.32%。随着直播+场景的爆发,低延时、强同步、低带宽等已成为直播平台提升用户体验、优化成本的关键技术因素。

声网 Agora 教育行业、极速直播产品负责人仇媛媛表示,根据实时互动的强弱程度以及对延时的不同要求,声网将互动体验分为四个级别:强互动、中互动、轻互动、弱互动。

  • 强互动: 延时小于 400ms,属于全实时互动,对(可感知)延时的容忍度为零,如全程需要通过音视频进行实时互动、连麦或会议的场景。
  • 中互动: 延时在 400-800ms 之间,属于超低延时互动直播,对延时容忍度较低,观众需要与主播保持较强同步性,随时需要与主播连麦的场景。
  • 轻互动: 延时在 800ms-3s 之间,属于低延时直播,观众可承受一定延时,但是主播需要根据情况及时回应观众文字/弹幕/打赏等信息,或有低频连麦需求的场景,
  • 弱互动: 延时在 3s 以上,属于 CDN 高延时直播,主要以文字/弹幕作为互动手段,没有主播或主播无需与观众进行互动的,对延时没有要求的场景。

声网 Agora 教育行业、极速直播产品负责人仇媛媛

目前直播市场主流的直播解决方案主要集中在以声网互动直播为代表的 “中互动” 直播方案,以及传统 CDN 直播的 “弱互动” 直播方案。声网 Agora 此次推出的极速直播填补了轻互动的直播方案空白。

声网 Agora 极速直播开创了低延时、强同步的” 轻互动” 直播场景,并支持连麦。极速直播主要面向对文字、白板等消息互动的延时要求较高,或有低频音视频互动需求的直播场景,主播与观众端延时在 1.5s-2s 之间,相比传统 CDN 直播方案延时降低 80% 以上,同时直播间内 90% 的观众与观众间延时差异小于 500ms,可满足电商直播、教育大班课、直播答题等观众需要强同步场景的需求。

仇媛媛表示,在教育大班课场景中,极速直播可以有效提升教学体验,增加用户转化,采用低延时大班课,老师端的音视频流、白板内容可以快速同步到学生端,学生也可以上线与老师连麦互动、极大提升教学体验和学生学习效率。低延时、强同步可以助力大班课提供抢答、抢积分、分组 PK 等教学新玩法。

而在电商直播的场景,极速直播可以提升电商直播用户转化率和 GMV,来自电商直播行业的数据显示,采用低延时直播对电商直播的成交有明显的促进作用,其中 UV 转化率提升 4%,GMV 提升 5%。例如用户通过文字消息咨询商品信息,主播因为延时高无法及时解答,会导致用户的留存降低。电商直播中设置促销抢购、商品秒杀、抢红包等活动可以起到重要的引流作用,而这类活动对直播延时要求极高,而强同步性可以保证所有观众享受公平、一致的活动体验。

声网 Agora 为极速直播提供大频道监测工具,为观众数量较多的大频道提供实时质量监控和分析功能,可以实时监测直播间内每位观众每分钟的直播体验,针对用户最关心的 20+ 指标实时监测分析,极大提升直播平台大频道运营效率。

此外,声网还为极速直播提供可量化、可查证、可赔付的 XLA 体验质量保证,覆盖 5s 登录成功率、600ms 视频卡顿率、200ms 音频卡顿率等多个维度,一旦体验质量指标不达标,声网将为客户提供赔付,实现让实时互动从 “可用” 走向 “好用”,让 “好用” 成为 “标准”。

低码高清:同等画质降低 50% 视频码率,节省直播带宽成本

在直播平台用户规模快速增长的背后,直播 CDN 带宽成本居高不下已成为直播平台成本优化的一大痛点,来自某头部直播平台的公开财报显示,该平台单季度直播带宽成本超过 2 亿元人民币,带宽成本高是直播平台普遍存在的问题,各大直播平台也一直在寻找降低直播带宽成本的最优方案。

声网 Agora 泛娱乐行业、低码高清产品负责人王奇表示,基于传统的视频编解码方案,降低视频码率势必要以牺牲画质为代价,而声网基于对视频编解码多年的技术积累和深度理解,推出了低码高清产品服务,针对 CDN 直播场景,可以在保证主观画质不变的情况下,降低 50% 视频码率,帮助直播平台有效降低成本。

声网低码高清通过融合 PVC(感知视频编码)、智能码控、ROI(感兴趣区域视频编码)等多种 AI 和深度学习算法,在服务端对实时媒体流进行转码处理,可实现同等画质下,大幅降低 CDN 直播视频码率,节省带宽成本。王奇表示,低码高清适用于秀场直播、电商直播、教育大班课等多种场景,以秀场直播为例,直播平台通过声网的低码高清服务,可以准确识别主播轮廓,对主播和背景做差异化编码处理,自适应调整码率分配权重,节省码率的同时提升用户视觉体验。而在教育大班课场景中,低码高清可以实时跟踪老师动作和白板内容变化,通过深度学习进行内容预测分析,实现自适应码率控制,降低传输所需带宽。

声网 Agora 泛娱乐行业、低码高清产品负责人王奇

在单主播直播场景中,主播端在开启直播后,只需通过声网低码高清服务对视频进行转码处理,再推流至 CDN 服务器分发,最终传输到观众端,在主观画质不变的情况下,实现视频码率的大幅降低,并帮助直播平台有效降低带宽成本。

对直播平台而言,低码高清的使用极为简单,无需改变原有集成方式,只更换推流地址即可使用,同时声网低码高清也兼容主流 CDN 厂商,无需针对每家厂商进行个性化适配。

 

RTSA:实现物联网智能硬件互联互通

根据 Analytics 数据显示,截至 2020 年上半年,全球的物联网连接数已经达到了 117 亿,历史上首次超过非物联网连接数。随着 5G 基础设施的逐渐完善、智能终端设备的不断普及以及云 VR、云手机等新应用场景的涌现,实时音视频成为物联网人机交互的重要方式,然而物联网领域基于音视频的互联互通也面临着诸多挑战,例如生态割裂兼容难全面,不同厂家设备之间的互联互通和互可操作性差的问题,就像是一只站在物联网 “房间里的大象”,一直被行业忽略;传统物联网音视频传输 P2P 为主,实时互动体验难保障。

针对这些问题,声网在媒体沟通会中正式发布全新升级的 RTSA-实时码流加速产品,升级后的 RTSA 分为 RTSA Lite 与 RTSA Pro 两大系列,其中 RTSA Lite 面向资源有限的轻量级设备,拥有极小包体、超低功耗、低延时、抗弱网等特性,覆盖平台主要有 Linux 全平台以及 RTOS 平台,适用场景主要包含智能手表、智能摄像头、智能音箱等穿戴式、便携式的智能设备。RTSA Pro 则面向体验优先、资源丰富的设备,覆盖 Linux、Android、Windows 等平台,适用场景为无人车、无人机、智能机器人等。

声网 Agora IoT 行业产品负责人侯云忆在会上表示,RTSA 依托声网的实时互动产品体系,又有别于之。RTSA 把编解码的灵活性释放给设备端,支持客户充分利用硬件的优势进行自定义码流。在传输层,RTSA 继承 SD-RTN™,运用全球全网节点 、智能动态路由以及端侧弱网对抗算法,提供高联通性、低延时、高稳定性的音视频码流传输云服务,配合低延时,高可靠的信令通道,助力开发者在任意设备与场景中开启实时互动能力。

声网 Agora IoT 产品负责人侯云忆

依托声网自建的软件定义实时网 SD-RTN™,声网 RTSA 主要面向智能硬件、云游戏、AR、VR 等行业的自编解场景,赋能低延时、抗弱网、高可靠的实时音视频传输和信令控制能力。

例如在智能手表领域,声网与小天才智能手表合作,推出全球首个可以跑在 RTOS 上,并且成功商业化的实时音视频 SDK,实现了业界最小的 Full-featured RTC,包体积 300K,内存占用 2MB,CPU 占用 30MIPS,适合超低功耗、快速启动、成本敏感的 IoT 场景。

面向未来,侯云忆也表示,基础技术设施的不断完善与成熟,将会推动物联网硬件越来越智能化,普及率也会不断提升,届时对 RTSA 的低功耗、低延时、抗弱网等特性也会提出更高的要求,声网作为专业的实时音视频技术服务商也会不断精进自身的技术,为开发者与客户提供更契合市场发展与用户体验的实时互动解决方案。