Rokid 式高级出击:低调、执拗、蛰伏,而后傲娇、共享、爆破

    编者按:本文来自于微信公众号 “锌财经”(微信公众号:xincaijing), 动点科技经授权发布。

    如果在国内找一家公司来承载你们的梦想和希望,你们会选 BAT,还是 Rokid?

    ——Misa

    人和科技之间巨大 GAP 的弥补者

    Hey,Welcome to the Rokid Jungle!

    依旧是 T 恤、牛仔裤搭配棕色皮带,只不过把日常的小皮靴换成了黑色运动鞋,Misa 走上台,霸气开场。

    这是锌财经潘越飞 4 年来与 Misa 的第 N 次接触,却是第一次坐在台下,看着 Misa 将 Rokid4 年来的成长,一一细数。

    这场准备了 4 年的发布会,对 Misa 来说,是 Google IO+WWDC,是垂直标杆产品+水平开放平台。而 2 小时内,由坐在全场最左侧的 Rokid 团队频频引爆的掌声和欢呼声,也证明着这的确是一场长期与低调蛰伏之后的猛烈出击。

    时隔 4 年的 Rokid 发布会

    “成立 Rokid 之初,我们团队在咖啡馆里讨论未来,那时的 AI 并不像现在这么热门,投资人、市场、用户,几乎没谁能预料未来两年内,AI 将会发生什么样的变革,将会怎样影响每个人的生活。而那时候的 Rokid,就已经下定决心要做这个方向的事了。”台上,Misa 回忆。

    这段经历曾在非公开场合被他反复提起,大部分人听后,都认定是由于对技术的极度敏感,让他们走在了行业的最前端,但他们不知道的是,这样一个简单决定的背后,其实有更深刻的逻辑思考:

    在信息技术时代到来之前,掌握技术的人和无法掌握技术的人(比如一个农夫和一个工匠)之间,只是分工不同,他们对社会的适应能力没有根本性的差别。但在信息科技革命之后,这样的局面发生了巨大的变化。PC 互联网时代,移动互联网时代……直到今天,出现的每一家伟大的科技公司,基本上都在解决一个问题——人与科技之间的关系。

    在 Misa 眼中,Rokid 担当的,正是人和科技之间巨大 GAP 的弥补者,从成立之初一直在探索人与科技之间的交互方式。第一代产品 Rokid Alien,把当时最先进的麦克风阵列、无边界显示、1300 万摄像头等一股脑地塞进音箱里,使命就是用这样极端的尝试去探索结果。之后的 Pebble、Mini、Me,则是在相对高价位的前提下,将智能音箱由 Home  AI 落到了 Portable  AI。

    Rokid Me 设计图

    “在设计 Pebble 时,我们就非常清楚,不久的将来,国内或国际上的大颚一定会以低价的方式进入市场,但我们有自己的执着。”Misa 说。

    4 年前,大家很难去定义 Rokid Alien 这样的新生物,其过高的售价,将试图接近的人拒之门外。4 年后,智能音箱的价格已被压低至百元以内,但是,新发布的 Rokid Me 仍坚持 799 的高价。

    “Rokid 不会降价,我们想要的,只是把体验、品质、服务做得更好,最后,把这些东西提供给消费者、市场,而不是用非常 low 的材料,非常糟糕的设计,非常差的品质,凑合着做。”对此,一直以来,Misa 都有自己的坚持。

    这或许和 Rokid 的 DNA 有关:纵向思考怎么把一件事做到极致,品质、技术、工艺,各方面都展示出足够的能力。表现在 Rokid Me 上,就是将麦克风和扬声器的距离做到不足 1cm,用航空铝确保机身不变形,保证音质、识别准确性、反应灵敏性的同时,没有入侵感,具有把玩性。

    而 Misa 希望扮演的,也是行业的开拓者。其实,音响这个战场已经畸形,有那么多公司推出一个又一个体验极差的垃圾产品,每天惶恐着速度不快就会被这个时代抛弃。而 Misa 想做的,是让整个市场幡然顿悟:哦,原来产品可以做成这样。

    Rokid Me 架构拆分图

    “我们没有交互生态的野心,如果一定要有,就说有傻乎乎坚持的初心吧。”今天凌晨 4 点,Misa 在朋友圈发布动态,并指明一家公司比倒闭更惨的结局就是,按部就班高效精确地制造垃圾。

    Rokid 的气质,像极了 Misa 本人,有怪诞的坚持、强迫症般的执拗,独特而凛然。

    硬件没有黑魔法

    过去 4 年,Rokid 被贴上很多标签:一家小众的公司,一群很酷的人,做了面向未来的产品……

    Misa 说,这背后的支撑,在于公司成立的第一年就在北京成立了 AI-Lab,做语音语义交互技术研究;第二年就在美国成立 R-Lab,做语音技术之外的人机交互技术研究,包括显示技术、摄像头、计算机视觉、人体传感、化学材料等。

    然而,Rokid 不是一家智能音箱公司,而是基于 AI 的人机交互公司,这样的定位,直到今年年初 Rokid Glass Alpha 被摆上 CES 展台,并拿下最佳穿戴设备、科技创造美好生活两项大奖那一刻,才有人开始相信。

    锌财经曾判断 Rokid 是国内智音箱市场的开拓者,如今,它也成了将智能 AR 眼镜由 PPT 概念,落地为一体化产品的第一家公司。

    Rokid Glass 产品图

    “在 CES 现场,Rokid 是排队最长的一个展台,没有之一。”Misa 说,这与此前质疑说“谈及 Rokid Glass 要上市的可能性,你自己心里没点逼数吗?”的直白观点,截然相反。

    对此,他们的团队曾做过一次调查,得到的反馈大都是:虽然样子非常原始,甚至有点丑陋不堪,但这是第一款像 Glass 的 Glass,以前的 Glass 应该是叫 AR 头盔才对。THE  VERGE 更是直言:从 Rokid  Glass 看到了未来。

    Misa & Rokid Glass

    “基于 CES 上 1000 多位用户试戴的反馈,以及之前通过 Rokid Alien 完成的脸部体态、环境的识别,我们推出的 Rokid Glass 正式版,无疑是爆炸级的。”会后,一位 Rokid 团队研发人员告诉锌财经潘越飞,言语之中透露的兴奋,不言而喻。

    他说,在国内,做 AR 头盔都还在瓶颈期。而在全球,被视作“下一代移动产品”的 Google Glass,因为发热、待机时间过短等工业短板遭遇陨落,备受追捧的 Magic Leap,也还没将产品做到消费级。

    所谓的爆炸级,在于 ALL IN ONE:采用单镜片 AR 光学技术,光效率较传统方式提升 50%;分辨率 1280*960,刷新率 60fps,视觉相当于 5 米以外的 110 寸电视;用合金边框取代之前的塑料材质,让散热性能提升;适应 90% 以上用户的头型和瞳距;使用时间超 6 小时,待机时间超 60 小时:整机重量仅为 120g,相当于一副太阳眼镜……

    Rokid Glass 量产版设计图和产品图

    对于未来布局,Misa 说:今年量产没有悬念,量产产品比 Jungle 发布的还要惊喜;订单已被大的项目方预定,需要合作的朋友要早点确定需求预定产能;个人购买短期不会来访,不过,今年会在线下 Rokid 核心销售网点开放体验。

    硬件没有黑魔法。坚持 AI powerd AR 的 ROKID Glass 从其原始设计、光学设计、视觉算法、操作系统、UI 设计、软件开发,全是自主研发,从手稿到样品,整整走了两年。而在镜腿增加了新的 Touch Pad 和两个物理按键,支持左右滑动及点击操作;搭载智能语音助手和麦克风阵列,也让语音交互更为流畅的 Rokid Glass,已经成了最符合 Misa 对 Personal AI 设想的产品。

    但这,只是 Rokid 团队的探索之一。据公司内部人员透露,他们已将公司累积的 AI 技术分为 100 多个小场景,对外展示的之后 8 个,包括室内反射技术、拾音寻向技术、视频运动估计、手势识别和跟踪等。

    以 Rokid 美国硅谷 R-Lab 心血来潮时,研发的“看穿你的心跳”为例,通过视频运动估计及信号处理,能够捕捉到肉眼看不到的细微变化,并将结果以图像化的形式表现出来。这样的技术,已有公司专门研发,而在 Rokid,不过是一次尝试。

    “看穿你的心跳”现场体验

    “Jungle 本身的含义,就在于探索。”会后接受采访时,Misa 说,他还是曾经的那个极客,那个会讲故事、适合站在前台、不甘于沉默的技术宅。至今,他还总是在说出重量级话语前,低头沉思,就像四年来的蛰伏。

    是人机交互公司,也可能是 OS 公司

    “语音的公司,不做芯片,必死无疑。” 云之声 COO 黄伟在发布了自家打造的 AI 芯片后,曾这样说。对此,Misa 也表示,现在顶级公司都在做芯片,背后的逻辑很简单:计算力和成本,不用芯片,很难达到平衡。

    举个例子,为了实现操作的流畅性,Pebble 用了高通的芯片,但目前 Rokid 的计算力要求是高通芯片的 2 倍以上,这就意味着,要卖到 1500 块钱才能达到 Rokid Me 同等的体验。

    “而且 AI 是典型的赋能型技术,当你完整地打磨好一个产品之后,人力一定是过剩的。这里面有大量的能力可以以边际成本接近 0 的方式,嫁接到其他产业上去。”Misa 再次低头沉思,随后说出这样一句论断。

    探索开放的逻辑,或许就源于此。

    但多数芯片公司,都是从产业链上端控制市场,这需要本身有足够大的优势,去撬动产业链,撬动前后端,这样的优势不是一家创业公司能有的。对此,Misa 的界定是:不卖芯片,卖解决方案,过去 4 年的经验,全部给你。

    “现在的芯片,和过去我们理解的芯片不太一样。现在的芯片基本是 SOC,里面有 90% 的东西是成熟的,是 Rokid 没必要花精力去做的。”Misa 说,他和国芯合作的特别之处就在于,是从 OS,到整个的算法层面、编辑优化层面,全部由 Rokid 提供。

    Misa 宣布发布 AI 芯片:KAMINO18

    由此推出的只比一元硬币大一点的 KAMINO18,搭载了 Alexa 和喜马拉雅所有的能力,也集成了一个系统所需的绝大多数功能,人机交互概念被倾注的很完整。其中最核心的 NPU 部分,可以同时对不同模型进行并行运算处理。芯片内置强大的 DSP,可以实现回声消除、自动增音控制、降噪等复杂处理。

    而相比于通用芯片,KAMINO18 能够在提高性能的同时,实现功耗降低 50% 以上,集成度提高 30% 以上,成本降低 30% 以上,完全解决了传统芯片行业长期面临的集成度低、功耗大、成本高的痛点。在发布前,KAMINO18 就已有百万级销量,而不是停留在 PPT 上的一个概念。

    至于下一代芯片,非常重要的一点,是把视觉加进去。但 Misa 说,Rokid 的风格是没做出来绝对不提,所以这点,在发布会上没被公开。

    KAMINO18 芯片

    “而且,Rokid 不想做独角兽,如果媒体和投资人把我们当成独角兽,我们就会被逼着去达到独角兽该具备的能力,比如营收。但 Rokid 现在还在探索,我们不知道哪条路是最好的。”Misa 强调。他更想做的,是搭建社区组织者,通过产品影响市场,同时进行方案输出,不是跑在前头,抢最热的钱。

    他说,他所强调的社区,和平台不是一个概念。平台更像是我搭台,你唱戏,收租金。而社区的组织者,则是抱着开放的的态度,把现有的东西开放给大家,一起搭台,一起唱戏。平台的一个基本观点是:我相信我比你考虑的周全,社区的一个基本观念是:我相信你比我考虑的周全。

    在国内,这种文化差异没有很被强调,大公司也都是控制的逻辑:在我的平台上,要按照我的规矩来。但他们提供的解决方案,没有一个是完整且漂亮的。相反,Misa 应该相信一些专业的,接触一线的客户的经验和需求,所以要赋能其他人去做这件事。很多人突然转而和 Rokid 合作的原因,就是看到了这一点。

    线路拆解图

    在中国,已有两三百万人尝鲜过智能音箱,其中几十万台来自 Rokid。整个 AI 音箱生态里,已经有一半和 Rokid 发生了关系,而且都是比较头部的公司。基于此,Rokid 开放生态的的收入结构,短期来自产品,长期来自生态,中间需要有两到三年的转型期。

    而对 Rokid 的未来,除了反复提及的人机交互,Misa 还有更多设想:

    “在 PC 时代,OS 是 Windows;在 Smart Mobile 时代,OS 就 Andriod、Apple;在 AI 时代,没有多少企业敢去做 OS,Rokid 在 AI 行业里‘玩’了 4 年,是时间尝试去做了。”

    初创公司报道

    如何才能体现你的养生意识?敷着最贵的面膜,熬着最长的夜;滴着最贵的眼药水,在深夜中刷手机。当代年轻人的养生生活真是一言难尽。