出品 | 虎嗅科技组
作者 | 丸都山
编辑 | 苗正卿
头图 | 《蜂鸟计划》剧照
在见到戴玮之前,我并不相信“乐观主义者”的标签,会与一个岗位频繁调动的人有什么关系。
自2007年加入阿里巴巴,戴玮先后在淘宝、支付宝、OS事业群、阿里文娱等部门任职,并于今年4月正式担任集团旗下的斑马智行CEO。
作为新上任的掌门人,留给戴玮的好消息是,斑马智行这家公司有着极为高光的时刻,因为做出了业内最早的互联网车机系统,一度被视为国内智能座舱行业的黄埔军校;而坏消息是,上一次真正意义上的高光时刻,大概出现在8年前。
“元宝(戴玮花名)在我们内部,属于是专打逆风局的角色”,斑马智行的首席产品官蔡明如此评价道。
但面对如此开局,戴玮也只是面带微笑地表示,“其实也还好。”
“至少从行业来看,现在无所谓‘逆风’,过去技术迭代没那么快时,留给斑马的机会确实比较有限,但眼下新技术所孕育的机会太多了,我们一定要把握住。”戴玮向虎嗅表示。
基于这样的想法,戴玮在接到集团任命后,火速集结了一帮“老哥们”,又拉来了一批技术专家,开始了斑马智行的“二次创业”。
审视过去
在这一轮生成式AI爆发前,斑马智行可谓是“起了个大早,赶了个晚集。”
2016年,YunOS for car,即斑马1.0系统随上汽荣威RX5车型发布,驾驶员通过一句“你好,斑马”的唤醒语,即可通过语音指令完成对车辆的行车导航、娱乐影音、空调车窗等功能的控制。
图片备注:斑马1.0系统的语音操作界面
今时今日,这些功能早已屡见不鲜。但在当时,大多数的车厂根本没有智能座舱的概念,即便是改变世界线的Model 3,此时都没有进入正式量产阶段。
一年后,斑马系统的累计装机量达到了40万,这对于车厂来说已经足够优秀,但阿里的理想远不止如此。
2017年9月,阿里在整合原YunOS移动端业务后,正式推出操作系统AliOS——覆盖汽车、IoT终端、IoT芯片及工业领域,并整合原YunOS移动端业务。在这个庞大的设想中,斑马系统,或者说是这个系统的智能座舱部分,自然也与OS深度绑定。
但问题是,基于一个如此庞大的“物联网”操作系统,原本的斑马系统开始愈发臃肿,尽管OS技术储备不断加深,但斑马智行的产品创新却“肉眼可见地”慢了下来,直到今年“大模型上车”的计划正式加速。
在戴玮、蔡明等人回归斑马后,对公司的业务进行了多次深刻的讨论与梳理,并多次在高管中达成一致:All in AI。
首先公司内部明确的一点是,斑马必须扔掉沉重的包袱。为了让业务更加聚焦,未来只做智能座舱——在此之前,斑马智行秉承着明线发展“智舱”、暗线发展“智驾”的策略。
在蔡明看来,专注于智舱更加符合斑马智行的实际情况,原因在于目前智驾行业内各家的同质化已经比较严重,已经出现价格战趋势,而且智驾方案在卖给厂商后,也没有任何新的商业模式能够带来后向收入。
所以斑马现阶段必须要将资源集中在智舱上,因为智舱与应用的联动可以产生稳定的后向收入,考虑到斑马大部分人在阿里系的背景,他们更加了解生态该如何运营、维护,这属于斑马得天独厚的优势。
另外一点被明确的,就是智舱AI技术与OS的解耦。当然,这并不意味着要与Ali OS割席,而是分化为两条商业路径:
第一种,保持智舱AI技术与AliOS紧耦合,这样做的好处是数据打通能够更加顺畅,但客户相对受限。
另外一种就是对智舱及OS进行解耦,仅保留部分中间件,给客户提供大模型语音及Agent集成的平台体系,甚至是用对话式的小程序上车,无论客户的系统是基于安卓,还是Linux,都不影响智舱AI技术的向上框架。
在明确这两个问题后,戴玮和团队成员开始盘点手中所掌握的资源:较为扎实的OS系统框架、阿里通义大模型的支持、还有自YunOS时代就参与交互设计的团队,以及新“入伙”的一众AI研发人员。
戴玮接手斑马的一个月后,围绕“智能座舱AI技术”的开发工作,按下了加速键。
淘汰APP?
作为YunOS和斑马1.0“高光时刻”的亲历者,戴玮和蔡明并不满足于“让大模型上车”,他们更关心的是如何做出一款“好用的AI 操作平台”。
“智能座舱这事在行业里压根就没有做成。”在蔡明看来,通过装机量、渗透率去评估智舱发展毫无意义,决定生态能够跑通的只有服务数量及用户时长两个指标。
有调研机构曾做过统计,除了地图导航和音乐等少数APP外,在常见的互联网服务中,座舱端的年使用率(一年打开一次即作计数)差不多是全端的三分之一到五分之一。
这说明大多数APP在车上,根本无法触发高频应用,进而让车厂与互联网厂商同时陷入一个尴尬的境地:前者甚至愿意为“应用上车”而付费,这在移动互联网时代是无法想象的;而后者又不愿费时费力地适配应用,去换取车上本就不多的活跃用户。
因此,在斑马的产品开发团队看来,智能座舱AI技术,势必要去APP化,让服务和内容直达用户。
这里还有一个考量就是,APP有着严格规划的操作层级,如果使用传统的触控交互,在行车的过程中操作非常不便,因此在去APP化的同时,尽量使用语音交互,减少非必要的触控。
以上的技术设想,在产品开发的过程中,逐渐转变为两条基准原则:交互变革与服务重塑,并在此基础上开发出一款通用型智能座舱AI技术平台。
尽管斑马在智舱系统上有着不错的“底子”,但按照目标让大模型上车,基本相当于要做一次推到重做。
“就单讲语音,整个语音系统由四段组成,分别是前端声学、ASR(语音识别)、NLU(自然语言理解)、TTS(语音合成),除了第一段外,其他部分都需要用到不同的大模型,有些需要在云端做泛化,还有些则需要彻底的重构。”蔡明向笔者解释道。
图片备注:元神AI的语音展示Demo
而相比于技术问题,更难的其实是工程问题。
“我们之前做测试,可能同样一款车,仅仅是隔音层薄了一些,用户甚至根本感知不到,但语音系统就得全换,而我们还需要在不同的路面、不同的车内环境下做各种调优。”
作为产品和AI的负责人,蔡明为了协调各部门之间的进度,干脆把公司所有的P7职级以上的Leader聚在会议室中,用一整天的时间逐一跟进各部门遇到的问题。
四个月后,斑马智行如期交上了“AI上车”的第一份答卷。
智舱的iPhone时刻?
在前不久举办的云栖大会期间,斑马智行联合通义发布了全新智舱技术品牌“元神AI”。
元神AI基于通义大模型,以自然交流为基础,围绕感知场景、组织服务、认知进化构建AI技术体系,旨在解决传统座舱体验不佳、服务低频的问题。当前已基于英伟达Orin X平台与通义端侧多模态大模型做出了POC(产品概念化验证)。
在发布会现场,斑马智行展示了基于元神AI的典型Agent产品——与钉钉联合打造的“闪记车听”。
基于自然对话,用户可以在车内进行线上会议,拓展功能包括前序会议追溯、弱网参会、对话式摘要、自动设置日程与待办等功能。同时,斑马智行还对硬件配置做了AI算法优化,如阵列式降噪麦克风、头枕播报等。
有处细节是,在现场的展示Demo中,Agent产品大多是阿里巴巴集团旗下的应用,比如大麦、高德等,但是第三方应用愿意向斑马开放接口吗?
对于这个问题,蔡明认为,目前CP(内容提供商)/SP(服务提供商)在移动端或是桌面端的增量早已见顶,他们需要的是有人能够建立出新的场景,而智能汽车就是个很好的场景。
“假设放在几年前,比如之前滴滴、快的争抢市场的那种状态,那我们是无法完成应用聚合的。换句话说,当下做智舱的Agent,最大优势在于各行业也在摸索应用AI化的路径,我们有机会把用户常用的应用聚合在多任务列表里,让用户获得完整的AI体验。”戴玮补充道。
值得一提的是,随着元神AI的发布,斑马智行还为这套系统制定了一个非常有特色的目标,即“100次座舱服务调用不超过1次触控交互”。
与之对应的是,在元神AI智舱平台上,几乎所有的非驾驶操作都通过语音交互完成。
至于这个目标是否符合现在用户的普遍操作习惯?蔡明举了一个例子,在iPhone诞生时,大家都觉得它不符合传统T9键盘的输入方式,但现在不会有人再要求“手机要有打字手感”。
“只要交互体验做得好,用户是完全不会介意交互模式改变的。”在蔡明看来,交互变革和服务重塑,实际上就是在推动智能座舱“iPhone时刻”的到来。