(图片来源:毫末智行官网)
文/孙越
编辑/Emma
蹭热度,搞话题,车企轻车熟路。Logo上天入地,由实到虚,无处不在:
上过大火箭,也下过基辅号航母;进过实体咖啡店,也进过虚拟元宇宙空间。
概念一个没拉下,这不,ChatGPT概念没来多久,车企便一个赶着一个冲进来:
2月14日,集度首次接入百度文心一言大模型后,16-17日长城、红旗、岚图等车企纷纷涌入,打造基于智能汽车场景的大模型人工智能交互体验。
2月17日,毫末智行宣布自行研发车界的ChatGPT—DriveGPT。
长城则更为嚣张,直接放出ChatGPT安利长城的“软文”。
(ChatGPT对长城汽车看法 图源:汽车综合伦)
蹭热度是车企的一贯作风,蹭完就走的套路屡见不鲜,但短时间内组团冲进来的情况还真少有。
那么,ChatGPT到底能在车企胜任什么岗位,让车企蜂拥而至?车企要为“人才”ChatGPT付多少工资?
01车企正大力引进“人才”
车企正千方百计地引入“人才”ChatGPT:
有想自己全方位打造的:
2月17日,毫末智行宣布自动驾驶认知大模型正式升级为DriveGPT,也就是车界的“ChatGPT”。毫末智行CEO顾维灏表示,此番入局是因为ChatGPT“正中下怀”:ChatGPT技术思路和自动驾驶认知决策的思路一致。先前的人驾自监督认知大模型就是为了让自动驾驶系统能够学习到老司机的优秀开车方法,然后稳定地输出最优解。
(图源:毫末智行官方)
目前,毫末智行已有相关案例表明ChatGPT的应用价值:在掉头、环岛等困难场景中,应用ChatGPT相关技术可将通过率提升30%以上。
除了毫末智行,更多的车企打算向“MCN机构”百度借聘。
首先是百度的“亲生子”集度近水楼台先得月,第一个接入百度文心一言大模型:
2月14日,集度宣布其汽车机器人将融合百度文心一言的全面能力,打造全球首个针对智能汽车场景的大模型人工智能交互体验,支持汽车机器人实现更全面的交流:集度CEO夏一平表示,ChatGPT可能带来的是车内交互效率的提升,交互场景将变得更加全面化。
两天之后,岚图、爱驰、红旗、长城扎堆向百度“要人”,官宣接入百度文心一言,对外说辞与集度“查重率”极高:打造基于智能汽车场景的大模型人工智能交互体验。
一时间,大家的做法是——跟上就对了,管不了差异化的定位。
而在这之中,长城汽车玩得最花。
既有自己旗下生态品牌毫末智行打造车界的ChatGPT——DriveGPT,又接入百度文心一言大模型预推产品,还搞了把明晃晃的营销:长城汽车利用ChatGPT的“官方”回答为自己打广告。
这架势,车企似乎要认真了。
02ChatGPT的CV上能写些什么?
那么,ChatGPT的简历上到底写了啥,让车企一股脑地冲进来?我们不妨为ChatGPT制造一个简略版的CV。
以上是ChatGPT的基本信息,基于ChatGPT特质考虑,ChatGPT大致有两大职业方向:
一是“坐班”,参与到公司的内部管理、内容策划部门之中;
二是“上车”,参与到某些智能板块甚至是更高阶的自动驾驶之中。
24小时待命、工作效率高等常人不能具备的特质,让ChatGPT在“坐班”这类高标准、低创新度等内部管理岗位中,具备较强的竞争力:
例如法务助理岗位,下班时间突发合同纠纷需要快速给出应对措施,24小时待命的ChatGPT能够立即依靠强大的资料库,快速整理出纠纷相对应的所有条例,而下班时间的打工人一是无法随叫随到,二是人工搜索,信息搜集速度慢且未必完全。
并且现阶段,ChatGPT已具备“上岗资质”,在一场司法考试中能够打败83%的人类。
在此基础上,再加上些许“更聪明”的特质,ChatGPT也能在较高创新度的品牌策划岗位,像模像样地整出一套方案。
在网易汽车创立的一次汽车策划项目中,ChatGPT能够完成从命名、Logo、概念车模型、到发布会新闻通稿等文字与图片支持工作:
针对“纯电动车品牌,主打智能化和科技感”需求,ChatGPT对品牌名和Logo给出以下参考(图片借助OpenAI旗下的AI绘画软件DALL·E 2进行Logo绘制)。
(ChatGPT命名及Logo设计 图源:网易汽车)
针对该汽车品牌首场发布会撰写的新闻稿,内容齐活,结构清晰,与市面上的大部分通稿别无二致。
(ChatGPT发布会新闻稿撰写 图源:网易汽车)
而对于ChatGPT“更聪明”这一特质,人们总想着让其参与到更“伟大”的事业之中(也就是目前车企们的愿望):ChatGPT将不会止步于纯文本与纯图片对话,而是能够“上车”成为智能座舱交互助手,甚至参与到自动驾驶之中。
对于“更聪明”这一点,最直接的证据就是——ChatGPT推出仅两个月后,在2023年1月末的月活用户已经突破了1亿,成为史上用户增长速度最快的消费级应用程序,无疑得到了大部分的认可。
故对于汽车智能座舱语音助手这一岗位,ChatGPT相对于其他“小X”们,有着阶段性的领先优势:除了简单的天气、路线、功能问答,也能进行聊天,并且记住用户的驾车习惯,而目前大部分竞争对手进行三-五轮对话后,就忘记之前说过什么。
除此之外,ChatGPT“表示”,自己可以作为车机使用,通过 API 接入自动驾驶系统,为车辆提供语音识别、语音合成、对话处理等功能。
而现阶段,车企们的期待是,ChatGPT能“聪明绝顶”,成为自动驾驶背后的“大脑”,对此ChatGPT也展现出其较大“潜力”:
根据知乎博主我是路头new的实验显示,ChatGPT目前能够完成部分自动驾驶任务,即“和人一样”协助生成自动驾驶模拟场景:
在生产场景时,ChatGPT和大家目前现阶段的场景岁进验证步进穷举方法一致,按照step给了合理公式;
同样也知晓现阶段会产生很多现实不存在的场景,要做动力学和运动学限制。
最后,能够根据自己提出的限制条件,“自发”规划路线、指定超车距离等合理性限制:
(ChatGPT模拟场景构建 图源:知乎博主我是路头new)
也就是说,目前的ChatGPT能够24小时全年无休进行试车场景提取,语义级别仿真场景生成,仿真场景泛化等功能,大大减少其他同事的工作量。
由于目前ChatGPT对汽车领域还“涉世尚浅”,某汽车行业分析师认为其未来能够胜任包括但不限于:
分析大量的驾驶日志数据,以找出驾驶员在特定情境下的行为规律,并用这些信息来训练自动驾驶控制系统,从而提高它们在复杂情境下的决策能力。
为汽车配备智能导航系统,实时分析道路状况,提供最快和最安全的出行方案。
四份简历附件已填写完毕,Boss抛出橄榄枝,ChatGPT便能上岗。
03“人才”ChatGPT,物美价廉?
类ChatGPT们蓄势待发,简历已然放置到Boss面前,车企首先要做的,便是衡量类ChatGPT“值不值”。
对于“坐班”相关岗位,类ChatGPT最具性价比:
优于人类的是,类ChatGPT能够24小时待命并同时处理N倍数据,更高效地、“毫无怨言”地完成dirty work,为公司去去水。
且成本是可控的:百度文心一言收费情况+员工N+1赔偿+类ChatGPT对于算力的耗费。
目前已然有公司“辞旧迎新”:近日,一家新媒体公司的老板发现ChatGPT也能够完成部分文案内容之后,裁掉了内容团队40%的员工。
而对于“上车”相关岗位,类ChatGPT越“聪明”,性价越低:
拿智能座舱语音助手来说,“人才”能为公司实现的价值是,在ChatGPT风口,借助“科技与狠活”吸引更多消费者的青睐从而提振销量。
而在实现过程中,成本较难掌控,除了以上岗位的成本之外,还需要:
更多的人力、物力:不仅需要将文心一言对话模型与智能座舱融为一体,并且还要有差别化地融合。这是因为智能对话交互是智能座舱的亮点,一旦趋同之后,各家在智能座舱层面几乎同质化。
更高的工资:百度文心一言对于智能座舱模块收费要比文本图片信息处理模块收费更高。
如此一来,价值提升有限,隐性成本难以估量。
而对于更高阶的自动驾驶,性价比无法衡量:一念天堂,一念地狱。
先来看看类ChatGPT能够为自动驾驶带来什么价值。
目前,在自动驾驶领域决策规划的实现上,大多数企业都采用基于规则的方式。但基于规则的系统难以应对极端的corner case(想象不到的情况);故需要借助基于强化学习的系统,弥补长尾应用场景。
但该方法论具有致命的弱点。
香港科技大学计算机与工程系主任杨强表示:强化学习缺乏反馈机制,例如AlphaGo下围棋,反馈是直到最后一步才知道输赢。也就是说,出了问题找不到源头,只能不停地投喂数据、迭代更新模型,以“听天由命”的姿态获得期望的输出结果,基于强化学习的决策规划系统也远远未达到成熟。
而ChatGPT利用的人类反馈强化学习(RLHF)技术,能够根据驾驶员的实时反馈做出决策修正:人类司机的每一次接管,都是对自动驾驶策略的一次人为反馈。
也就是说,ChatGPT能够让决策模型“事事有回应”,从而推动模型越来越像一个老司机,这是车企们梦寐以求的。
但再造一个ChatGPT,耗费难以想象:
ChatGPT的成功,依托于算法+数据+算力的共同发力。而单拿数据一项来说,据国盛证券研究所测定,成本耗费就已无法估量:
1)访问阶段:初始投入近十亿美元,单日电费数万美元。
2)训练阶段:公有云下,单次训练约为百万至千万美元。
(GPT-3训练成本估算 图源:国盛证券研究所)
而目前唯一想打造车界ChatGPT的毫末智行,想要达到ChatGPT的水平,在算力、算法、数据上还都有着不少差距:
算力:微软和OpenAI建造的超级计算机有285000个CPU核心和10000 个GPU;据毫末技术副总裁艾锐介绍,毫末智行2023年1月建立的第一期智算中心规格有着超过2000张GPU卡,后续视业务发展速度增加。
算法:为推动模型迅速迭代,OpenAI在人才上下了血本:在第一年花费了近1100万美元,其中超过 700 万美元用于发放工资和其他的员工福利,52位员工,人均13万美元。而在2023年,毫末智行给出的最高年薪差不多是这个数。
数据:GPT-3能够达到1750亿参数规模;而目前毫末DriveGPT参数规模能够对标的是GPT-2水平(17亿)
雪上加霜的是,相比于ChatGPT,车企还要付出的额外成本包括但不限于:ChatGPT目前仅仅是文字交互,汽车需要语音、图片、视频等多模态交互,数据训练成本更高。
毫末智行目前的希望是,模型一致,进阶路线、技术路线一致,且有一定的数据储备:自动驾驶产品量产第一、长城汽车每年百万销量,算力也开始扩建。
同时,对于这一孤军,有两大利好消息:
长城汽车接入了百度文心一言,三月份后,毫末智行能够去学习学习;
近日国内复旦团队已经给出雏形,并将算法开源,能够提供相关指导。
没有相关储备的车企,正依托“MCN”百度力量,大概率会选择让ChatGPT“坐班”,以高性价比路线抢夺ChatGPT风口。
而在三个方面都有些许储备的毫末智行,选择了“上车”,向死而生。
# END #