数据是人工智能算法迭代的基石。
自动驾驶是人工智能技术应用的典型场景,核心竞争将争夺自动驾驶的数据规模和质量。
“经过近三年的发展,现在Mimo已经是中国量产自动驾驶公司第一,数据规模快速增加。”2022年9月13日,Mimo智行CEO顾郝伟在第六届Mimo AI日上宣布。
这一天是Mimo智行成立的第1020天。
顾郝伟认为,参考谷歌发布的AI自然语言处理模型PaLM处理的数据规模,如果注意力模型要广泛应用于自动驾驶领域,所需的数据规模至少需要达到1亿公里的自动驾驶里程。
顾郝伟过去十年的技术发展分为三个阶段:
在自动驾驶1.0时代,硬件驱动是最早的。特征包括自动驾驶里程100万公里,感知主要依靠激光雷达,认知基于人工规则;
自动驾驶2.0时代,近年来采用软件驱动的方式。具有自动驾驶里程1-1亿公里,感知单独依赖传感器输出结果,认知基于人工规则,基于小模型、小数据的技术模式开始出现的特点;
在自动驾驶3.0时代,数据驱动的方式即将发生,并将继续发展。其特征是自动驾驶里程超过1亿公里,感知依赖于多模态传感器联合输出的结果,认知基于离线强化学习提取驾驶知识,技术模式基于大模型、大数据。
对于端,将自动驾驶里程提升至1亿公里,建立基于注意力模型的AI自动驾驶处理模型,是自动驾驶3.0时代的重点。
背靠长城汽车,快速突破1亿公里不难。
我们更看重的是进入3.0时代后,如何利用大模型、大数据加速迭代自动驾驶功能。
如果能利用好大模型,很快就会出现在智力驱动这个维度上超越韦小立的赢家和输家。
在过去的1000天里,你做了什么?
自动驾驶分为渐进式和跃进式,采用渐进式路线,很早就确定了“慢模式”:
(领先的数据智能*稳定的量产能力*安全)生态
在这种模式下,Mimo取得了一系列的成就。
乘用车:
2021年,迷你辅助驾驶系统HPilot版搭载5辆车,规模上万。今年4月,第六型坦克500列装。
目前搭载驾驶辅助系统的车辆涉及威牌、坦克、哈弗、欧拉,今年年底将推出30款。
驾驶辅助用户里程截至今年9月达到1700万公里;
最后,预计到2024年底,列车总数将达到一百万辆。这意味着,届时,长城拥有的汽车基本上都将配备迷你辅助驾驶系统,这对于辅助驾驶用户的行驶里程也将是一个显著的提升。
商用车辆:
在产品层面,末端物流自动配送车线控底盘小魔碟、配送车小魔驼、小曼驴、魔包20等产品。已经推出;
在合作层面,与美团、阿里、吴梅建立合作关系;
订单层面,截至今年9月,小魔驼订单量突破9万单;
末毫还获得了多项第一,如:
法力;,中国首个自动驾驶数据智能系统发布;
中国首款量产感知型城市NOH辅助驾驶系统;
中国首款10万元终端物流自动配送车,小魔驼2.0。
Mimo智行董事长张凯表示,MANA已基本完成数据闭环,城市NOH辅助驾驶系统,即Mimo HPilot3.0已于9月份投入量产。今年预计落地区域覆盖10个城市,2023年我们的计划是HPilot 3.0落地超过100个城市。
此外,经过两代小魔驼的不断迭代,目前小魔驼2.0兼具自动驾驶和并行驾驶能力,为无人接管全流程提供了完整的解决方案。
总之,获得了中国自动驾驶产量第一。
那么,这些成绩背后的核心原因是什么?
在国内车企中,Mimo很早就看到了自动驾驶进入数据驱动的终点,并基于终点观,从一开始就构建了数据智能系统,即MANA。
摩智行CEO顾郝伟表示,自动驾驶的竞争已经进入了主要由数据驱动的3.0时代。
数据的重要性凸显,尤其是在城市高水平智能驾驶的竞争中,城市道路维护、狭窄变道空间等复杂场景得到充分体现。此外,数据还涉及多感知融合、调控策略改进等。
最后,我非常清楚自己的优势和劣势。缺点是起步晚。好处是长城后面有几百万辆车可以量产。在这种情况下,建立数据情报系统成为当务之急。
XEV研究院表示,构建数据智能系统已经成为自动驾驶头部玩家的共识。
构建数据智能系统可以优化就近调控策略,增强用户对辅助技术功能的使用感。远的,积累数据反馈优化感知算法,洞察用户需求更好的定义功能开发才是关键。
收集和处理数据的能力是自动驾驶领域不断进步的核心。
核心的最后,大模型在自动驾驶领域的应用。
在解决了大部分高速场景后,自动驾驶的重心开始向城市场景转移。
顾郝伟透露,城市场景的复杂程度远超最早的预期,比如城市道路经常不定时维护;部分路段挤满大型车辆,堵塞断交严重;周围车辆的行为导致变道空间狭窄,变道困难;经常遇到开门之类的。
解决城市场景问题本质上是解决更大规模的数据处理问题。
一方面,需要将数据规模有效转化为模型效果。
业内常见的方式是监督学习。当遇到更大规模的数据时,样本标注的时间成本和费用成本会变得非常高。
最后一种方式是统一所有的感知任务,然后用未标记的数据对统一的主干进行预训练,再用标记的样本对模型的其余部分进行训练。
谷玮-郝表示,与只使用标记样本的训练相比,骨干的预训练可以提高效率3倍以上,准确率也有显著提高。
另一方面,数据规模增大后,对于庞大数据规模下的自然数据分布,需要保持长尾分布格局。
简单来说,就是在处理头部场景数据的基础上,兼顾腰部和尾部场景数据。
因为深度学习的训练过程就是拟合数据分布的过程,更擅长处理头部场景,而对腰尾场景的处理效果并不好。所以业内普遍的做法是用全量的数据来细化训练模型,但这样做成本高,效率低。
最后一种方法是构建一个增量学习和培训平台。在训练过程中,不再对所有参数进行无差别优化,而是选择“有偏”的参数进行定点优化,动态观察模型的拟合能力,从而及时扩大模型的参数规模。
顾说,与常规方法相比,这种方法可以节省80%以上的计算能力,并增加6倍以上的收敛时间,以达到同样的精度。
不同于常见的由摄像头、激光雷达、高精地图组成的自动驾驶方案,采用了重感知、轻地图的技术路线。
“城市场景下道路环境变化的频率远高于高速场景。如果把地图看成一个传感器,这个传感器的可信度就有些问题了。”顾对说道。
最终的解决方案是使用transformer构建强烈的时空理解能力感,用时间序列Transformer模型在BEV空间构建虚拟实时地图。这样感知车道线的输出会更加准确稳定,对障碍物的判断也会在这个时空变得更加准确。
目前有了实时感知的能力,不需要地图辅助就可以解决模糊复杂的路口和环岛问题。
最后,我们还在升级车上的感知系统,使自动驾驶系统识别城市环境中的交互界面。此外,Mimo还在与阿里巴巴、德清政府合作,借助路侧设备提升城市路口的模拟场景建设效果。
自动驾驶的终极目标是让汽车跑起来更像人类驾驶。
以往业内常用的场景划分和微模型方法,都存在机械过多导致舒适度不足的问题。在论文的最后,我们正在借鉴多模态大模型方法来解决认知问题,使系统的动作更加拟人化。
一般的做法是,深入理解覆盖全国的海量驾驶数据,构建小型自动驾驶场景数据库,基于典型场景挖掘海量驾驶员的实际驾驶行为,构建taskpromt,训练基于时空注意的驾驶决策大型预训练模型,使自动驾驶决策更像人类的实际驾驶行为。
在训练大型模型时,为了提高训练效率,降低训练成本,微型超算中心开始出现。
这个超级计算机中心,类似于特斯拉Dojo,旨在满足数千亿参数的大模型,同时数据规模100万剪辑,整体训练成本可以降低200倍。
总的来说,智能驾驶是1和0的竞争。1指智能驾驶功能,0指可量产搭载的车型。
莫志兴负责1,长城汽车背后的百万销量负责0。
MANA实现数据闭环,高速和城市NOH功能开发完成,末端无人产品出现,意味着Mimo智行基本完成了1。
接下来是功能系统的大规模登船。
自动驾驶数据超出了韦小立的胜负手。
经过1000天的追求,生命尽头的智能驾驶水平终于来到了韦小立的同档。
一个标志是,配备驾驶辅助系统的摩卡激光雷达版本和小鹏P5激光雷达版本可以在第一个量产城市争夺飞行员辅助的称号。
其实Mimo智行和韦小立的智能驾驶风格略有不同。
威立的优势是全栈自研起步早,劣势是量产规模处于起步阶段。米之星的劣势是起步晚,优势是长城后面有几百万辆车可以量产。
为了弥补这个劣势,我追求了1000天,弥补了时差带来的功能差距。
在具体的技术方案上,基于对数据情报系统的重视,Mimo智行和韦小立侧重感知、高精地图和激光雷达的方案有所不同,采取了“重感知,轻地图”的技术路线。这是一条大胆甚至冒险的技术路线。
秉承传统车企的基因,Mimo也具备技术工程能力。
两年结束,不同平台的10多辆车已经投入量产。背后的原因是形成了一套高效的智能驾驶产品开发流程,可以异步开发30个项目。
产品开发完成后,长城大量品牌车型等待搭载,将进一步推动驾驶辅助系统的迭代进化。
综上所述,方向选择正确,推进迅速,使Mimo和韦小立的智能驾驶功能在落地节点上保持一致。接下来,竞争是功能性汽车的规模。
当自动驾驶进入数据驱动的3.0竞争时代,谁积累数据更快,谁就能拔得头筹。
末末和韦小立谁的数据积累更快?
根据蔚来官方数据,截至今年5月21日,蔚来中国用户已使用NIO Pilot行驶超过4.18亿公里,NOP行驶1.57亿公里。
何今年3月透露,小鹏智能驾驶累计里程达到1.4亿公里。
根据理想官方公布的数据,截至今年6月底,理想高速NOA累计行驶里程超过2462万公里,辅助行驶里程超过2.9亿公里。
相比之下,现在的驾驶辅助里程是最少的。但是,接下来,随着长城品牌车辆上辅助驾驶系统的快速安装,辅助驾驶里程翻倍将是必然的。
目前长城汽车年销量在100万辆的水平。按照长城汽车的规划,到2025年要实现全球年销量400万辆。
对于韦小立来说,下一年的销量在9万台左右。到2025年,很难做到长城一样的销量。
销量直接决定了辅助驾驶系统的搭载规模。这一次,韦小立在全栈中的自研和起步早的优势开始被长城汽车的规模优势所取代。
这也是为什么说在智慧驾驶这个维度上,智慧迎来了超越韦小立的拐点。
最终的赢家,也就是自动驾驶数据的多样性和规模化,会在一亿公里后到来。我相信那一天不会太远。