数据智能体系MANA,助力毫末智行商业化的关键武器。
黑幕、机器人、流动行驶的车辆….今天下午,毫末智行在流动着科技与未来气息的幕布背景下,于线上正式举办“HAOMO AI DAY”,一股浓浓的技术风。
活动现场,毫末智行董事长张凯、CEO顾维灏共同细数了他们近一年来的亮眼成绩单:
1、截至12月用户行驶里程近400万公里;今年第四季度正式上线的智慧领航辅助驾驶系统NOH。 2、截至目前,毫末智行辅助驾驶系统已经搭载至5款量产车辆,并与美团、阿里达摩院就末端无人物流车达成合作等; 3、本月22日,毫末智行完成A轮近10亿元融资,晋升为新的独角兽公司; 4、曝光城市NOH测试视频及2022年上市时间; 5、筹建自动驾驶超算中心。
而最为重磅的,莫过于自动驾驶数据智能体系的MANA(雪湖)的发布。
毫末智行称,该产品为中国首个,并希望借此挑战特斯拉,实现数据智能领先行业。
顾维灏曾在数月前表示:“智能网联的未来就是产品为王、规模制胜。”
那么被寄予厚望的MANA究竟有何本事,能支撑毫末智行对抗特斯拉,保持技术领先行业的野心?
道路数据对于自动驾驶公司而言,或是技术发展的根源,然而各方索取这一资源的过程,注定漫长且艰难。
兰德智库关于自动驾驶汽车的一份评估报告显示,自动驾驶系统若达到量产应用条件,至少需要经过110亿英里的道路验证。对于车队规模较小,资金并不充裕的自动驾驶公司而言,需要数年、甚至数十年才能完成这一目标。
在此情况下,各自动驾驶玩家已经摸索不同的道路数据获取方法,以不断迭代优化自动驾驶技术,譬如通过道路实测,或通过虚拟仿真,抑或收集乘用车行驶数据。
然而,每辆自动驾驶汽车的道路测试平均每日将产生TB级数据,如何在海量数据中高效、低成本提取高质量、对技术迭代切实有效的数据,是不少玩家难以解决的行业性问题。
毫末智行发布的自动驾驶数据智能体系MANA,则针对这一难题,将感知、认知、标注、仿真、计算等多个环节高度融合于一体。
具体而言,MANA整体可划分为VENUS、LUCAS、TARS以及base四个模块,分别对应数据可视化系统、算法应用场景实践、核心算法原型实践以及数据通用能力。
通过将以上功能紧密联系,MANA可有效利用数据,最终提升自动驾驶技术。
为了完成对ZB级数据的获取与计算,雪湖利用毫末智行域控制器小魔盒3.0高达360T的算力,获取大量精准图像数据。数据经过处理之后,搭载于车端的域控制器将立即发挥数据效果,保障数据处理的时效性。
此外,小魔盒3.0可支持10余个摄像头及3个激光雷达,提供多传感器数据。但在数据获取过程中,毫末智行团队经常遭遇多传感器目标被截断,不能有效使用的问题。
为此,他们首先把摄像头和激光雷达的感知中间结果,经过Transformer的多模态融合映射到Tensor Space中。接着加入时序的特征,使用RNN和光流SLAM进行时空融合,在此基础上进行多Head计算,最终其结果可提高目标识别的准确率和精度。
高效识别场景只是其中一部分,如何在不同场景下实现符合人类驾驶习惯的决策规划是众多自动驾驶公司追求的目标。
在自动驾驶汽车行驶过程中,其场景可能包括雨雪天气、黑夜白昼、道路边界是否清晰以及多种交通参与者等多种复杂元素。在同一个道路环境中,即使其中一个元素发生变化,对于自动驾驶系统而言也是新的挑战,这要求着自动驾驶系统保持较高的稳定性及安全性。
另外因习惯差异,不同驾驶员面对同一个场景中会采取不同的处理方式,如果自动驾驶系统的决策无法因人而异,那么将会为不同驾驶习惯的用户带来不良体验。
为了保证产品安全以及道路交通整体安全,毫末智行设计了双推理系统。其中一套推理系统通过场景库内的大量数据学习人类驾驶的规律及方法,进而指导算法迭代。
另一方面,在城市的复杂场景下,人类驾驶规则无法穷举,驾驶风格没有清晰的标准。为了尽可能贴近不同驾驶者的需求,毫末智行将不同驾驶风格数据细分,通过深度学习尽可能实现自动驾驶系统的“千人千面”,提供更舒适的驾驶体验。
通过以上创新,MANA可同时具备对超大数据规模处理、更广泛场景适应性,以及更高的感知认知能力。
道路数据对于自动驾驶公司的重要性不言而喻,但极少公司如毫末智行般投入大量资源构建数据体系。
在毫末智行第三期品牌开放日,顾维灏曾表示,AI 自动驾驶技术的成功依赖于两大关键环节:模型和数据,足够多和足够好的数据是做出好模型的前提。正因如此,毫末智行在过去数月投入大量资源构建自身的数据智能闭环。
所谓数据智能,毫末智行将其解释为数据收集、价值挖掘、价值应用。目前毫末智行已经围绕这三点完成全方位的数据布局。
数据积累方面,毫末智行通过“风车战略”打法,通过大规模的产品落地,从乘用车及末端无人配送车获取大量数据。相较于其它自动驾驶初创公司,毫末智行获取道路数据的成本更为低廉。
具体而言,通过长城汽车旗下大量已售出的量产车型,毫末智行可广泛地收集不同类型的道路数据,且来源稳定可持续,这是毫末智行辅助驾驶系统在极短时间内行程突破400万公里的重要原因。
此外,毫末智行正积极研发末端物流无人车,并将其视为当下自动驾驶技术最易商业化落地的产品之一。从今年4月起先后与美团、阿里达摩院合作至今,毫末智行已量产下线超1000台末端物流无人车。不断提升的末端物流无人车规模,将为毫末智行积累更为丰富的道路数据。
目前,MANA已经将数据感知、认知、标注、仿真、计算等多个环节融为一体,在数据高效利用的同时节省大量成本。
首先,MANA通过明确的系统失效信号,以及更强大的模型进行数据诊断,以便从数亿公里的数据中选取对当前能力有提升的数据。
其次,MANA采用无监督学习将图像向量化为特征向量,通过“谱聚类”将相似的图像聚类。得到聚类结果后,MANA以“是否与问题场景类别相同”作为评判标准,将结果分为正负两种样本,并挑选“类中心”和“类边界”附近的数据提升标注效率。通过此种方式,可以有效提升最终模型的效果。
第三步,MANA将通过双推理系统,对不同空间及时间对数据进行高效挖掘。
最后,MANA采用数据和模型同时并行的混合方案,并优化模型前向计算,可在减少整体显存占用量的同时大幅度提升算法训练的效率。
而价值应用方面,背靠长城汽车这棵大树,毫末智行的解决方案及产品有着毫不缺乏用武之地。
毫末智行预计,2022 年其将承担 34 款长城车型,约占整体待上市车型 80%。未来三年,搭载毫末智行辅助驾驶产品的长城乘用车数量将突破 100 万台。
MANA围绕感知智能、认知智能、标注、仿真、计算等五大能力打造数据智能体系。
正如毫末智行之名源自《老子·道德经·第六十四章》“合抱之木,生于毫末”,MANA的中文名“雪湖”亦有深意。
在刘慈欣的科幻小说《三体》中,外星高等文明三体人因母星濒临崩溃而试图侵占地球,被联合国“面壁计划”选中的面壁者罗辑隐居于山林寻求对抗三体人的方法。在经历多重现实打击后,他不慎坠入寒冷的湖水,却顿悟“黑暗森林”法则,并利用其压制三体人数个世纪。
数据智能体系“雪湖”即取意于此,承载着毫末智行渴望突破数据瓶颈,通往自动驾驶的梦想。
从某种程度上,当前的自动驾驶玩家与《三体》中的地球正处于同一种境况。
书中,人类生活在可能随时遭受三体人打击的恐惧中,而如今各自动驾驶公司,也因未开放的商业变现怀揣着生存忧虑。
此时登场的数据智能体系“雪湖”,或是毫末智行通往商业化的关键武器。
目前,毫末智行已经拥有多种可持续道路数据来源。除了魏牌摩卡、坦克 300等车型之外,其辅助驾驶系统还将应用于魏牌玛奇朵、魏牌拿铁、哈弗神兽三款量产车型。
相对于其它自动驾驶创业公司而言,这一先天优势将帮助毫末智行加速获取道路数据,而“雪湖”推出后,则可将天然的资源优势转化为技术优势。
除此之外,“雪湖”亦是毫末智行试图实现技术领先的跳板。
目前,特斯拉通过已售出的百万辆量产车型的影子模式,在全球不同道路环境中广泛收集数据,通过多种手段提升自动驾驶技术。
相比之下,尽管毫末智行当下搭载的量产车型数量较少,但其合作品牌数量正在不断增加,未来道路数据或将因车型数量增多而成倍增长。此外,来自末端无人物流车的数据也将为毫末智行所用。
毫末智行董事长张凯曾指出,2022年将是AI自动驾驶商业化的分水岭之年,对于自动驾驶行业的初创公司而言,形成相对稳定的商业模式是2022年的立足之本,而可持续低成本的高质量数据,将推动技术发展,进而为商业化提供机会。
针对日后可能呈指数级增长的数据,顾维灏表示毫末智行正在筹建超算中心,以便支持海量视频或图像数据处理,提升自动驾驶技术。
假若毫末智行成功推出超算中心,配合“雪湖”,毫末智行的数据智能体系将更为完整,其数据优势也将因此愈发显著。
在“HAOMO AI DAY”活动中,顾维灏对于2022年的自动驾驶发展作出预判。他认为,毫末智行必须在2022年打赢数据智能技术、辅助驾驶城市场景以及末端物流无人车规模三场战役。
为赢得战役的胜利,他预计2022年毫末智行年的乘用车辅助驾驶项目将扩大7倍,末端物流无人车项目将扩大3倍。
如今,距离张凯所说的“AI自动驾驶商业化的分水岭之年”不足十天,毫末智行在战役临近之际发布MANA,补足数据智能体系的重要一环,似乎体现着毫末智行的研发节奏完全按照其市场预期进行。
更值得注意的是,毫末智行在短短几个月内已先后推出包含辅助驾驶系统NOH、可量产自动驾驶计算平台ICU 3.0等产品,创业公司的产品研发速度极少能如此迅速。
目前,被毫末智行视为制胜关键的数据智能体系已搭建完整。通过长城汽车旗下多款量产车型,毫末智行将获得源源不断高质量的数据。
而近日毫末智行完成A轮近10亿元融资,更将助力其数据智能体系、自动驾驶超算中心加速建设,进一步保持现有技术优势。
随着其高质量数据优势如滚雪球般的迅速扩大,毫末智行或将因此获得2022年三场战役的胜利,成为自动驾驶赛场的最终玩家。