不依赖激光雷达、不依赖高精度地图、不依赖大算力芯片,不同于Waymo的技术路径。通过自主研发的快速神经网络INN(Instant Neural Network)采集单目摄像头信息,一辆自动驾驶汽车在经过一周的深度学习后,顺利完成了避让、掉头、红绿灯监测及加减速、紧急刹车,实现了L5级自动驾驶。
上述是电眼科技自动驾驶车辆日常测试情况。电眼科技表示,伴随着神经网络学习时间的加长,这辆自动驾驶汽车将会更加灵活敏捷。
电眼科技,“隐秘而独特”
电眼科技,一个自动驾驶圈子极其隐秘的名字,甚至刻意隐去官方网站,其背后是一个来自剑桥大学人工智能的团队。这家行事低调的自动驾驶公司,却放言在今年年底面向开放道路展开L5级自动驾驶商业化运营。
正对陆家嘴,俯瞰外滩,电眼科技的总部居于上海最核心的黄浦江畔,其自动驾驶车测试场地则位于浦东临港。
其创始人陈硕,在剑桥大学的毕业论文为激光雷达和神经网络结构设计。2009年,陈硕作为2010上海世博会伦敦馆馆长回国。
需要提到的是,2015年,AlphaGo战胜围棋手李世石,人工智能开始得到业界的信任。让陈硕骄傲的是,AlphaGo的背后的灵魂人物正是他的师兄Demis Hassabis。陈硕笑谈:“Demis Hassabis利用人工智能神经网络打造了AlphaGo并战胜了人类,我们则将人工智能神经网络技术应用在无人驾驶领域超越人类司机,剑指L5级无人驾驶。”
过去两年,电眼科技积累了一大批来自英国头部人工智能实验室的人工智能神经网络专家和数据分析专家,同时也吸引了一批来自著名车企一汽、北汽的汽车技术领导者的加入。
在陈硕看来,自动驾驶远比下围棋简单。AlphaGo面对棋局有361(围棋:19x19=361)种选择。而自动驾驶汽车只有四种:左转、右转、油门、刹车。
在资金方面,陈硕从未谈及融资,并直言:“我们比市场上的多数自动驾驶公司都有钱,除非有合适的财务投资人或者战略投资人,我们并不开放融资”。这样的底气在当下的自动驾驶圈子中很难见到。
纯视觉方案+快速神经网络INN胶囊算法神经网络系统
电眼科技采用纯视觉方案+快速神经网络INN胶囊算法神经网络系统,瞄准的是L5级自动驾驶。
特斯拉、Mobileye同样主张摄像头与毫米波雷达的纯视觉技术方案。电眼科技虽然同属这一队列,但又有其特殊之处。没有一颗雷达,其仅利用两个单目摄像头(车头与车尾各一个),及自主架构的快速神经网络INN胶囊算法神经网络系统(Instant Neural Network),并非ADAS,并不依赖道路车道线,直接通过自主学习实现通往L5级自动驾驶。
电眼科技对于自动驾驶有不同的理解与态度,无人驾驶不应该是扫地机器人的升级版本。
“LDS激光雷达扫描,精确检测屋内沟壑。LDS激光雷达以6rv/s的转速进行旋转,同步每秒进行2160次测距,通过激光照射到障碍物后给出的信息精准测距,建立高精地图,实现智能规划清扫路径。
SLAM算法绘制精确地图,清扫更聪明。结合SLAM人工智能算法,同步无人驾驶技术,即时生成房间地图,完成高精度室内定位,并自动规划清扫路线,弓字形逐排清扫,高覆盖度不留死角。多传感器协同,智能避障不伤家具。
通过周身10大类传感器,高度模拟人的判断方式,贴合障碍环绕轻扫,防止蛮横碰撞损坏家具,智能判断窗帘等可通过障碍物,轻扫不留死角。”
以上文案摘自360扫地机器人S6的官方网站宣传,陈硕对这段文案已相当熟悉,并笑谈“有没有感觉很眼熟?”
在电眼科技看来,当下无人驾驶科技本质类似于基于ROS的扫地机器人系统升级版本,通过更贵的激光雷达,更好的算法,更多的传感器实现一个更大的ROS的车辆驱动。
陈硕一笑,“关于人类如何驾驶车辆的理解,也许我们都错了。”
当新智驾对其发问时,陈硕回抛了一个基础哲学问题:“人类驾驶的本质是什么?”
在电眼科技眼中,人类驾驶的本质这一基础学科研究被长期忽略,几乎所有的自动驾驶创业团队都围绕在激光雷达数量、高精地图、超级算力芯片等等军备竞赛,而忽略了对人类是如何驾驶车辆方面的研究。
同市场主流无人驾驶底层逻辑的本质不同,电眼科技认为类人驾驶是自动驾驶的基础与重点。人类驾驶的本质即视网膜看到道路信息,大脑进行算法工作,输出信号控制前后左右、刹车油门。没有多传感器融合,没有下载高精度地图,没有像大算力系统一样记录周边300米外的信息,人类仅根据双眼观察前方视觉画面,控制油门刹车,即使闭上一只眼睛同样可以很好的控制刹车。
在电眼科技看来,纯视觉神经网络较激光雷达更胜一筹。陈硕向新智驾表示,若纯视觉神经网络这一技术批量应用,自动驾驶技术的成本下降幅度将超过50%,甚至免费。
谈起当下的主流视觉方案即通过激光雷达进行视觉感知,陈硕是这方面的早期研究者。2006年,陈硕在英国剑桥大学的毕业论文为《激光雷达对于城市进行数据扫描和神经网络处理》,十二年前这还是一个非常冷僻的话题。
而如今,这位早期的激光雷达研究者却选择通过纯视觉神经网络代替激光雷达。陈硕提到,激光雷达的本质问题在于其采集的物体数据均以距离为参数,没有颜色、没有物体语义。而自动驾驶的要点不在于了解道路上的每个毫米级细节,而是将无关细节全部抽象掉抽取关键结构化信息。
电眼科技仅仅采用两个单目摄像头摄像头进行数据采集,对算力要求大幅度下降,并已实现极低的算力成本。相比于传统无人驾驶上百万的工控机,电眼科技的无人驾驶成本大幅度下降,超过50%。未来电眼科技计划免费向业界提供L5级无人驾驶科技。
谈及L5级自动驾驶,目前业内已经达成共识,L4和L5之间存在着巨大的鸿沟,即如何应对非定义的意外情况。电眼科技表示其自动驾驶方案可适应于非清晰认知系统。因自主研发的快速神经网络INN胶囊算法神经网络系统(Instant Neural Network)可把单目摄像头采集到的数据转化为与人类相似的驾驶决策,INN不基于激光雷达的大规模点云数据,可应对非定义情况,无需基于认知和构建高精度。
陈硕提及Uber自动驾驶撞死行人事故,因各个感知系统融合对于前方突然出现的单车女士定义不明,发生惨状。对比人类驾驶员,同样的驾驶环境下,面对突入而来的物体并不需要基于清晰认知,立刻控制刹车。换而言之,人能够成为自然界最好的驾驶员的原因是其不基于清晰定义来做决策。
基于上述概念,电眼科技INN的高鲁棒性可在不需清晰定义认知物体的情况下,实现驾驶决策,应对更多的未知场景跨越。
新智驾了解到,快速神经网络INN胶囊算法能够在30HZ下生产单帧78.6万像素点的非结构光点云(每秒点云数量2359万),并能实现三维点云矩阵。而Velodyne最高端激光雷达VLS128在10HZ情况下可产生128线的雷达(每秒点云数量960万)。
快速神经网络INN胶囊算法神经网络系统,同样能关联颜色和语义信息。这意味着,不同于激光雷达提供点云的距离和位置,INN能够对于障碍物直接分类(人,车,道路,交通灯等30类),并提供颜色信息(红绿灯等等)。
陈硕表示:“和传统神经网络技术不同,电眼科技能够通过快速神经网络INN胶囊算法系统剑指L5级自动驾驶的关键在于自主研发重构的神经网络能够自动学习,并且能够不断自我进化。”
电眼科技主要通过收集多个司机驾驶策略,并交给INN学习进化。通俗的讲,电眼科技重构了一个有智商,有意识的自动学习大脑,车辆在看到信息,输出信息之间架构起意识和直觉。陈硕表示,目前该神经网络与人类司机在同类情况下做出决策的准确率已经达到98.982%。对比人类驾驶员与电眼科技基于人工智能网络做出的车辆控制决策差距仅1%,而这一数据还在通过学习不断提高。
通过不断的训练,这套类人神经网络系统可通过大量的数据升级驾驶习惯和价值判断,未来其准确率或可提升至99.9999%。
在陈硕看来,基于规则的无人驾驶系统程序员未必是市场上最好的司机,世界上最好的司机是那些在路上跑了20年以上的人,电眼科技的技术通过学习老司机的驾驶技巧,并将其作为自动驾驶进行训练测试的重要数据支撑。同时,电眼科技的自动驾驶汽车也在自主研发的模拟仿真系统中完成数亿公里的训练和仿真测试。
目前多数的无人驾驶公司都在专注于扩充更大的投资,更多的程序员,更贵的传感器和更大的算力,忽略在神经网络结构领域深度积累。电眼科技随着其12年的神经网络架构积累和极其隐秘的作风,走出了一条独特的无人驾驶道路。
无人驾驶不是军备竞赛,是哥德巴赫猜想。在电眼科技看来,不同于百团大战或者网约车大战,可以靠资本军备竞赛烧出来一个巨无霸,无人驾驶的本质是人工智能的科学突破,只有正确的方向,才能解开哥德巴赫猜想,而最后的赢家,未必是资本大鳄。
年底面向开放道路开展L5级自动驾驶运营
在商业化进程方面,电眼科技已经同主机厂合作,在单一城市一次性购买数百辆车,或将组建自有的自动驾驶车队提供载人和送货服务。这一商业模式和Waymo相似。
今年八月,摩根士丹利表示,Waymo的估值高达1750亿美元,其中无人出租车业务估值800亿美元、用于载货的无人驾驶商用车业务估值900亿美元,软件授权服务则在70亿美元左右。可见,出租车和物流车可为自动驾驶带来更大的价值。
这也是电眼科技的商业逻辑,“我们主要通过自身发展为主机厂带来订单,邀请和帮助主机厂踏入L5级无人驾驶的阵营”。
电眼科技向新智驾透露,今底年底前,电眼科技百辆自动驾驶车队或将开上开放道路,面向公众提供L5级自动驾驶运营服务。乘客或可通过相应APP乘坐车辆。前期车上依旧会有安全员进行安全监控。
业内已达成共识,激光雷达是实现更高级别自动驾驶落地的必经之路。纯视觉方案+快速神经网络INN胶囊算法神经网络系统方案能否实现L5级自动驾驶落地仍是未解之谜。电眼科技在年底落地的自动驾驶车队将告诉人们答案。【完】