为什么车厂纷纷自研自动驾驶芯片?
2017年11月,领跑汽车与浙江芯昇电子(原浙江大华技术芯片部门)联合研发自动驾驶芯片,名为凌芯01,在2020年10月正式发布该芯片,并搭载于C11车型上。
2020年4月,丰田与电装成立合资公司MIRISE Technologies开发自动驾驶芯片。
2020年10月,吉利旗下亿咖通与ARM成立自动驾驶芯片设计公司芯擎科技。
关于蔚来也有传言要自研自动驾驶芯片,小鹏则已确认涉足芯片自研,并且有望在今年年底或明年年初初流片。
最近大众剧团首席执行官HerbertDiess在接受采访时表示,大众计划自主设计和开发高性能芯片以及所需的软件。
从固有的认知来看,芯片设计通常是一件大投入、长周期、高风险的事。我们来看看华为和小米的芯片研发历程就一目了然。
1991年,华为成立集成电路设计中心,致力于设计生产ASIC;
2004年,华为决定自己做手机芯片,于是将集成电路设计中心改制为海思半导体有限公司;
2009年,海思推出首款移动处理器K3V1,主要面向中低端市场;
2012年,海思推出首款四核处理K3V2,这款芯片采用了1.5GHz主频四核Cortex-A9架构,集成GC4000的GPU,并且使用了40nm的工艺制程。首次用在自家旗舰产品上;
2014年,海思芯片首次采用“麒麟”命名,并推出麒麟910,制程为28nm,GPU换成了Mali450MP4,弥补了前代的短板,另基带采用华为自己的Balong 710,解决了功耗、兼容性等问题。搭载的手机也获得了市场的认可。
至此,华为麒麟芯片走过10年后,才终于成功。
2014年10月,小米与联芯创办了松果电子,采用28nm制程的手机芯片澎湃S1开始立项;
2017年2月,小米正式发布了澎湃S1芯片,并搭载于小米5C手机,市场反响一般;
2021年4月,小米发布ISP芯片澎湃C1,并搭载在最新的折叠屏MIX FOLD手机上。
至此,小米自研手机芯片已经历经7年,但是革命尚未成功。
看完以上的消息,不知道大家会不会有同样的疑问——汽车厂商为什么要纷纷涉足自研芯片呢?
首先来看看特斯拉自研的FSD芯片,为了降低风险和加快开发进度,其中大部分的逻辑,包括CPU(12个A72)、GPU、各种接口、片上网络等都使用经过行业验证的标准IP,仅有神经网络加速器(NPU)由特斯拉的硬件团队完全定制开发的,如图1所示。
另外如特斯拉自动驾驶芯片负责人Pete Bannon所说:他们的芯片只有一个客户——特斯拉,这就很大程度上降低了芯片需求的复杂性。
图1 FSD的 NPU
关于npu,不得不先简单说一下MAC的概念,MCA是英文Multiply Accumulate的缩写,中译为乘积累加运算。MAC运算是将乘法的乘积结果和累加器a的值相加,再存入累加器:
如果没有MAC指令,上述程序可能需要两条指令完成,而MAC只需要一条指令完成。
FSD的NPU的架构如图2所示,相较于CPU,其架构比较简单,主要由计算单元组成,所以设计难度也相应的降低。
图2 NPU架构
影响NPU算力的因素主要有MAC单元数量、运行频率、内存。通常最有效的方法是增加MAC单元的数量。例如FSD中每个NPU有个96x96的MAC矩阵,工作频率为2GHz,32MB SRAM。所以一个NPU的处理能力为96x96x2x2(GHz) = 36.864TOPS,单芯片为72TOPS。而从内存来说主要是内存大小和读取速度会影响算力。
从图1可以看出,NPU占整个芯片的面积很大,也就是说如果需要进一步为了增加算力而增加MAC单元的数量,芯片制程需要进一步升级,增加单位面积的MAC数量。
特斯拉软件在NPU上执行的所有操作的98.1%为卷积,反卷积为1.6%,为了提高性能,NPU合并输出通道中X与Y维度的输出像素,并且多个输出通道采用并行处理,这样可以并行处理96个通道。
为了简化设计并降低功耗,NPU的MAC由8bit的整数乘法和32bit的整数加法组成。另外Pete Bannon认为ICache、Register File、Control逻辑消耗的能量要远比运算消耗的大,所以NPU的设计尽量简化控制逻辑,只做运算相关的,指令集非常简单,相比其他指令集,例如SSE指令集包括了70条指令,NPU只有8条指令:DMA Read、DMA Write、Convolution、Deconvolution、Inner-product、Scale、Eltwidth、Stop,编程模型也非常简单,完成一次运算只需配置4个信息。
通过对特斯拉自研自动驾驶FSD芯片的描述,我们可以整理一下为什么一众车厂为什么纷纷自研自动驾驶芯片:
1、首先汽车厂商自研自动驾驶芯片,其实主要是自研NPU,其他CPU、GPU、接口、片内通信等都是采购标准IP,另外正如特斯拉自动驾驶芯片负责人Pete Bannon所说:他们的芯片只有特斯拉一个客户,这就很大程度上降低了芯片需求的复杂性,所以自研自动驾驶芯片的开发难度相较较小,
2、自研自动驾驶芯片,可以针对自己的算法中计算量的大小,优化硬件,实现软硬件结合的方法提高性能,例如特斯拉采用的X和Y维度的整合,输出并行处理等;
3、当前自动驾驶算法对算力的需求可能因为某些功能的增加出现极大的增加,但是芯片产商的厂商的芯片为了满足通用性,开发周期通常比较长,难以满足需求,而自己开发的话,开发周期可以自主把握,算力需求可以自行设计,无关的通用性接口或者单元可以舍弃,灵活性很高,开发周期更短,功耗也更低。另外由于芯片设计的通用性考虑,势必导致芯片的功耗增加,例如FSD芯片中神经网络处理器部分功耗为15W,而Autopilot2.5版上自动驾驶数据处理单元的功耗为57W;
4、如第三点提到的,由于不考虑通用性,设计相对更简单,成本也更低,Autopilot3.0的成本比Autopilot2.5降低了20%,从而产品竞争力也会增强;
5、在当前缺芯的环境下,长城和蔚来都爆出因缺芯而导致工厂减产或者停产,自主设计自动驾驶芯片可以解决该领域的芯片自给自足问题;
6、一众厂商纷纷宣布自己造芯计划,也可以提高公司的高科技形象,对公司股价、融资应该也有利好。
利好虽然很多,但是芯片量产难,车厂需要生产的芯片量相较于芯片厂商太小,另外当前产能紧张,找不到代工。这可能也是特斯拉在最新的自动驾驶芯片上找博通合作的原因,才能找到台积电代工生成最新一代自动驾驶芯片。
参考资料:
软硬件解耦太难!英伟达竟“越来越像
Mobileye”https://mp.weixin.qq.com/s/FqmnxPMncuYnFM4VN3eNFQ
AI芯片的门槛有多低?
https://mp.weixin.qq.com/s/IxcVhpKfDhq-85pmV-a_HA
https://fuse.wikichip.org/news/2707/inside-teslas-neural-processor-in-the-fsd-chip/
https://www.cnblogs.com/chuqianyu/p/14254702.html
-
汽车测试网V课堂
-
微信公众号
-
汽车测试网手机站
编辑推荐
最新资讯
-
荷兰Zepp氢燃料电池卡车-Europa
2024-12-22 10:13
-
NCACFE -车队油耗经济性报告(2024版)
2024-12-22 10:11
-
R54法规对商用车轮胎的要求(上)
2024-12-22 10:10
-
蔚来ET9数字架构解析
2024-12-22 09:53
-
4G/5G网络新时代的高效紧急呼叫系统NG-eCal
2024-12-20 22:33