AI芯片很热,自动驾驶AI芯片更热。英伟达、英特尔、特斯拉、高通、地平线、黑芝麻智能等国内外传统芯片厂、新锐企业纷纷涌入车载AI芯片市场。如今,L2+ADAS自动驾驶商业变现风头正劲,L4高级别自动驾驶落地路线也越来越清晰,毫无疑问,自动驾驶正成为头部芯片企业争相抢占的高地。
从各大厂商的产品路线来看,自动驾驶芯片呈现出GPU、FPGA、ASIC三大架构共荣的格局。然而,底层架构不是判定自动驾驶能力的唯一因素,随着汽车智能化程度的提高,自动驾驶对于软件能力的要求走高,一场“始于硬件”“重于软件”的自动驾驶芯片竞速赛已全面开启。
“CPU+XPU”是自动驾驶芯片设计主流趋势
自动驾驶汽车智能化水平越来越高,需要处理的数据体量越来越大,高精地图、传感器、激光雷达等软硬件设备对计算提出更高要求,具备AI能力的主控芯片成为主流,加速芯片可以提升算力并助推算法的产生。目前,常见的AI加速芯片包括GPU、ASIC、FPGA三类。
盖世汽车研究院高级分析师王显斌向《中国电子报》记者指出,传统车辆普遍使用ECU,底层芯片主要为CPU。自动驾驶 对数据传输实时性要求大,仅靠CPU的算力与功能早已不能满足所需,CPU与GPU、FPGA、ASIC等架构结合形成“CPU+XPU”是自动驾驶芯片设计的主流趋势。
目前主流厂商多以“CPU+XPU”相结合的方式,进行自动驾驶芯片设计。英伟达Xavier和特斯拉FSD采用“CPU+GPU+ASIC”的设计路线,Xavier以GPU为计算核心,主要有4个模块∶CPU、GPU、DeepLearningAccelerator(DLA)和Programmable VisionAccelerator(PVA),其中GPU占据最大面积;特斯拉FSD以NPU(一种ASIC)为计算核心,有三个主要模块:CPU、GPU和 Neural ProcessingUnit(NPU),其中特斯拉自研的NPU占据最大面积,主要用来运行深度神经网络,GPU主要是用来运行deep neural network的post processing部分。
Mobieye EyeQ5和地平线征程系列采用“CPU+ASIC”架构,EyeQ5主要有4个模块:CPU、ComputerVision Processors(CVP)、DeepLearningAccelerator(DLA)和Multithreaded Accelerator(MA)。其中CVP是针对很多传统计算机视觉算法设计的ASIC;地平线自主设计研发了Al专用的ASIC芯片∶Brain Processing Unit(BPU)
Waymo采用“CPU+FPGA”,计算平台采用英特尔Xeon12核以上CPU,搭配Altera的Arria系列FPGA。
三大架构竞速高级别自动驾驶
“GPU擅长图像识别,ASIC、FPGA可以灵活设计,满足定制化需求。”王显斌向《中国电子报》记者表示。
自动驾驶要具备高精度、高可靠性的图像识别能力,GPU的设计初衷是为了应对图像处理中需要的大规模并行计算,刚好契合自动驾驶的关键技术要求。英伟达在GPU领域拥有长期积累的技术和市场,进入自动驾驶赛道后,携其GPU迅速占领市场,合作伙伴囊括奔驰、沃尔沃、现代、奥迪等传统车厂,蔚来、理想、小鹏、上汽这些造车新势也在使用英伟达的自动驾驶芯片。
今年8月,英伟达推出最新自动驾驶芯片组——DRIVE Atlan。据介绍,Atlan单颗芯片的算力能够达到1000 TOPS,将应用于L4及L5级别自动驾驶。英伟达CEO黄仁勋公开表示,Atlan SoC将于2023年向开发者提供样品,2025年大量装车。王显斌指出,未来自动驾驶芯片会出现更多多元化架构GPU,高精地图、传感器、激光雷达等对图像识别能力要求越来越高,GPU的需求量会越来越大。
特斯拉采用了与英伟达相似的设计路线,不过更加侧重于ASIC。今年8月,马斯克在2021年特斯拉(TSLA.US)AI Day上,向外界展示了一款自研芯片云端Dojo。Dojo的训练CPU属于ASIC芯片,专注于人工智能训练,可以实现1024 GFLOPS的BF16算力。特斯拉表示,它的效率超过了现有的GPU和TPU,可以大幅度优化算法提升的效率,为L4、L5级别的自动驾驶做铺垫。特斯拉Dojo在云端模拟了一个十分贴近现实的世界,用来训练自动辅助驾驶技术。