推广 热搜: 终于知道  2022  2023 

特斯拉自研芯片架构难度有多大?

   日期:2022-08-31     浏览:0    
 自研芯片的终极目标是追求可扩展性。
 
目前,特斯拉正专注于从零开始构建相关系统。然而,它不仅在开发自己的人工智能芯片,而且还在开发一台超级计算机。
 
去年AI日,特斯拉发布了Dojo超级计算机,但当时羽翼未丰,只有第一个芯片和训练块。该公司仍在努力构建一个完整的Dojo Exapod。
 
特斯拉还表示,理论上,Dojo ExaPod将是世界上最快的AI训练超级计算机。
 
根据Talpes在本次研讨会上的演示,每个Dojo ExaPod集成了120个训练模块,拥有3000个D1芯片,拥有超过100万个训练节点,计算能力为1.1EFLOP*(每秒千万亿次浮点运算)。
 
预计这台定制的超级计算机将提高特斯拉使用视频数据训练神经网络的能力,它对特斯拉的自动驾驶功能至关重要。
 
 
需要自研芯片来完成一系列构建。
 
Dojo负责训练AI算法,这是特斯拉自研神经网络训练芯片的D1芯片。
 
但去年在特斯拉AIDay上推出的Dojo超级计算机是基于特斯拉开发的D1芯片。
 
特斯拉芯片D1具有以下特点:
 
①2D网状建筑;
 
②具有向量和矩阵计算加速单元的众核架构;
 
③内存-计算一体化架构(近内存计算)。
 
与业界其他芯片相比,同等成本下性能提升4倍,同等能耗下提升1.3倍,占用空间节省5倍。
 
每个DojoExaPod集成了120个训练模块,拥有3000个D1芯片,拥有超过一百万个训练节点,计算能力为1.1EFLOP*(每秒千万亿次浮点运算)。
 
 
Dojo AI系统完全自主开发的专用指令集
 
Dojo是特斯拉开发的超级计算机,可以利用海量视频数据完成【无监督】的标注和训练。
 
本质上,Dojo是由一个完全定制的架构构建的,涵盖了计算、网络、输入/输出(I/O)芯片到指令集架构(ISA)、电力传输、封装和冷却。
 
通常,创业公司希望为每个系统构建一个或几个AI芯片。
 
显然,特斯拉关注的是更大的范围。
 
更令人兴奋的是,它不仅使用商用系统,还构建了自己的芯片和系统。
 
特斯拉Dojo AI系统的开发流程和车载系统类似。特斯拉雇佣研究人员为其开发相关芯片和系统。
 
 
Dojo AI系统采用分布式架构。
 
特斯拉Dojo AI系统采用分布式架构,每个Dojo节点都有自己的CPU、内存和通信接口。
 
每个节点有1.25MB的SRAM,然后每个节点连接到2D电网。
 
Dojo接口处理器位于2D网格的边缘。Dojo接口处理器的每个训练模块有11GB SRAM和160GB共享DRAM。
 
Dojo core有一个整数单元,借用了RISC-V架构的一些指令,还有大量特斯拉自己创建的附加指令。
 
Dojo指令集支持64位标量指令和64 BSIMD指令。它包括用于处理从本地内存到远程内存的数据传输的原语,并支持信号量和屏障约束。
 
这是为了使内存操作符合不仅在D1内核中运行,而且在D1内核的集合中运行的指令。
 
每个Dojo节点都有一个内核,内核是一台成熟的计算机,有CPU专用内存和I/O接口。
 
 
D1是一个超标量内核。
 
D1意味着它在内核中支持指令级并行。就像今天的大多数芯片一样,它甚至有一个多线程设计,通过内核驱动更多的指令。
 
D1处理器架构:每个D1处理器由一个18x20 D1内核组成。每个D1处理器中有354个D1内核。
 
考虑到处理器内核的良率和稳定性,D1处理器由TSMC制造,采用7nm制造工艺,500亿个晶体管,芯片面积645mm
 
这个尺寸比英伟达的A100(826mm)和AMDArcturus(750mm)都要小。
 
但是每个核都是一个完整的CPU,具有矩阵运算能力,计算灵活性远超众核架构GPU,也会带来很高的成本。
 
D1核结构:从18x20阵列中每个D1核的结构来看,每个D1核都是一个具有矢量计算/矩阵计算能力的进程。
 
它具有完整的获取、解码和执行组件。处理器运行频率为2GHz,有四个8x8x4矩阵乘法单元。
 
D1处理器指令集:基于RISC-V ISA。
 
D1有两种标准计算格式,FP32和FP16,以及更适合信息的BFP16。
 
为了提高混合精度计算的性能,D1还采用了8位CFP8格式,以获得更低的精度和更高的吞吐量。
 
D1训练模块架构:每个D1训练模块由5×5 D1芯片阵列排列,以二维网状结构互联。
 
片内跨核SRAM达到了惊人的11GB,是非常典型的近内存计算架构。当然功耗也达到了15kW的惊人指数。
 
每个培训模块外部边缘的40个I/O芯片达到36TB/s的总带宽,或10 TB/s的跨越带宽
 
 
车对车的筹码从来没有这么高过。
 
自动驾驶汽车的制造商开始意识到,在复杂的世界中教授自动驾驶的情况总是在变化,这将需要更多的超级计算。
 
一是因为全球持续两年的“芯片荒”,OEM厂商比以往更加重视供应链安全;
 
第二,因为智能是新能源竞争的必要条件,所以软件定义汽车的时代已经到来。
 
作为第一家跳出Mobileye封闭商业模式的车企,特斯拉早在2016年初就启动了自动驾驶芯片的R&D项目,并于2019年正式在量产车上批量上线。
 
在泰斯拉的推动下,新势力中的头头,如威莱、小鹏和理想,纷纷效仿。
 
2021年,他们公布了自己的自动驾驶芯片自研计划。理想甚至在三个月前就为此在绵阳成立了【理想智动】。
 
今年,自动驾驶芯片【灵芯01】也进入了集成验证阶段,明年第二季度将进行测试。
 

特别提示:本信息由相关企业自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


0相关评论
相关行情
推荐行情
点击排行

网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  苏ICP备19027764号-1