AI算力TOPS和CPU算力DMIPS

根据地平线数据,

L2级自动驾驶的算力需求为2-2.5TOPS,

L3级自动驾驶算力需求为20-30TOPS,

L4级自动驾驶算力需求为200TOPS以上,

L5级自动驾驶算力需求为2000TOPS以上。

厂商 智驾芯片 AI算力TOPS(INT8) 量产时间
华为 MDC810 400 2022
华为 MDC610 200 2022
英伟达 Orin 254 2019
英伟达 Xavier 30 2020
特斯拉 FSD 1.0 72 2019
特斯拉 FSD 2.0 预估400-500 2023
地平线 征程5 128 2022
黑芝麻 A1000 Pro 106 2022
Mobileye EyeQ5 24 2021
车型 智驾芯片 AI算力TOPS 座舱芯片 CPU算力DMIPS GPU算力TFLOPS AI算力TOPS
阿维塔12 华为MDC810 400 麒麟9610A? 200k / 30?
问界M7智驾 华为MDC610 200 麒麟990A? 80k 768 3.5
蔚来ET7 NIVIDA Orin-X *4 1016 高通8155 85k 1142 4
小鹏G9 NIVIDA Orin-X *2 508 高通8155 85k 1142 4
理想L9 Max NIVIDA Orin-X *2 508 高通8155 85k 1142 4
理想L9 Pro 地平线征程5 128 高通8155 85k 1142 4
特斯拉Model3 FSD *2 144 AMD Ryzen / / /
极越01 NIVIDA Orin-X *2 508 高通8295 220k >3000 30

AI算力单位TOPS

TOPS (Tera Operations Per Second),表示每秒执行1万亿次(10^12)运算,用于衡量自动驾驶芯片的AI算力。准确点讲,TOPS描述的是芯片乘积累加运算的运算能力。注意,TOPS并没有指定数据类型,具体算力评估需要结合数据类型及精度。TOPS不是衡量处理器的唯一标准,实际应用中还需要考虑处理器的功耗、内存带宽、存储容量等。

乘积累加运算MAC: 乘积累加运算(Multiply Accumulate,MAC)包括相乘和相加两个过程(a←a+b*c),实现该运算的专门硬件电路单元,被称为“乘数累加器”。这样用一个MAC指令就可以完成原来两个指令的操作。对于卷积运算、点积运算、矩阵运算、数字滤波器运算、乃至多项式的求值等运算而言,MAC指令可以大幅提高运算效率。如自动驾驶深度学习等算法的核心运算就是矩阵运算,矩阵运算可以分解为数个MAC运算,从而提升效率。

CPU算力单位DMIPS

MIPS, Million Instructions Per Second的缩写,每秒处理的百万级的机器语言instructions。这是衡量处理速度的一个指标。比如一个Intel 80386 电脑可以每秒处理3 million到5 million机器语言指令,那么我们就说80386是3~5MIPS的CPU。MIPS只是衡量CPU性能的指标。注意:这里的instructions指的是任意类型的,可能有取数据、译码、decimal numbers相关等。

计算MIPS的方法如下:

  1. 首先,确定在一个特定时间段内处理器执行的总指令数(例如1秒内)。

  2. 将总指令数除以1,000,000(即1百万),得到每秒钟能够执行的指令数,即MIPS值。

举例说明:

假设一个处理器在1秒钟内执行了总共500,000条指令,那么它的MIPS值为:

MIPS = 500,000 / 1,000,000 = 0.5 MIPS这表示该处理器每秒钟能够执行0.5百万条指令。通过计算MIPS值,可以评估处理器的指令执行速度和性能表现,但是对于特定的应用场景和任务可能不是最准确的性能指标。

DMIPS(Dhrystone Million Instructions Per Second,每秒处理的百万级的机器语言指令数),描述的是CPU的运算能力。自动驾驶中多传感器融合的滤波算法,激光点云的配准算法,多数的路径规划和决策算法与DMIPS密切相关。DMIPS是D-MIPS的组合。具体来说:D是Dhrystone的缩写,表示了在Dhrystone这样一种测试方法下的MIPS,Dhrystone是一种整数运算测试程序。Dhrystone所代表的处理器分数比MIPS(million instructions per second 每秒钟执行的指令数)更有意义,因为在不同的指令系统中,比如RISC(Reduced Instruction Set Computer精简指令集计算机)系统和CISC(Complex Instruction Set Computer复杂指令集计算机)系统,Dhrystone的得分更能表现其真正性能。由于在一个高级任务中,RISC可能需要更多的指令,但是其执行的时间可能会比在CISC中的一条指令还要快。由于Dhrystone仅将每秒钟程序执行次数作为指标,所以可以让不同的机器用其自身的方式去完成任务。

计算DMIPS的方法如下:

  1. 首先,进行Dhrystone基准测试,得到处理器在测试条件下执行的总指令数(例如1秒内)。

  2. 将总指令数除以1,000,000(即1百万),得到每秒钟能够执行的Dhrystone基准测试指令数,即DMIPS值。

举例说明:

假设一个处理器在进行Dhrystone基准测试时,在1秒钟内执行了总共800,000条指令,那么它的DMIPS值为:

DMIPS = 800,000 / 1,000,000 = 0.8

这表示该处理器在Dhrystone基准测试条件下,每秒钟能够执行0.8百万条指令。通过计算DMIPS值,可以评估处理器在特定测试条件下的性能现。

参考

  1. https://blog.csdn.net/itas109/article/details/134627811