分享

CPU、GPU算力计算

 新用户74969uxn 2024-05-08 发布于河南

DMIPS:Dhrystone Million Instructions executed Per Second,每秒执行百万条指令,用来计算同一秒内系统的处理能力,即每秒执行了多少百万条指令。

CPU的DMIPS算力计算公式为:内核的数量 * 主频 * DMIPS/MHz 。

例如,六核A55架构,主频为1.6GHz,性能为2.7DMIPS/MHz,算力DMIPS = 6 * 1660MHz * 2.7DMIPS/MHz = 31374 DMIPS.

GPU用TOPS和FLOPS描述

TOPS(Tera Operations Per Second的缩写),1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作。

TOPS=MAC矩阵行 * MAC矩阵列 * 主频 * 2

特斯拉的FSD芯片,96x96 MAC,主频2GHz

TOPS = 96 * 96 * 2000000000 * 2 = 36.864 TOPS

FLOPS,即每秒浮点运算次数, 是每秒所执行的浮点运算次数(Floating-point operations per second;缩写:FLOPS)的简称,用来评价CPU的算力.

MAC/FMA的全称为Fused Multiply–accumulate operation, 也就是乘积累加指令,这种指令集融合了加法和乘法,使得处理器能够在一个指令中同时完成乘法和加法操作,从而提高了计算效率。

SIMD的全称叫做,单指令集多数据(Single Instruction Multiple Data)。最直观的理解就是,向量计算。比如一个加法指令周期只能算一组数(一维向量相加),使用SIMD的话,一个加法指令周期可以同时算多组数(n维向量相加),二者用时基本相等,极大地提高了运算效率。
                        
原文链接:https://blog.csdn.net/qq_51563654/article/details/131161576

1 TFLOPS = 10^3 GFLOPS = 10^6 MFLOPS = 10^12 FLOPS

FLOPS=核数*单核主频*单个周期浮点计算值

单个周期浮点计算值(双精度)=FMA数量*2(同时加法和乘法)*512/64

单个周期浮点计算值(单精度)=FMA数量*2(同时加法和乘法)*512/32

单精度和双精度浮点运算概念,简单的理解单精度就是指32bit的指令长度的运算,对应操作系统就是32位操作系统;双精度就是指64bit指令长度的运算,对应操作系统就是64位操作系统。

512:这个数值可能指的是CPU的某些硬件特性,如SIMD(Single Instruction, Multiple Data)宽度。SIMD宽度是CPU能够同时处理的数据元素数量。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多