imnobody2001的图书馆

他的首页他的馆藏他的动态馆友反馈关于他分享对话

imnobody2001 IP属地：黑龙江

文章		关注		粉丝		访问		贡献

关注

粉丝

访问

贡献

他的首页

他的馆藏

他的动态

馆友反馈

关于他

共 27 篇文章

显示摘要

每页显示

条

【干货】英伟达CUDA的前世今生

CUDA是一种基于GPU的通用计算框架，是NVIDIA和intel在2006年合作开发的一种创新的技术方案，它让GPU和CPU通过一种新的互连技术来高效地交换数据，它让GPU不仅能够处理图形任务，还能够处理科学计算、机器学习、密码学等领域的复杂和耗时的计算任务。从2006年的第一代CUDA1.0到至今的第十二代CUDA12.0，CUDA在每一代都有新的功能和优化，比如：-...

阅122 转2 评0 公众公开 24-03-05 23:02

【CUDA编程】传统 CUDA 动态并行详解（CDP1）

【CUDA编程】传统 CUDA 动态并行详解（CDP1）2.1.6 内存声明（CDP1）2.1.6.1 设备内存和常量内存（CDP1）这些启动函数的 API 与 CUDA Runtime API 不同，定义如下：extern device cudaError_t cudaGetParameterBuffer(void **params);extern __device__ cudaError_t cudaLaunchDevice(void *kernel, void *params, dim3 gridDim, dim3 blockDim...

阅12 转0 评0 公众公开 24-02-20 13:12

GPU编程(一): CUDA编程模型

GPU编程(一): CUDA编程模型。#define __CUDA_BUILTIN_VAR \ extern const __attribute__((device)) __attribute__((weak))__CUDA_BUILTIN_VAR __cuda_builtin_threadIdx_t threadIdx;__CUDA_BUILTIN_VAR __cuda_builtin_blockIdx_t blockIdx;[1] CUDA C++ Programming Guide, https://docs.nvidia.com/cuda/cuda-c-programming-guide.[2] CUDA ...

阅11 转0 评0 公众公开 24-02-20 11:03

【CUDA基础】1.1异构计算与CUDA

【CUDA基础】1.1异构计算与CUDA.x86 CPU+GPU的这种异构应该是最常见的，也有CPU+FPGA，CPU+DSP等各种各样的组合，CPU+GPU在每个笔记本或者台式机上都能找到。这句话如果没有，则不能正常的运行，因为这句话包含了隐式同步，GPU和CPU执行程序是异步的，核函数调用后成立刻会到主机线程继续，而不管GPU端核函数是否执行完毕，所以上面的程序就是G...

阅10 转0 评0 公众公开 24-02-20 07:45

使用 GPU 能力

使用 GPU 能力。将GPU用于通用计算首先从GPU支持可编程开始，英伟达（NVIDIA）公司在Ian Buck（伊恩·布克）率领下，于2006年正式推出——CUDA（Compute Unified Device Architecture），这是全球首款GPU上的通用计算解决方案。cuDNN（CUDA Deep Neural Network library）是由NVIDIA开发的一个深度学习GPU加速库，为了充分发挥 GPU 在大语...

阅2 转0 评0 公众公开 24-02-20 07:35

深入理解GPU硬件架构及运行机制

FP64 Cores. 实际上每个SM都包含了2个64位浮点计算核心FP64 Cores，用来计算双精度浮点运算，虽然上图没有画出，但是实际是存在的。但是也有一些例子，多个core之间要相互通讯配合（例如上文谈到的数组求和问题），每个core之间都可以实现交互数据是非常昂贵的，因此提出了SM的概念，SM是多个core的集合，一个SM里面的cores可以通过L1 Cache进...

阅18 转0 评0 公众公开 24-02-20 07:25

国内大厂GPU CUDA高频面试问题汇总一

其次，同一个 grid 上的线程共享相同的全局内存空间，而 grid 又可以分为很多线程块 block，线程块是向GPU进行调度的最小单位，GPU同时支持多个线程块的执行，达到上限后，只有旧的线程块内的线程全部执行完成后，新的线程块才会被调度入GPU。CUDA的存储体系结构包括全局内存（Global Memory）、共享内存（Shared Memory）、常量内存（Constant...

阅134 转0 评0 公众公开 24-02-06 11:28

GPU起源

GPU起源。如今，GPU是计算机架构中最关键的硬件组件之一。虽然它可能被认为是第一个3D图形系统，但今天的GPU基础始于70年代中期的所谓视频移位器和视频地址生成器。这就是Nvidia如何宣传其GeForce 256. Nvidia将“图形处理单元”定义为“具有集成变换、灯光、三角设置/裁剪和渲染引擎能力，在每秒至少可处理1000万个多边形”的单芯片处理器。”...

阅6 转0 评0 公众公开 24-02-01 21:27

浅谈GPU

浅谈GPU。GPU相比CPU具有以下优势：7.线程数目优势：GPU的线程数目远远超过CPU，这使得GPU在处理大规模并行计算任务时更加高效。同时，GPU的并行计算能力也被发掘，使得GPU在处理大规模数据集时更加高效。CPU和GPU的深度集成：CPU和GPU的深度集成将成为未来的关键趋势。GPU的未来发展趋势将主要体现在更强大的计算能力、更快的内存和更大的缓存...

阅5 转0 评0 公众公开 24-01-31 14:08

快速掌握CPU中的SMP与NUMA架构！

快速掌握CPU中的SMP与NUMA架构！SMP架构的多个处理器都是同构的，使用相同架构的CPU;而AMP架构的多个处理器可能是异构的。由于每个 CPU 必须通过相同的内存总线访问相同的内存资源，因此随着 CPU 数量的增加，内存访问冲突将迅速增加，最终会造成 CPU 资源的浪费，使 CPU 性能的有效性大大降低。NUMA 服务器的基本特征是具有多个 CPU 模块，每...

阅8 转0 评0 公众公开 24-01-30 13:58

他的文章
他的书籍

筛选

不限类型

网文

撰写

文档

不限 Word PPT Excel RTF PDF TXT

思维导图

相册

音乐

视频

显示摘要不显示摘要

每页10条每页30条每页50条

返回
顶部