Nvidia显卡虚拟化（vGPU）信息汇总

看见就非常 2020-10-02

展开全文

目标：汇总服务器显卡资源信息

时间：2020-03-30

大纲：

一、Nvidia目前支持显卡类型及相关指标介绍

二、服务器显卡虚拟化CPU选择标准

三、VMware和Citrix显卡HCL查询方法

四、如何和工作站显卡对比选型

主要目的：方便有需求的小伙伴查询确认。第三次强调时间，硬件的更新速度比较快，所以使用时候一定要确定好时间。

一、Nvidia目前支持显卡类型及相关指标介绍

显卡类型介绍（直接上图）：

显卡虚拟化型号汇总

GPU- graphics processing unit 显示核心、视觉处理器、显示芯片或绘图芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备（如平板电脑、智能手机等）上运行绘图运算工作的微处理器。

CUDA(Compute Unified Device Architecture，统一计算架构) ,是由NVIDIA所推出的一种集成技术，是该公司对于GPGPU的正式名称。透过这个技术，用户可利用NVIDIA的GeForce 8以后的GPU和较新的Quadro GPU进行计算。亦是首次可以利用GPU作为C-编译器的开发环境。CUDA可以兼容OpenCL或者自家的C-编译器。无论是CUDA C-语言或是OpenCL，指令最终都会被驱动程序转换成PTX代码，交由显示核心计算。CUDA是一种由NVIDIA提出的并由其制造的图形处理单元（GPUs）实现的一种并行计算平台及程序设计模型。CUDA给程序开发人员提供直接访问CUDA GPUs中的虚拟指令集和并行计算组件的存储器。

使用CUDA技术，GPUs可以用来进行通用处理（不仅仅是图形）；这种方法被称为GPGPU。与CPUs不同的是，GPUs有着侧重以较慢速度运行大量并发线程的并发流架构，而非快速运行单一线程。

Tensor内核是专门设计的内核，具有比常规CUDA内核更高的深度学习性能。该架构是采用台积电的12 nm FinFET工艺生产的。

Real-Time Ray Tracing AccelerationTuring引入了实时光线追踪，使单个GPU可以渲染视觉逼真的3D具有物理上准确的阴影，反射和折射。图灵的新RT核加快了射线追踪速度，并被系统和介面（例如NVIDIA的RTX光线追踪技术）和API（例如Microsoft DXR，NVIDIA）OptiX™和Vulkan光线跟踪可提供实时的光线跟踪体验。

GPU scheduling-vHybrid，这是一种轻量级的用户模式运行时框架，其中我们集成了GPU的调度算法和CPU的两种算法，以有效地利用QoS的控制精度来利用CPU资源。

Live Migration- 启用NVIDIA GPU的虚拟环境中的实时迁移使IT人员可以将正在运行的虚拟机从一台物理服务器迁移到另一台物理服务器，而停机时间最少，并且不会丢失数据。在工作负载迁移期间，用户将继续访问所需的应用程序，并且计算密集型服务器工作负载不会中断。

Multi-vGPU-支持GPU虚拟化

最大支持的VGPU个数可以通过显存/GPU ProfIles ,有个例就是Quadro RTX 8000，显存最大是48G的，但最多支持32个vCPU

例：