分享

【海通计算机】英伟达系列研究(二):不得不看的英伟达GTC大会的猛料

 xindiandengshw 2017-06-06

【海通计算机】英伟达系列研究(二):不得不看的英伟达GTC大会的猛料

2017-06-05 郑宏达/谢春生 宏达说

投资要点

2016年5月,我们发了英伟达系列研究(一)GPU——下一代高速计算的王者,英伟达股价自此涨了4倍。我们看到了英伟达收入结构的改善,电脑显卡业务占比逐渐降低,无人驾驶、数据中心等业务占比快速提高。这远不是英伟达的终点,其作为人工智能的核心,千亿美元市值仅是起点。

基于GPU,英伟达布局人工智能产业。GPU由英伟达在1999年提出,随后陆续推出GPU加速器、CUDA并行计算平台,借助GPU进行复杂运算,极大提高计算性能。由于高性能计算和低成本优点,GPU在需要海量数据复杂运算机器学习领域被广泛应用,GPU产业与机器学习相辅相成,迎来了快速发展。借助在GPU产业龙头地位优势,英伟达布局人工智能领域,包括AR/VR交互平台、云平台、自动驾驶、机器人等。本次GTC大会英伟达带来Holodeck、Tesla V100、云平台、车载AI平台、ISAAC机器人模拟等五大产品。

英伟达发布结合VR、AR的社交工作平台Holodeck。该平台拥有照片级模型,不仅包含英伟达长年积累的GameWorks,还有DesignWorks,画面表现力成熟;从VR纬度,可以进行模型构建和分享;Holodeck不仅可以提供视觉听觉共享,还能提供物理上的接触模拟,因为其完全遵循现实物理法则。

Tesla V100 GPU发布。Tesla芯片面积815平方毫米,达到光刻技术极限。搭载16GB HBM2显存、带宽达到900GB/S。单个计算单元比原架构Pascal快了12倍,张量运算能力达到120TFLOPS。Tesla基于新一代的Volta GPU架构,此次英伟达也推出了其他基于Volta的产品: DGX-1、DGX station。

深度学习云平台协助快速设置开发环境。提供一键配备深度学习项目功能。英伟达优化整合了一整套深度学习软件包,支持全部深度学习开发框架,基于云端强大的计算能力,用户可在英伟达GPU云设施开发环境,上传工作进度。

车载AI平台版图逐渐扩张。英伟达宣布与丰田合作,为其提供DRIVE PX车载AI计算平台。目前已有200个开发者和企业正在使用该平台。同时,英伟达宣布将开源Xavier DLA。 DLA是英伟达的自动驾驶AI处理器,创新地整合了CPU、GPU及DLA三大处理器优点。

ISAAC机器人模拟机将大幅提高机器训练效率。在真实世界训练机器有较大局限性,包括高昂的人力成本、耗时长、效率低等。因此强化学习应运而生,ISAAC机器人模拟机就类似于一种强化学习,在这个虚拟世界,完全遵循除时间外的物理定律,在时间上,机器人一秒内可重复多次复杂动作。基于这种设定,机器人训练耗时将大幅减少,训练效率大幅上升。

英伟达的人工智能产业布局

GPU产业,作为下一代高速计算的核心,具备低成本、高性能的特点。GPU由英伟达在1999年首次提出,在近年火爆的深度学习领域的带动下,GPU产业迎来了高速发展。

英伟达率先推出GPU加速器。GPU加速器利用GPU和COU ,加快科学、分析、工程和企业应用程序的运行速度。GPU能够使汽车、手机和平板电脑、无人机、机器人等平台程序加速运行。其原理是将程序计算密集部分工作转移到GPUY,其余部分代码仍由CPU运行。

2006年,英伟达推出CUDA运算平台。CUDA是一种通用并行计算架构,可利用GPU解决复杂计算问题,显著提高计算性能。包含CUDA指令集架构和GPU内部并行计算引擎。

GPU能较好满足机器学习计算需求。由于GPU高性能低成本的特点,工业与学术界以将其应用于机器学习,包括图像分类、食品分析、语音识别以及自然语言处理等。与单纯使用CPU相比,GPU具有数以千计的计算核心、可实现 10-100 倍应用吞吐量。优势十分明显。

近年来,借由GPU,英伟达逐步进行人工智能产业布局,包括VR/AR交互、云平台、自动驾驶、机器人等。

5月11日,GTC大会在美国圣何塞举行,英伟达CEO 黄仁勋发表主题演讲,发布Project Holodeck、Volta、英伟达GPU 云、Xavier DLA、Isaac 机器人模拟机五大新品。

1VR多人交互平台Holodeck

先进的VR社交工作平台。本次发布的Holodeck平台结合VR和AI技术,构建社交和工作平台。具有以下特点:

(1)照片级真实模型。在渲染图像,如超级跑车时,汽车外壳与内饰细节清晰,同时,车内所有部件也被渲染出来。

(2)遵循现实物理法则。如驾驶场景中,手并不会穿过方向盘,而有类似可以握住的感觉。

(3)适宜协作。多人之间可以进行动作交互。

2Volta架构

新一代高性能GPU架构。相比原架构Pascal,Volta主要有以下特点:

(1)Tensor Core:全新的张量运算指令,同时,它也是数据格式,使Volta训练吞吐量达到Pascal的12倍,推理吞吐量达到6倍。

(2)TensorRT:高性能神经网络推理引擎,即编译器。可为推理运算快速优化、验证、部署神经网络。

作为新一代GPU架构,Volta的重要性不言而喻,此次英伟达也推出了多款基于Volta的产品:Tesla V100、DGX-1、DGX station。

2.1 Tesla V 100

性能全面提升的新一代芯片。

(1)Tesla芯片面积达到惊人的815平方毫米,达到光刻技术极限。

(2)搭载16GB HBM2显存、带宽达到900GB/S。

(3)基于Volta的全新张量运算指令Tensor Core,使得其单个计算单元比原架构Pascal快了12倍,张量运算能力达到120TFLOPS。

性能上,从Caffe2、Microsoft CNTK、MXnet三大主流深度学习框架来看,与Tesla K80、P100相比,V100性能提高显著,在Caffe2上,V10训练时间由K80的40小时大幅缩减到不足10小时。

2.2 大型超级电脑DGX-1V

内置8块Tesla V100,运算能力达到960 Tensor TFLOPS。同样的训练效果,Titan X需要花费8天,而DGX-1V只需要8小时。其性能相当于把400个服务器装到一起。

2.3 小型超级电脑DGX Station

针对小型企业、个人,推出的DGX Station,配备4块Tesla V100显卡,故运算能力是DGS-1的一半,其功耗达到1500W,使用水冷。

2.4 云服务器HGX-1

HGX-1专门拥有GPU云服务,适用于公有云、深度学习、图形渲染、CUDA等,与DGX-1相同,配备了8块Tesla V100。

3英伟达云

深度学习云平台协助快速设置开发环境。与亚马逊AWS云、微软Azure云不同,英伟达云产品专门针对于深度学习,同时,它能提供一键配备深度学习项目功能。基于这款云产品,用户只需三步即可创建自己的深度学习项目:

(1)选择计算环境;

(2)接入数据库;

(3)选择深度学习框架

英伟达优化整合了一整套深度学习软件包,包含了开发者所需要的库和框架。它支持全部深度学习开发框架,基于云端强大的计算能力,用户可在英伟达GPU云设施开发环境,上传工作进度。

4车载AI平台DRIVE PX

AI平台版图逐渐扩张。英伟达宣布与丰田合作,为其提供DRIVE PX车载AI计算平台。目前已有200个开发者和企业正在使用该平台。此平台主要有三大功能:

(1)地图构建。通过扫描、道路特征检测,系统可以创建高精度地图,实现车辆定位、自动驾驶。

(2)副驾辅助。基于此功能,可以已构建高精度地图的特定路线实现自动驾驶功能。

(3)守护功能。即使未开启自动驾驶,AI系统也会保持在线,时刻保障行车安全。

同时,英伟达宣布将开源Xavier DLA。DLA是英伟达的自动驾驶AI处理器,创新地整合了CPU、GPU及DLA三大处理器优点,同时具备CPU的单线程功能、CUDA的并行加速能力、和DLA的计算机视觉特殊功能。

5ISAAC机器人模拟机

ISAAC黑科技将大幅提高机器训练效率。

在真实世界训练机器有较大局限性,包括高昂的人力成本、耗时长、效率低等。因此机器学习领域产生了一个分支:强化学习。即强调需要建立一个世界模拟器,模仿现实世界的逻辑。原理、物理定律,然后将机器放进其中进行训练。

英伟达推出的ISAAC机器人训练模拟世界就是一个类似的世界模拟器。在这个虚拟世界,完全遵循除时间外的物理定律,如万有引力等。ISAAC直接连通OpenAI Gym,借助其强化学习功能。

在时间上,机器人以多重分身在ISAAC中训练,一秒内可重复多次复杂动作,每轮训练中效果最好的,进入下一轮训练,如此循环,最终训练出最智能的机器人。基于这种设定,机器人训练耗时将大幅减少,训练效率大幅上升。

6风险提示

(1)产业发展低于预期的风险;

(2)GPU应用低于预期的风险;

(3)系统性风险。

海通计算机研究团队:

郑宏达(13918906471)

谢春生(13774410126)

鲁立(13916253156)

黄竞晶(13764440139)

杨林(15221070365)

洪琳(18217472692)

微信扫一扫

关注该公众号

阅读 2742 投诉

写留言

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多