【IT168专稿】在之前的文章中,介绍了《Windows环境CUDA 4.0:安装前的准备》,本文介绍CUDA 4.0的安装与验证过程。 安装CUDA软件 安装CUDA软件需要以下步骤: 1、安装CUDA Toolkit 运行Toolkit的安装程序包,并按照屏幕上的提示,一步步的安装CUDA Toolkit。CUDA Toolkit默认安装在C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v#.#,其中v#.#是版本的名称,如v4.0。这个目录里包括以下的内容:
1.bin文件夹:包括编译器的可执行文件和运行时库; 2. include文件夹:包括编译CUDA程序所需的头文件; 3. lib文件夹:包括链接CUDA程序所需的库文件; 4.doc文件夹:包括CUDA C Programming Guide (CUDA C语言编程指南)、CUDA C Best Practices Guide (CUDA C语言的最佳实践指南)、CUDA库文件文档,以及其他CUDA Toolkit相关的文档。 注意:CUDA Toolkit 3.1或者更早的版本,默认的安装路径为C:\CUDA,所以需要在安装新版本CUDA Toolkit前将旧版本卸载。CUDA Toolkit 3.2开始,多个CUDA Toolkit版本可同时安装。 2、安装GPU Computing SDK 运行GPU Computing SDK安装程序包,并按照屏幕上的提示进行安装。GPU Computing SDK默认的安装路径是C:\Documents and Settings\All Users\Application Data\NVIDIA Corporation\NVIDIA GPU Computing SDK 4.0(或者Windows Vista及以上系统,默认安装路径为C:\ProgramData\NVIDIA Corporation\NVIDIA GPU Computing SDK 4.0),该文件夹包含许多示例问题的源代码和微软Visual Studio的模板。 验证安装是否正确 在进行下面的步骤之前,很重要的一点是要验证CUDA程序可以找到并与支持CUDA的硬件正确连接。要验证这一点,就需要编译和运行一些内置的示例程序。 1、编译示例程序 查询CUDA Toolkit的版本,可以通过在命令提示符窗口中运行“nvcc –V”查询。命令提示符窗口的打开方法是:“开始”→“所有程序”→“附件”→“命令提示符”。
GPU Computing SDK包括源代码和编译形式的示例程序。为了验证硬件和软件是否正确配置,建议运行bandwidthTest程序,该程序位于C:\Documents and Settings\All Users\Application Data\NVIDIA Corporation\NVIDIA GPU Computing SDK 4.0\C\bin\win32\Release文件夹中(若使用默认的安装路径),若为64位Windows系统,该程序则位于C:\Documents and Settings\All Users\Application Data\NVIDIA Corporation\NVIDIA GPU Computing SDK 4.0\C\bin\win64\Release文件夹中。如果CUDA已经正确安装配置,输出界面如下图(图3)所示: ▲图3:正确安装配置的输出界面 上图显示了设备名称(位于上图第二行)和系统间传递的带宽数。其中第二行很重要,该项证实已找到CUDA设备。倒数第二行也很重要,该项确认所有必要的测试均已通过。 如果测试没有通过,则需确保系统有支持CUDA的NVIDIA GPU并已正确安装。 运行Particles可执行文件示例,来看CUDA技术有什么功能,Particles的路径如下: ●Windows XP: 1.32位系统:C:\Documents and Settings\All Users\Application Data\NVIDIA GPU Computing SDK 4.0\C\bin\win32\Release文件夹。 2.64位系统:C:\Documents and Settings\All Users\Application Data\NVIDIA GPU Computing SDK 4.0\C\bin\win64\Release文件夹。 ●Windows Vista/Windows 7: 1.32位系统:C:\ProgramData\NVIDIA Corporation\NVIDIA GPU Computing SDK 4.0\C\bin\win32\Release文件夹。 2.64位系统:C:\ProgramData\NVIDIA Corporation\NVIDIA GPU Computing SDK 4.0\C\bin\win64\Release文件夹。 2、编译CUDA程序 GPU Computing SDK中的项目文件旨在提供简便的、一键生成的程序,这些程序包括所有的源代码。要建立32位或64位Windows系统的项目(发布模式或调试模式),可以使用微软Visual Studio 2005,2008或2010提供的*.sln的解决方案文件(以及相应版本的微软Visual C Express Edition)。可以使用位于NVIDIA GPU Computing SDK 4.0\C\src文件夹下的每个示例目录里的解决方案文件,以及位于NVIDIA GPU Computing SDK 4.0\C\src文件夹下的全局解决方案文件Release*.sln。 3、编译示例项目 bandwidthTest项目是用来创建和运行的示例项目,bandwidthTest项目的路径为NVIDIA Corporation\NVIDIA GPU Computing SDK 4.0\C\src\bandwidthTest 输出结果放置在NVIDIA GPU Computing SDK\C\bin\win32\Debug文件夹下。如前所述,若为64位Windows系统,则把win32改为win64(该路径的前提为默认安装目录)。 使用适当的解决方案文件创建程序,并运行可执行文件。如果一切运行正常,输出结果应与图3相似。 4、示例项目 示例项目中包括两种配置:debug(调试)模式和release(发布)模式(其中release模式不包含调试信息)。 有些示例项目需要进行额外的设置。simpleD3D9示例要求系统安装Direct3D SDK,并正确配置Visual C 的目录路径(位于Tools(工具)→Options(选项)...)。 大多数示例链接到一个名为cutil的实用工具库,cutil的源代码位于NVIDIA GPU Computing SDK 4.0\C\common\src文件夹中。示例的发行版本链接到cutil32.lib(或cutil64.lib),并动态加载cutil32.dll(或cutil64.dll)。示例的调试版本链接到cutil32D.lib,并动态加载cutil32D.dll(或64位版本的dll)。 使用位于NVIDIA GPU Computing SDK 4.0\C\common文件夹中的解决方案文件,来创建Win32的发布和(或)调试cutil库的配置。编译过程的输出结果被放置在NVIDIA GPU Computing SDK\C\common\lib文件夹下: cutil32.lib和cutil32D.lib(或者cutil64.lib和cutil64D.lib)是发布和调试的导入库。 cutil32.dll和cutil32D.dll(或者cutil64.dll和cutil64D.dll)是发布和调试的动态链接库,同样也被分别复制到NVIDIA GPU Computing SDK 4.0\C\bin\win32\release和NVIDIA GPU Computing SDK 4.0\C\bin\win32\debug(64位系统中,用win64代替win32)。 注意:cutil库主要用作精简GPU Computing SDK示例的工具;不推荐使用cutil库SDK以外的示例,因为cutil库的API可能随时改变。 这些示例项目同样使用$CUDA_PATH环境变量来定位CUDA Toolkit,以及使用.rules文件来定位和配置nvcc编译器。环境变量是自动设置的,并且.rules文件作为CUDA Toolkit安装过程的一部分是自动安装的。.rules文件安装在$VisualStudioInstallDir\VC\VCProjectDefaults文件夹下。在新建CUDA应用程序时,可以参考Visual Studio项目文件中的.rules文件。 总结 通过以上的过程已将软件安装完毕,就可以查看并利用很多内置程序,并开始使用CUDA来加速自己应用程序的性能,可以参考CUDA C Programming Guide,该指南位于CUDA Toolkit文档目录里。 如果在编程中遇到技术问题,可以参与论坛讨论,CUDA论坛地址为:http://cudabbs.it168.com/ 更多内容请点击: CUDA专区:http://cuda.it168.com/ CUDA论坛:http://cudabbs.it168.com/ |
|