介绍下线性方程组工具,作为以后介绍HPC基础。 问题: 求解线性方程组 Ax=b. Matlab 中提供了方程的求解方法: x=A\b (\ ----反除符号) 最简单的问题,一群兔子和鸭子,一共有40条腿,20张嘴,问兔子鸭子各多少只,两个变量,两个方程组成一个简单的线性方程组: 4*x+2*y =40 x+y =20 在Matlab中输入: >>A = 4 2 1 1 >> b=[40, 15]' b = 40 15 >> x=A\b x = 5 10 当方程求解规模达到1000*1000的时候,Matlab还能应付,速度也不错。当规模达到10w*10w的时候,Matlab会运行相当长时间,然后弹出一个错误。这是因为对于10w*10w的矩阵,用原始的数据结构,性能会下降很快。由有限元计算的矩阵特征可知,矩阵是数据大部分为0的稀疏矩阵,Matlab提供了稀疏矩阵功能,在使用x=A\b 之前 使用如下命令: x=sparse(x); 10w*10w的方程组1秒之内求出结果。 对于大型线性方程组的求解,使用Matlab做验证是个不错的选择 回到本文的主题: 1. BLAS(Basic Linear Algebra Subprograms) blas 是许多数值计算软件库的核心,用Fortran语言写成,库一共有三个level,第一level包含了vector计算的一些function;第二个level则是矩阵与vector计算;第三个level是矩阵与矩阵的计算。BLAS接口稍微复杂,一般很少直接使用。 开源 2. Intel MKL 商用是不错的选择。 Intel数学核心函数库(MKL)是一套高度优化、线程安全的数学例程、函数,面向高性能的工程、科学与财务应用。英特尔 MKL 的集群版本包括 ScaLAPACK 与分布式内存快速傅立叶转换,并提供了线性代数 (BLAS、LAPACK 和Sparse Solver)、快速傅立叶转换、矢量数学 (Vector Math) 与随机号码生成器支持。 主要包括: ① LAPACK (线形代数工具linear algebra package) ② DFTs (离散傅立叶变换 Discrete Fourier transforms) ③ VML (矢量数学库Vector Math Library) ④ VSL (矢量统计库Vector Statistical Library) MKL的主要功能 2.1)BLAS 和 LAPACK 在英特尔处理器中部署经过高度优化的基本线性代数例程BLAS(Basic Linear Algebra Subroutines)和 线性代数包LAPACK(Linear Algebra Package) 例程,它们提供的性能改善十分显著。 2.2)ScaLAPACK ScaLAPACK是一个并行计算软件包,适用于分布存储的MIMD并行机。ScaLAPACK提供若干线性代数求解功能,具有高效、可移植、可伸缩、高可靠性的特点,利用它的求解库可以开发出基于线性代数运算的并行应用程序。ScaLAPACK 的英特尔MKL 实施可提供显著的性能改进,远远超出标准 NETLIB 实施所能达到的程度。 2.3)PARDISO稀疏矩阵解算器 利用 PARDISO 直接稀疏矩阵解算器解算大型的稀疏线性方程组,该解算器获得了巴塞尔大学的授权,是一款易于使用、具备线程安全性、高性能的内存高效型软件库。英特尔? MKL 还包含共轭梯度解算器和 FGMRES 迭代稀疏矩阵解算器。 2.4)快速傅立叶变换 (FFT) 充分利用带有易于使用的新型 C/Fortran 接口的多维 FFT 子程序(从 1 维至 7 维)。英特尔? MKL 支持采用相同 API 的分布式内存集群,支持将工作负载轻松地分布到大量处理器上,从而实现大幅的性能提升。此外,英特尔 MKL 还提供了一系列 C 语言例程(“wrapper”),这些例程可模拟 FFTW 2.x 和 3.0 接口,从而支持当前的 FFTW 用户将英特尔 MKL 集成到现有应用中。 2.5)矢量数学库(VML) 矢量数学库(Vector Math Library)借助计算密集型核心数学函数(幂函数、三角函数、指数函数、双曲函数、对数函数等)的矢量实施显著提升应用速度。 2.6)矢量统计库—随机数生成器(VSL) 利用矢量统计库(Vector Statistical Library)随机数生成器加速模拟,从而实现远远高于标量随机数生成器的系统性能提升 商用 3. Eigen 主页: http://eigen./index.php?title=Main_Page Eigen 是一个轻量级的库,使用只需头文件,接口比较齐全,文档也很全面,一般的矩阵操作运算都能满足。提供了DenseMatrix 和 SparseMatrix,对于稀疏矩阵的效率也不错。 开源 4. Spoolse 早期很多人使用,性能不错,使用简单。维护的不是很好,文档使用ps格式。 http://www./linalg/spooles/spooles.2.2.html 开源 5. Lapack 使用最广泛的线性代数包,底层调用 BLAS,能求解 AX=b, 矩阵分解、求逆,求矩阵特征值、奇异值等。文档齐全,使用灵活,稳定性好,用作研究和商业开发都是不错的选择。提供SVN源码下载 http://www./lapack/ 开源 6. Pardiso PARDISO是为解决大 稀疏对称和非对称线性系统的方程的软件包,如下特点: 线程安全,,高性能的, 和内存使用率低,支持共享内存和内存多处理器。 http://www./ 商用,学术用免费 7. Mumps 使用多波前法的稀疏矩阵求解库,支持并行计算。 http://mumps./ 开源 8. PETSc PETSc是一个高大上的科学计算库,求解线性方程是其中一个功能,支持内存共享并行计算机,支持多线程,GPU加速等,支持求解稀疏矩阵 http://www.mcs./petsc/documentation/linearsolvertable.html 开源 9. SuperLU SuperLU是一个求解大规模,稀疏,非对称系统对线性方程组的通用库,c语言编写,可供Fortran和C调用。最新版本为4.3 (2014/10/1)支持并行计算和分布式计算。 http://www.cs./~demmel/SuperLU.html 开源 10. Umfpack UMFPACK是 用来求解不对称稀疏线性系统软件包, Ax = b,使用非对称多波方法,SuitSparse有此算法 使用比较简单,Windows下需要自己编译。 http://www.cise./research/sparse/umfpack/ 开源 11. TAUCS 求解稀疏矩阵线性方程软件包,最新版本支持多线程 http://www./~stoledo/taucs/ 开源 12. SuitSparse SuiteSparse是一组C、Fortran和MATLAB函数集,用来生成空间稀疏矩阵数据。在SuiteSparse中几何多种稀疏矩阵的处理方法,包括矩阵的LU分解,QR分解,Cholesky分解,提供了解非线性方程组、实现最小二乘法等多种函数代码 http://faculty.cse./davis/suitesparse.html 开源 13. Sparselib++ 用C++写的 稀疏矩阵库,可以和 IML++一起使用做线性方程组的迭代求解。 http://math./sparselib++/ 开源 14. Trilinos Trilinos也是个高大上的东西,求解线性方程只是其中一部分功能 http:///capability-areas/#ScalableLinearAlgebra 开源 15.IML++ 使用C++模板库 和迭代方法 求解对称,非对称矩阵库 http://math./iml++/ 开源 使用推荐: 1. 简单快速上手 Eigen 2. 商业使用 Intel MKL 3. 研究使用 Lapack,PETSc,SuitSparse |
|