搜索

分享

QQ空间 QQ好友新浪微博微信

【李沐】十分钟从 PyTorch 转 MXNet

LibraryPKU 2019-03-29

展开全文

MXNet 作者 / 亚马逊主任科学家李沐

新智元推荐

作者：MXNet 作者 / 亚马逊主任科学家李沐

阅读红包到账，点击提现！

广告

【新智元导读】PyTorch是一个纯命令式的深度学习框架。它因为提供简单易懂的编程接口而广受欢迎，而且正在快速的流行开来。MXNet通过ndarray和 gluon模块提供了非常类似 PyTorch 的编程接口。本文将简单对比如何用这两个框架来实现同样的算法。

PyTorch是一个纯命令式的深度学习框架。它因为提供简单易懂的编程接口而广受欢迎，而且正在快速的流行开来。例如 Caffe2 最近就并入了 PyTorch。

展开剩余76%

可能大家不是特别知道的是，MXNet 通过 ndarray和 gluon模块提供了非常类似 PyTorch 的编程接口。本文将简单对比如何用这两个框架来实现同样的算法。

安装

PyTorch 默认使用 conda 来进行安装，例如

而 MXNet 更常用的是使用 pip。我们这里使用了 --pre来安装 nightly 版本

多维矩阵

对于多维矩阵，PyTorch 沿用了 Torch 的风格称之为 tensor，MXNet 则追随了 NumPy 的称呼 ndarray。下面我们创建一个两维矩阵，其中每个元素初始化成 1。然后每个元素加 1 后打印。

忽略包名的不一样的话，这里主要的区别是 MXNet 的形状传入参数跟 NumPy 一样需要用括号括起来。

模型训练

下面我们看一个稍微复杂点的例子。这里我们使用一个多层感知机（MLP）来在 MINST 这个数据集上训练一个模型。我们将其分成 4 小块来方便对比。

读取数据

这里我们下载 MNIST 数据集并载入到内存，这样我们之后可以一个一个读取批量。

这里的主要区别是 MXNet 使用 transform_first来表明数据变化是作用在读到的批量的第一个元素，既 MNIST 图片，而不是第二个标号元素。

定义模型

下面我们定义一个只有一个单隐层的 MLP 。

我们使用了 Sequential容器来把层串起来构造神经网络。这里 MXNet 跟 PyTorch 的主要区别是：

大家知道 Sequential下只能神经网络只能逐一执行每个层。PyTorch 可以继承 nn.Module来自定义 forward如何执行。同样，MXNet 可以继承 nn.Block来达到类似的效果。

损失函数和优化算法

这里我们使用交叉熵函数和最简单随机梯度下降并使用固定学习率 0.1

训练

最后我们实现训练算法，并附上了输出结果。注意到每次我们会使用不同的权重和数据读取顺序，所以每次结果可能不一样。

MXNet 跟 PyTorch 的不同主要在下面这几点：

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： LibraryPKU > 《机器学习》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

LibraryPKU

关注对话

TA的最新馆藏

Geoserver 以及 Geotools各版本和jdk版本对照表
PostGis 与Posgresql 版本对应
No module named ‘config‘，一招解决无法连接到上一级文件
python - 使 argparse 对待破折号和下划线相同
CentOS 7 软件安装 —— 用 alternatives 命令安装多个版本的 JDK
python 项目自动生成环境配置文件requirements.txt

喜欢该文的人也喜欢更多

热门阅读换一换