GraphLab Create：更简单更强大的深度学习

用勿龍潛 2016-08-02

展开全文

机器学习的一个核心目标是对输入数据进行分类。例如一个训练好的分类器，输入一张图片便可预测这张图中是狗还猫。

用来分类的方法有很多，支持向量机、逻辑回归、深度学习等。最近深度学习如日中天，虽然很强大，但其训练起来却是昂贵的，费时费力。你需要确定网络多少层，需要确定每层多少个节点，需要初始化模型的参数等等。简单来说，深度学习模型就像一个带有很多旋钮和表盘的机器，这些旋钮和表盘你没调好它就罢工。

最新发布的GraphLab Create 1.1 及1.2使深度学习变得超级简单。它不需要你自己在选择模型和调参上成为专家，就可以玩转神经网络。基于输入数据，neuralnet_classifier.create()函数选择一个网络架构并设置合理的参数值。在MNIST上测试：

1
2
<span class="hljs-title">data</span> = graphlab.SFrame(<span class="hljs-string">'http://s3./GraphLab-Datasets/mnist/sframe/train'</span>)
model = graphlab.neuralnet_classifier.create(data, target=<span class="hljs-string">'label'</span>)

在测试集上评估这个模型：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
&gt;&gt;&gt; testing_data = graphlab.SFrame(<span class="hljs-string">'http://s3./GraphLab-Datasets/mnist/sframe/test'</span>)
&gt;&gt;&gt; model.evaluate(testing_data)
 
{<span class="hljs-string">'accuracy'</span>: <span class="hljs-number">0</span>.<span class="hljs-number">9803000092506409</span>, <span class="hljs-string">'confusion_matrix'</span>: Columns:
 	target_label	<span class="hljs-keyword">int</span>
 	predicted_label	<span class="hljs-keyword">int</span>
 	count	<span class="hljs-keyword">int</span>
 
 Rows: <span class="hljs-number">65</span>
 
 Data:
 +--------------+-----------------+-------+
 | target_label | predicted_label | count |
 +--------------+-----------------+-------+
 |      <span class="hljs-number">0</span>       |        <span class="hljs-number">0</span>        |  <span class="hljs-number">974</span>  |
 |      <span class="hljs-number">2</span>       |        <span class="hljs-number">0</span>        |   <span class="hljs-number">3</span>   |
 |      <span class="hljs-number">5</span>       |        <span class="hljs-number">0</span>        |   <span class="hljs-number">1</span>   |
 |      <span class="hljs-number">6</span>       |        <span class="hljs-number">0</span>        |   <span class="hljs-number">7</span>   |
 |      <span class="hljs-number">8</span>       |        <span class="hljs-number">0</span>        |   <span class="hljs-number">6</span>   |
 |      <span class="hljs-number">9</span>       |        <span class="hljs-number">0</span>        |   <span class="hljs-number">5</span>   |
 |      <span class="hljs-number">0</span>       |        <span class="hljs-number">1</span>        |   <span class="hljs-number">1</span>   |
 |      <span class="hljs-number">1</span>       |        <span class="hljs-number">1</span>        |  <span class="hljs-number">1128</span> |
 |      <span class="hljs-number">2</span>       |        <span class="hljs-number">1</span>        |   <span class="hljs-number">1</span>   |
 |      <span class="hljs-number">6</span>       |        <span class="hljs-number">1</span>        |   <span class="hljs-number">3</span>   |
 |     ...      |       ...       |  ...  |
 +--------------+-----------------+-------+
 [<span class="hljs-number">65</span> rows <span class="hljs-keyword">x</span> <span class="hljs-number">3</span> columns]
 Note: Only the head of the SFrame is printed.
 You can <span class="hljs-keyword">use</span> print_rows(num_rows=<span class="hljs-keyword">m</span>, num_columns=n) to <span class="hljs-keyword">print</span> more rows <span class="hljs-keyword">and</span> columns.}

结果达到了98%的精度。寥寥几行代码，深度学习就这么简单。

这样还不够，GraphLab Create还要求要使深度学习变得更简单。尽管GraphLab Create能选择较好的网络架构和参数，但这种自动化处理往往是不够的。优化设置往往是极端具体的问题，没有好的直觉、没有足够丰富的经验、没有很多PhD学生的话这个问题很难解决。

其实并非所有问题都得从头开始去训练一个深度模型，再者说，你要解决的问题也并不特殊，它与一些已经解决的问题多少有关联。拿分类猫狗的例子，最有名的数据集ImageNet，DNN表现最优异，其训练的模型可将输入从一千种类别中分辨出其属于哪一类。分辨狮子和狐狸类别的那些特征难道对分辨猫狗没用?

当然有用。通过简单移除DNN的输出层，将传播到输出层的信号作为特征喂给任何一种分类器便可解决我们区分猫狗的任务。步骤如下：

第一步：在一个超大的通用的数据集上训练一个DNN分类器。最好的例子是ImageNet,1000种类别120万张图片。GraphLab拥有在ImageNet上训练好的模型，因此当你应用的时候可以跳过这一步，只需下载这个模型：

1
gl.load_model(<span class="hljs-string">'http://s3./GraphLab-Datasets/deeplearning/imagenet_model_iter45'</span>)

第二步：DNN每一层的输出可以看作每张图像的一个有意义的向量表示。对你任务中的图像，提取输出层前面那层的特征向量。

第三步：以这些特征作为输入，训练一个针对你自己任务的新的分类器。

乍一看可能觉得这样比训练一个DNN更复杂。其实不然，第一步可在很多不同的问题上复用，而且GraphLab给你提供了这个模型，所以并不需要你自己去训练。第二步用GraphLab的API就可搞定。第三步随便一个比深度学习模型简单的分类器都可行。这样一套流程下来，无需调参、训练更快、效果更好，即使有时训练数据不够也不影响。另外，即便你的第三步分类任务与第一步训练的任务相对无关，此方法效果依然很好。

举个例子，还是分类猫和狗：

第一步，下载在ImageNet上训练好的模型。

1
<span class="hljs-title">pretrained_model</span> = graphlab.load_model(<span class="hljs-string">'http://s3./GraphLab-Datasets/deeplearning/imagenet_model_iter45'</span>)

而后下载狗和猫的图像。因原始ImageNet模型在256x256x3的图像上训练，所以这里调整了一下图像大小。

1
2
<span class="hljs-title">cats_dogs_sf</span> = graphlab.SFrame(<span class="hljs-string">'http://s3./GraphLab-Datasets/cats_vs_dogs/cats_dogs_sf'</span>)
cats_dogs_sf[<span class="hljs-string">'image'</span>] = graphlab.image_analysis.resize(cats_dogs_sf[<span class="hljs-string">'image'</span>], <span class="hljs-number">256</span>, <span class="hljs-number">256</span>, <span class="hljs-number">3</span>)

第二步，提取特征

1
2
cats_dogs_sf[<span class="hljs-string">'features'</span>] = pretrained_model.extract_features(cats_dogs_sf)
cats_dogs_train, cats_dogs_test = cats_dogs_sf.random_split(<span class="hljs-number">0</span>.<span class="hljs-number">8</span>)

第三步，训练一个简单的分类器

1
<span class="hljs-title">simple_classifier</span> = graphlab.classifier.create(cats_dogs_train, features = [<span class="hljs-string">'features'</span>], target = <span class="hljs-string">'label'</span>)

为看效果，做个评估：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
<span class="hljs-prompt">&gt;&gt;&gt;</span> simple_classifier.evaluate(cats_dogs_test)
{<span class="hljs-string">'accuracy'</span><span class="hljs-symbol">:</span> <span class="hljs-number">0</span>.<span class="hljs-number">9545091779728652</span>, <span class="hljs-string">'confusion_matrix'</span><span class="hljs-symbol">:</span> <span class="hljs-constant">Columns</span><span class="hljs-symbol">:</span>
 	target_label	str
 	predicted_label	str
 	count	int
 
 <span class="hljs-constant">Rows</span><span class="hljs-symbol">:</span> <span class="hljs-number">4</span>
 
 <span class="hljs-constant">Data</span><span class="hljs-symbol">:</span>
 +--------------+-----------------+-------+
 | target_label | predicted_label | count |
 +--------------+-----------------+-------+
 |      <span class="hljs-number">0</span>       |        <span class="hljs-number">0</span>        |  <span class="hljs-number">2406</span> |
 |      <span class="hljs-number">0</span>       |        <span class="hljs-number">1</span>        |   <span class="hljs-number">73</span>  |
 |      <span class="hljs-number">1</span>       |        <span class="hljs-number">0</span>        |  <span class="hljs-number">155</span>  |
 |      <span class="hljs-number">1</span>       |        <span class="hljs-number">1</span>        |  <span class="hljs-number">2378</span> |
 +--------------+-----------------+-------+
 [<span class="hljs-number">4</span> rows x <span class="hljs-number">3</span> columns]}

结果达到约96%的精度，为作对比，仅用.create()方法，结果如下：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
<span class="hljs-prompt">&gt;&gt;&gt;</span> model = gl.neuralnet_classifier.create(cats_dogs_train, target=<span class="hljs-string">'label'</span>, features = [<span class="hljs-string">'image'</span>] )
<span class="hljs-prompt">&gt;&gt;&gt;</span> model.evaluate(cats_dogs_test)
{<span class="hljs-string">'accuracy'</span><span class="hljs-symbol">:</span> <span class="hljs-number">0</span>.<span class="hljs-number">6049019694328308</span>, <span class="hljs-string">'confusion_matrix'</span><span class="hljs-symbol">:</span> <span class="hljs-constant">Columns</span><span class="hljs-symbol">:</span>
 	target_label	int
 	predicted_label	int
 	count	int
 
 <span class="hljs-constant">Rows</span><span class="hljs-symbol">:</span> <span class="hljs-number">4</span>
 
 <span class="hljs-constant">Data</span><span class="hljs-symbol">:</span>
 +--------------+-----------------+-------+
 | target_label | predicted_label | count |
 +--------------+-----------------+-------+
 |      <span class="hljs-number">0</span>       |        <span class="hljs-number">0</span>        |  <span class="hljs-number">922</span>  |
 |      <span class="hljs-number">1</span>       |        <span class="hljs-number">0</span>        |  <span class="hljs-number">415</span>  |
 |      <span class="hljs-number">0</span>       |        <span class="hljs-number">1</span>        |  <span class="hljs-number">1600</span> |
 |      <span class="hljs-number">1</span>       |        <span class="hljs-number">1</span>        |  <span class="hljs-number">2163</span> |
 +--------------+-----------------+-------+
 [<span class="hljs-number">4</span> rows x <span class="hljs-number">3</span> columns]}

精度仅60%。很明显，提取特征结合简单的分类器的方法超级强悍。

为了确保此方法具有通用性，在CIFAR-10上验证。CIFAR有6万张32×32的图像，总共分为10类，5万张训练图像，一万张测试图像。少量例图如下：

重复上述步骤：

1
2
3
4
5
6
7
8
9
10
11
12
<span class="hljs-title">cifar_train</span> = graphlab.SFrame(<span class="hljs-string">'http://s3./GraphLab-Datasets/cifar_10/cifar_10_train_sframe'</span>)
cifar_test = graphlab.SFrame(<span class="hljs-string">'http://s3./GraphLab-Datasets/cifar_10/cifar_10_test_sframe'</span>)
<span class="hljs-comment"># preprocess</span>
cifar_train[<span class="hljs-string">'image'</span>] = graphlab.image_analysis.resize(cifar_train[<span class="hljs-string">'image'</span>], <span class="hljs-number">256</span>, <span class="hljs-number">256</span>, <span class="hljs-number">3</span>)
cifar_test[<span class="hljs-string">'image'</span>] = graphlab.image_analysis.resize(cifar_test[<span class="hljs-string">'image'</span>], <span class="hljs-number">256</span>, <span class="hljs-number">256</span>, <span class="hljs-number">3</span>)
<span class="hljs-comment"># Stage 2</span>
cifar_train[<span class="hljs-string">'features'</span>] = pretrained_model.extract_features(cifar_train)
cifar_test[<span class="hljs-string">'features'</span>] = pretrained_model.extract_features(cifar_test)
<span class="hljs-comment"># Stage 3</span>
classifier = graphlab.classifier.create(cifar_train, features=[<span class="hljs-string">'features'</span>], target=<span class="hljs-string">'label'</span>)
<span class="hljs-comment"># Evaluate</span>
classifier.evaluate(cifar_test)

做评估：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
{'accuracy': 0.9478, 'confusion_matrix': Columns:
 	target_label	str
 	predicted_label	str
 	count	int
 
 Rows: 100
 
 Data:
 +<span class="hljs-comment">--------------+-----------------+-------+</span>
 | target_label | predicted_label | count |
 +<span class="hljs-comment">--------------+-----------------+-------+</span>
 |      0       |        0        |  733  |
 |      0       |        1        |   25  |
 |      0       |        2        |   76  |
 |      0       |        3        |   19  |
 |      0       |        4        |   13  |
 |      0       |        5        |   7   |
 |      0       |        6        |   8   |
 |      0       |        7        |   26  |
 |      0       |        8        |   58  |
 |      0       |        9        |   23  |
 |     ...      |       ...       |  ...  |
 +<span class="hljs-comment">--------------+-----------------+-------+</span>
 [100 rows x 3 columns]
 Note: Only the head of the SFrame is printed.
 You can <span class="hljs-operator"><span class="hljs-keyword">use</span> print_rows(num_rows=m, num_columns=n) <span class="hljs-keyword">to</span> print more <span class="hljs-keyword">rows</span> <span class="hljs-keyword">and</span> <span class="hljs-keyword">columns</span>.}</span>