漫话深度学习及其应用（1）

来自：现代科普图书馆 > 馆藏分类

配色：

字号：大中小

漫话深度学习及其应用（1）

2024-05-10 | 阅：转： | 分享

漫话深度学习及其应用（1）

胡经国

一、深度学习概述

深度学习（Deep Learning，DL），是机器学习（Machine Learning，ML）领域中的一个新的研究方向；它被引入机器学习使其更加接近于最初的目标——人工智能（Artificial Intelligence，AI）。

深度学习是学习“样本数据的内在规律和表示层次”；在这些学习过程中获得的信息，对于诸如文字、图像和声音等数据的解释有很大的帮助。它的最终目标是让“机器能够像人一样”具有分析学习能力，能够识别文字、图像和声音等数据。深度学习是一个“复杂的机器学习算法”，在语音和图像识别方面取得的效果，远远超过先前的相关技术。

深度学习在搜索技术、数据挖掘、机器学习、机器翻译、自然语言处理、多媒体学习、语音、推荐和个性化技术，以及其他相关领域，都取得了很多成果。深度学习使机器模仿“视听和思考等人类活动”，解决了很多复杂的“模式识别”难题，使得人工智能相关技术取得了很大进步。

二、深度学习的3类主要方法

1、3类主要方法简介

深度学习是“模式分析方法”的统称；就具体研究内容而言，主要涉及以下3类方法：

⑴、基于“卷积运算”的卷积神经网络

基于“卷积运算”的神经网络系统，即：“卷积神经网络”（Convolutional Neural Network，CNN）。

⑵、基于“多层神经元”的多层自编码神经网络

基于“多层神经元”的多层自编码神经网络，包括：自（动）编码（器）（Auto Encoder）以及近年来受到广泛关注的“稀疏编码”（Sparse Coding）两类。

⑶、深度置信网络

以“多层自编码神经网络”的方式进行“预训练”；进而结合鉴别信息，进一步优化神经网络权值的深度置信网络（Deep Belief Network，DBN）。

通过“多层处理”，在逐渐将“初始的低层特征表示”转化为“高层特征表示”以后，用“简单模型”即可以完成复杂的“分类等学习任务”。由此，可将深度学习理解为进行“特征学习”（Feature Learning）或“表征（示）学习”（Representation Learning）。

以往，在将机器学习应用于现实任务时，描述“样本的特征”通常需要由人类专家来设计，这被称为“特征工程”（Feature Engineering）。众所周知，“特征的好坏”对于“泛化性能”具有至关重要的影响，人类专家设计出“好特征”也并非易事。而“特征学习（或表征（示）学习）”则通过机器学习技术自身来产生“好特征”；这使得机器学习向“全自动数据分析”又前进了一步。

2、3类主要方法相结合

近年来，研究人员也逐渐将这几类主要方法相结合起来。例如，对于原本是以“有监督学习”为基础的“卷积神经网络”，结合“自编码神经网络”来进行“无监督学习”的预训练；进而利用“鉴别信息微调网络参数”形成的“卷积深度置信网络”。与传统的学习方法相比较，由于深度学习方法预设了更多的“模型参数”，因而模型训练难度更大。根据统计学习的一般规律可以知道，“模型参数”越多，就需要参与训练的数据量也越大。

在20世纪八、九十年代，由于计算机计算能力（算力）有限和相关技术的限制，可用于分析的数据量太小，因而深度学习在“模式分析”中并没有表现出优异的识别性能。

3、3类主要方法的研究与应用

自从2006年，Hinton等提出快速计算“受限玻耳兹曼机”（Restricted Boltzmann Machine，RBM）网络权值及偏差的CD-K算法以后，RBM就成为了“增加神经网络深度”的有力工具，导致后面使用广泛的DBN（Deep Belived Network，深度信任网络）（由Hinton等开发并且已被微软等公司用于语音识别中）等“深度网络”的出现。

与此同时，“稀疏编码”等由于能自动从数据中提取特征也被应用于深度学习中。基于局部数据区域的“卷积神经网络”方法，近年来也被大量研究。

三、深度学习译义与流程图

1、深度学习译义

深度学习是机器学习的一种；而机器学习则是实现人工智能的必经路径。

深度学习的概念来源于“人工神经网络的研究”；含有多个“隐（藏）层”的“多层感知器”就是一种深度学习模型。

深度学习通过组合“低层特征”，形成更加抽象的“高层表示属性类别或特征”，从而发现“数据的分布式特征表示”。

研究深度学习的动机，在于“建立模拟人脑进行分析学习的神经网络”；它模仿人脑的机制来解释数据，例如图像、声音和文本等。

2、深度学习模型与流程图

⑴、流程图

下图为：含有多个“隐（藏）层”的深度学习模型（图源：网络）。

从一个输入中产生一个输出所涉及的计算，可以通过一个流程图（Flow Graph）来表示。

流程图是一种“能够表示计算”的图。在这种图中，每一个“节点”表示一个基本的计算以及一个计算的值；计算的结果被应用到这个节点的“子节点”的值。考虑这样一个“计算集合”，它可以被允许在每一个节点和可能的图结构中，并且定义了一个“函数族”。“输入节点”没有父节点，“输出节点”没有子节点。

⑵、流程图特别属性：深度

这种流程图的一个特别属性是“深度”（Depth），即：从一个输入到一个输出的最长路径的长度。

传统的“前馈神经网络”能够被看作拥有“等于层数”的深度（比如，对于输出层为隐层数加1）。SVMs（Support Vector Machines，支持向量机）有深度2（其中，一个对应于核输出或者特征空间；另一个对应于所产生输出的线性混合）。

3、人工智能研究的方向

⑴、专家系统

人工智能研究方向之一，是以所谓 “专家系统”（Expert System）为代表的，用大量“如果－那么”（If-Then）规则定义的，“自上而下的思路”。

⑵、人工神经网络

“人工神经网络”（Artificial Neural Network，ANN），标志着另外一种“自下而上的思路”。人工神经网络没有一个严格的正式定义。它的基本特点是：试图模仿人类大脑的神经元之间传递、处理信息的模式。

（未完待续）

2

献花(0)

(本文系现代科普图...原创)

类似文章 更多

发表评论：