配色: 字号:
漫话深度学习及其应用(1)
2024-05-10 | 阅:  转:  |  分享 
  
漫话深度学习及其应用(1)

胡经国



一、深度学习概述

深度学习(Deep Learning,DL),是机器学习(Machine Learning,ML)领域中的一个新的研究方向;它被引入机器学习使其更加接近于最初的目标——人工智能(Artificial Intelligence,AI)。

深度学习是学习“样本数据的内在规律和表示层次”;在这些学习过程中获得的信息,对于诸如文字、图像和声音等数据的解释有很大的帮助。它的最终目标是让“机器能够像人一样”具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个“复杂的机器学习算法”,在语音和图像识别方面取得的效果,远远超过先前的相关技术。

深度学习在搜索技术、数据挖掘、机器学习、机器翻译、自然语言处理、多媒体学习、语音、推荐和个性化技术,以及其他相关领域,都取得了很多成果。深度学习使机器模仿“视听和思考等人类活动”,解决了很多复杂的“模式识别”难题,使得人工智能相关技术取得了很大进步。

二、深度学习的3类主要方法

1、3类主要方法简介

深度学习是“模式分析方法”的统称;就具体研究内容而言,主要涉及以下3类方法:

⑴、基于“卷积运算”的卷积神经网络

基于“卷积运算”的神经网络系统,即:“卷积神经网络”(Convolutional Neural Network,CNN)。

⑵、基于“多层神经元”的多层自编码神经网络

基于“多层神经元”的多层自编码神经网络,包括:自(动)编码(器)(Auto Encoder)以及近年来受到广泛关注的“稀疏编码”(Sparse Coding)两类。

⑶、深度置信网络

以“多层自编码神经网络”的方式进行“预训练”;进而结合鉴别信息,进一步优化神经网络权值的深度置信网络(Deep Belief Network,DBN)。

通过“多层处理”,在逐渐将“初始的低层特征表示”转化为“高层特征表示”以后,用“简单模型”即可以完成复杂的“分类等学习任务”。由此,可将深度学习理解为进行“特征学习”(Feature Learning)或“表征(示)学习”(Representation Learning)。

以往,在将机器学习应用于现实任务时,描述“样本的特征”通常需要由人类专家来设计,这被称为“特征工程”(Feature Engineering)。众所周知,“特征的好坏”对于“泛化性能”具有至关重要的影响,人类专家设计出“好特征”也并非易事。而“特征学习(或表征(示)学习)”则通过机器学习技术自身来产生“好特征”;这使得机器学习向“全自动数据分析”又前进了一步。

2、3类主要方法相结合

近年来,研究人员也逐渐将这几类主要方法相结合起来。例如,对于原本是以“有监督学习”为基础的“卷积神经网络”,结合“自编码神经网络”来进行“无监督学习”的预训练;进而利用“鉴别信息微调网络参数”形成的“卷积深度置信网络”。与传统的学习方法相比较,由于深度学习方法预设了更多的“模型参数”,因而模型训练难度更大。根据统计学习的一般规律可以知道,“模型参数”越多,就需要参与训练的数据量也越大。

在20世纪八、九十年代,由于计算机计算能力(算力)有限和相关技术的限制,可用于分析的数据量太小,因而深度学习在“模式分析”中并没有表现出优异的识别性能。

3、3类主要方法的研究与应用

自从2006年,Hinton等提出快速计算“受限玻耳兹曼机”(Restricted Boltzmann Machine,RBM)网络权值及偏差的CD-K算法以后,RBM就成为了“增加神经网络深度”的有力工具,导致后面使用广泛的DBN(Deep Belived Network,深度信任网络)(由Hinton等开发并且已被微软等公司用于语音识别中)等“深度网络”的出现。

与此同时,“稀疏编码”等由于能自动从数据中提取特征也被应用于深度学习中。基于局部数据区域的“卷积神经网络”方法,近年来也被大量研究。

三、深度学习译义与流程图

1、深度学习译义

深度学习是机器学习的一种;而机器学习则是实现人工智能的必经路径。

深度学习的概念来源于“人工神经网络的研究”;含有多个“隐(藏)层”的“多层感知器”就是一种深度学习模型。

深度学习通过组合“低层特征”,形成更加抽象的“高层表示属性类别或特征”,从而发现“数据的分布式特征表示”。

研究深度学习的动机,在于“建立模拟人脑进行分析学习的神经网络”;它模仿人脑的机制来解释数据,例如图像、声音和文本等。

2、深度学习模型与流程图

⑴、流程图

下图为:含有多个“隐(藏)层”的深度学习模型(图源:网络)。

从一个输入中产生一个输出所涉及的计算,可以通过一个流程图(Flow Graph)来表示。

流程图是一种“能够表示计算”的图。在这种图中,每一个“节点”表示一个基本的计算以及一个计算的值;计算的结果被应用到这个节点的“子节点”的值。考虑这样一个“计算集合”,它可以被允许在每一个节点和可能的图结构中,并且定义了一个“函数族”。“输入节点”没有父节点,“输出节点”没有子节点。

⑵、流程图特别属性:深度





这种流程图的一个特别属性是“深度”(Depth),即:从一个输入到一个输出的最长路径的长度。

传统的“前馈神经网络”能够被看作拥有“等于层数”的深度(比如,对于输出层为隐层数加1)。SVMs(Support Vector Machines,支持向量机)有深度2(其中,一个对应于核输出或者特征空间;另一个对应于所产生输出的线性混合)。

3、人工智能研究的方向

⑴、专家系统

人工智能研究方向之一,是以所谓 “专家系统”(Expert System)为代表的,用大量“如果-那么”(If-Then)规则定义的,“自上而下的思路”。

⑵、人工神经网络

“人工神经网络”(Artificial Neural Network,ANN),标志着另外一种“自下而上的思路”。人工神经网络没有一个严格的正式定义。它的基本特点是:试图模仿人类大脑的神经元之间传递、处理信息的模式。

(未完待续)









2







献花(0)
+1
(本文系现代科普图...原创)