|
1 注意力机制 我们可以通过眼睛看到各种各样的事物,感知世界上的大量信息,可以让自己免受海量信息的干扰,是因为人的选择能力,可以选择重要的信息,而忽视不重要的信息。 举个例子,下面有一张图片,当我们看到这张图片的时候会下意识把注意力集中到能猫的身上,而忽略背景。
同样,希望网络也具有这种能力,从而在网络中引入了注意力机制。注意力机制,是对输入进行加权再输出,希望网络关注到的地方给较大的权重,不希望网络注意的地方给较小的权重。 再举个例子,在自然语言处理领域,在分析一句话的时候,并不是所有的词的信息都需要被关注,可以选择重要的词分析,即可理解句子所传达的语义。 另外想自学机器学习深度学习,不知道如何入门同学,阿文还为大家整理了一份2025最新入门路线图(更新迭代不下10次),包含基础、理论、代码、实战项目、必读论文等等,希望可以帮到大家,大家可以添加小助手无偿自取,不要忘了发送截图哦
当中所有资源都已下载整理好了~ 添加小助手无偿自取即可 2 通道注意力机制 通道注意力机制的代表模型是:压缩和激励网络(Squeeze-and-Excitation Networks,SENet),SENet分为压缩和激励两个部分,其中压缩部分的目的是对全局空间信息进行压缩,然后在通道维度进行特征学习,形成各个通对道的重要性,最后通过激励部分对各个通道进行分配不同权重的。
上图是SE模块的结构,在压缩部分,输入的元素特征图的维度是 HxWxC,H、W 和 C分别代表高度、宽度和通道数。压缩部分的功能是将维数从 HxWxC 压缩至1x1xC,即把, HxW 压缩为 1x1 维这个过程由全局平均池化实现。 在激励部分,需要将压缩部分得到的 1x1xC 的维度融入全连接层,预测各个通道的重要程度,然后再激励到前面特征图对应通道上进行操作。采用简单的门控机制与Sigmoid 激活函数。
3 空间注意力机制 空间注意力机制的代表模型是:空间变换神经网络(Spatial TransformerNetworks,STN),STN能够对各种形变数据在空间中进行转换并自动捕获重要区域特征。它能够保证图像在经过裁剪、平移或者旋转等操作后,依然可以获得和操作前的原始图像相同的结果。 举个例子,在MNIST数字分类的中应用STN,该分类过程一共包含4个步骤:
STN 网络包括局部网络、参数化网络采样(网络生成器)和差分图像采样。 局部网络:预测输入数字的变换(是平移了?还是缩放了?或是旋转了?) 网络生成器:获得输出特征图坐标点在输入特征图中坐标点的对应位置
4 混合注意力机制 在混合注意力机制中,通道注意力和空间注意力可以通过串联、或者并联的方式进行组合 混合注意力机制的代表模型是:卷积注意力模块(Convolutional BlockAtention Module,CBAM)它包括通道注意力模块CAM、和空间注意力模块SAM。 CBAM的模型结构如下,它对输入的特征图,首先进行通道注意力模块处理;得到的结果,再经过空间注意力模块处理,最后得到调整后特征。
通道注意力模块CAM CAM的输入是特征图,维度设为HxWxC;其中H是指特征图的高度,W是指宽度,C是指通道数。它的思路流程是:
计算公式如下:
空间注意力模块SAM SAM的输入是CAM输出的特征图。它的思路流程是:
计算公式如下:
5 自注意力机制 背景:在注意力机制引入计算机视觉前,主要是靠叠加卷积层与池化层来进行特征提取,并扩大感受野。举个例子,在语义分割中,Deeplab系列提出的带有多尺度空洞卷积的 ASPP 模块:
6 注意力基础 注意力机制原理 注意力机制在语义分割和图像描述生成方面被广泛使用。使用注意力处理任务时,不同信息的重要程度由权值来体现。 注意力机制对不同信息关注度的区分体现在权值分配,注意力机制可以视为查询矩阵、键以及加权平均值构成了多层感知机(Multilayer Perceptron, MLP)。 注意力的思想,类似于寻址。给定 Query,去 Source 中计算 Query和不同 Key 的相关性,即计算Source 中不同 Value 值的权重系数;Value 的加权平均结果可以作为注意力值。 ![]() 注意力的计算公式如下: ![]() 其中Lx代表Source的长度 注意力机制的计算过程 大多数方法采用的注意力机制计算过程可以细化为如下三个阶段。三阶段的注意力机制计算流程:
公式化表示: 第一阶段是计算 Query和不同 Key 的相关性,即计算不同 Value 值的权重系数;相关性计算主要包括点积、余弦相似性或者引入神经网络这三种方法。计算方式分别如下:
第二阶段对上一阶段的输出进行归一化处理,将数值的范围映射到0和1之间。其中,ai表第i个值被分为的权重值。
第三阶段,对值和每个值对应的权重相乘的结果做累加操作,从而获得注意力数值。
放在最后: 另外想结合AI发文发刊,但不知道怎么做创新的同学,我们team磨练出了一套系统且专业的传统学科交叉AI科研入门方案,可带学生发paper,已迭代五次(持续迭代中),我们会根据你的研究方向来规划学习路径,并且根据你的实验数据分为了时序、图结构、影像三大实验室,详细学习规划可添加另一位科研助理微信咨询:dtjy951 或扫描下方二维码
感兴趣可扫码添加科研助理咨询~
|
|
|