分享

为什么神经网络,必须使用非线性的激活函数

 汉无为 2023-09-05 发布于湖北

神经网络之所以可以拟合任意函数,其中一个关键原因是,在神经元中使用了非线性的激活函数。下面我们用一个例子来说明这个问题。

Image

设置一个三层神经网络,第1层是输入层,输入特征x1x2和偏置1。第2层是隐藏层,包含ABC三个神经元。第3层是输出层,有一个神经元D。神经网络最终输出y。其中ABCD的权重使用小写字母abcd来代表。

Image

在神经网络中,如果激活函数是线性的,那么不管网络有多少层,都会等价于一个无隐藏层的线性模型。下面我们将激活函数设置为h(x)=x,来说明这一结论。

Image

计算神经网络的输出y,它等于神经元D的权重d1d2d3分别乘以神经元ABC的输出,再累加到一起。其中A=a1x1+a2x2+a0,同理可以计算出BC的值。

Image

ABC的输出带入到y的表达式中,然后将表达式展开,并进行调整。这时可以得到一个关于x1x2的线性结果。这里x1x2和偏置的系数都是常数,因此神经网络的输出y,依然是关于x1x2的线性变换。很明显,该神经网络是无法解决非线性问题的。

总结来说,一个没有非线性激活函数的神经网络,无论堆叠多少层,该神经网络仍然只是一个线性变换。

那么到这里,为什么神经网络必须使用非线性的激活函数,就讲完了,感谢大家的观看,我们下节课再会。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多