前提及说明第一次遇见矩阵求导,大多数人都是一头雾水,而搜了维基百科看也还是云里雾里,一堆的名词和一堆的表格到底都是什么呢?这里总结了我个人的学习经验,并且通过一个例子可以让你感受如何进行矩阵求导,下次再遇到需要进行矩阵求导的地方就不会措手不及。 在进行概念的解说之前,首先大家需要先知道下面的这个前提:
布局的概念布局简单地理解就是分子
为了更加深刻地理解两种布局的特点和区别,下面是从维基百科中布局部分拿来的例子: 分子布局
分母布局
一个求导的例子问题
式子演化看到这个例子不要急着去查表求导,先看看它的形式,是 然后就可以写成四个部分求导的形式如下(累加后求导=求导后累加):
求导
说明:分子部分为标量,分母部分为向量,找到维基百科中的Scalar-by-vector identities表格,在表格中匹配形式到第1行的位置,因为分母为列向量,因此为分母布局,对应的求导结果就是
说明:同样的,在维基百科中的Scalar-by-vector identities表格,在表格中匹配形式到第11行的位置,对应的求导结果就是
说明:因为分子为标量,标量的转置等于本身,所以对分子进行转置操作,其等价于第二部分。
说明:同样的,在维基百科中的Scalar-by-vector identities表格,在表格中匹配形式到第13行的位置,矩阵的转置乘上本身( 整合把四个部分求导结果进行相应的加减就可以得到最终的结果:
现在你再看看维基百科里那成堆的表格,是不是觉得异常实用了! 参考文献
|
|