矩阵求导公式（矩阵转置求导公式实例）

当前位置：首页>维修大全>综合>

更新时间：2024-09-08 13:21:33

矩阵求导公式

矩阵Y对标量x求导：

相当于每个元素求导数后转置一下，注意M×N矩阵求导后变成N×M了

Y = [y(ij)] --> dY/dx = [dy(ji)/dx]

矩阵的微分是函数导数的概念形式推广到矩阵的情形。矩阵微分根据对不同变量的求导，有不同形式。

定义一：设m×n矩阵

a（t）＝【amn（t）】

的每个元素aij（t）都是自变量t的可导函数，则称m×n矩阵【δamn（t）/δt】为a（t）关于变量t的导数，记为δa（t）/δt；

定义二：设a为m×n阵，f（a）为矩阵a的数量值函数。若f（a）关于a的任一元素aij的偏导δf/ δaij都存在，则称【δf/δamn】为f（a）关于a＝（aij）的导数，记为δf（a）/δa；

定义三：设a为m×n维矩阵型变量，a＝（aij），g（a）维a的矩阵值函数（p×q维）即g（a）＝【g（a）pq】，其中g（a）ij都为a的数值量函数，且关于a可导，则称【δg/δaij】＝△⊙g（△应是倒三角，为[δ／δaij],hamilton算子矩阵；⊙应是乘号加圈，为kronecker积）；

基本公式：

Y = A * X --> DY/DX = A'

Y = X * A --> DY/DX = A

Y = A' * X * B --> DY/DX = A * B'

Y = A' * X' * B --> DY/DX = B * A'

1. 矩阵Y对标量x求导：

相当于每个元素求导数后转置一下，注意M×N矩阵求导后变成N×M了

Y = [y(ij)] --> dY/dx = [dy(ji)/dx]

2. 标量y对列向量X求导：

注意与上面不同，这次括号内是求偏导，不转置，对N×1向量求导后还是N×1向量

y = f(x1,x2,..,xn) --> dy/dX =(Dy/Dx1,Dy/Dx2,..,Dy/Dxn)'

3. 行向量Y'对列向量X求导：