矩阵Y对标量x求导:
相当于每个元素求导数后转置一下,注意M×N矩阵求导后变成N×M了
Y = [y(ij)] --> dY/dx = [dy(ji)/dx]
矩阵的微分是函数导数的概念形式推广到矩阵的情形。矩阵微分根据对不同变量的求导,有不同形式。
定义一: 设m×n矩阵
a(t)=【amn(t)】
的每个元素aij(t)都是自变量t的可导函数,则称m×n矩阵【δamn(t)/δt】为a(t)关于变量t的导数,记为δa(t)/δt;
定义二:设a为m×n阵,f(a)为矩阵a的数量值函数。若f(a)关于a的任一元素aij的偏导δf/ δaij都存在,则称【δf/δamn】为f(a)关于a=(aij)的导数,记为δf(a)/δa;
定义三:设a为m×n维矩阵型变量,a=(aij),g(a)维a的矩阵值函数(p×q维)即g(a)=【g(a)pq】,其中g(a)ij都为a的数值量函数,且关于a可导,则称【δg/δaij】=△⊙g(△应是倒三角,为[δ/δaij],hamilton算子矩阵;⊙应是乘号加圈,为kronecker积);
基本公式:
Y = A * X --> DY/DX = A'
Y = X * A --> DY/DX = A
Y = A' * X * B --> DY/DX = A * B'
Y = A' * X' * B --> DY/DX = B * A'
1. 矩阵Y对标量x求导:
相当于每个元素求导数后转置一下,注意M×N矩阵求导后变成N×M了
Y = [y(ij)] --> dY/dx = [dy(ji)/dx]
2. 标量y对列向量X求导:
注意与上面不同,这次括号内是求偏导,不转置,对N×1向量求导后还是N×1向量
y = f(x1,x2,..,xn) --> dy/dX =(Dy/Dx1,Dy/Dx2,..,Dy/Dxn)'
3. 行向量Y'对列向量X求导:
注意1×M向量对N×1向量求导后是N×M矩阵。
将Y的每一列对X求偏导,将各列构成一个矩阵。