矩阵求导与标准方程法

    技术2022-07-16  78

    目录

    一、分子布局与分母布局

    二、矩阵求导的一般形式

    三、常用到的矩阵求导 

    四、标准方程法


    一、分子布局与分母布局

    求导时可能会出现两种基本的形式,分别为分子布局和分母布局。

    分子布局,Numerator layout,是指分子为列向量或者分母为行向量。分母布局,Denominator layout,是指分子为行向量或者分母为列向量。对于其他的一些形式,我们既可以按分子布局处理,也可以按分母布局处理。

    我们约定用y、y和Y分别表示标量、向量和矩阵。

    二、矩阵求导的一般形式

    对于分子布局:

     

    对于分母布局: 

     

    对于特殊的:

     

    三、常用到的矩阵求导 

     

    对于以上表格中的内容,只要能确定分子为列向量或者分母为行向量,就按分子布局来求,只要确定分子为行向量或者分母为列向量,就按分母布局来求。

    比如,此处x代表向量。如果x为行向量,那么就属于分子布局,结果就是A,如果x时列向量,就属于分母布局,结果为A的转置。

    四、标准方程法

    标准方程法是代替梯度下降法求函数最优解的一种方法。以线性回归为例:

    优化函数为:

    由于MSE的优化函数为凸函数,只有一个全局最优解,所以直接使导数为零即可。

     

     

    Processed: 0.026, SQL: 10