梯度为0
1. Hessian矩阵
用泰勒展开对loss函数展开:第一项为常量、第二项为一次导数、第三项为二次倒数(偏微分中组成hessian矩阵。
如果一次倒数为0,那么$f(\theta)$由hessian决定;
一次倒数为0有如下三种情况;极大值位置、极小值位置、鞍点(saddle point)
2. 特征向量与特征值
2.1 正定矩阵
一个n×n的实对称矩阵{\displaystyle M}是正定的,当且仅当对于所有的非零实系数向量z,都有$z^TMz > 0$。其中zT表示z的转置,z是非零的。
3. 极值
当$xHx\le 0$;那么$f(\theta)$与$f(\theta……0)$的关系由后面的$O(\theta^3)$项决定
4. 海塞矩阵特征值
Hessian矩阵的特征值就是复形容其在该点附近特征向量方向的凹凸性,特征值越大,凸性越强,它控制着步长。
### 局部最小都是全局最小??