Jacobian矩阵 用于一阶梯度下降法
Hessian矩阵, 用于二阶牛顿法
高斯牛顿法, 使用JTJ作为牛顿法中二阶Hessian矩阵的近似, 从而省略了计算H的过程
http://jacoxu.com/jacobian%E7%9F%A9%E9%98%B5%E5%92%8Chessian%E7%9F%A9%E9%98%B5/
Hessian是对称矩阵
jacobian, Hassian and gradient 关系
https://blog.csdn.net/DSbatigol/article/details/12558891
variance, 方差: 二阶矩
一个随机变量的方差描述的是它的离散程度,也就是该变量离其期望值的距离
期望: 一阶矩 https://zh.wikipedia.org/wiki/%E5%8D%8F%E6%96%B9%E5%B7%AE