的函数图像假设有一个点p1?(x1?,y1?),求在p1点处关于x的偏微分 的平面a要求这个平面过p1与函数相交于上图中的绿色曲线
即:无论在哪里,偏导数值相反方向都是到达谷底的方向。
总结偏微分的原理得到梯度下降公式如下:
α 控制步伐大小,不断重复上述更新直到拟合,即到达下图的山谷位置过程如下图所示:
即:梯度更新的算法核心在于求目标函数关于变量
常见的矩阵乘法有两种,一种是数学上的乘法另一种是对应位置相乘,例如:
且上述运算只是链式计算中的一环,即有
通过同样的推导方式可得到如下结论:
那么 (要注意左乘和右乘的区別):
Δ 作用,目的是为了保证形状
上面是比较直观的矩阵展开推导过程现在用矩阵乘法公式进行求导过程。条件和上面一致所以
这也就是矩阵链式求导使用numpy.oneslike
的原因
且上述运算只是链式计算中的一环,即有
其中 表示 对应的矩阵通过同样的推导方式可以得到:
反向传播算法本質是梯度更新,只不过它为了更方便计算机计算先求出每一层的误差并缓存,然后再梯度更新
由于采用cross entropy为损失函数,所以损失函数 J 有:
又因为使用激活函数都是
根据2.1的矩阵求导法则因为
求解了每一层的误差,接下来需要求我们需要更新的权重的梯度:
根据2.1矩阵求导公式因为
从而就可以应用梯度更新公式了
第 i 层的误差,与对应层使用的激活函数相关:
最后一层误差需要结合损失函数求导得到
梯度消失和梯喥爆炸问题,字面上理解就是
假设网络采用线性激活,即不采用激活函数即:
其中 L 表示网络层数,当网络很深时 a(i) 在计算梯度时,做常数处理所以梯度的值和上一层的误差成正相关所以:
小结:当网络很深时,深层网络的梯度更新与输出层误差无关即梯度不一定朝着梯度变小的方向更新。
条件还是和上述一致那么:
小结:当存在梯度爆炸或梯度消失时,网络的输出和网络的输入X不相关
通過3.1、3.2的总结,我们发现如果权重矩阵设置不当即:
所以权重初始化很重要,至于怎么初始化我们后续再讲解
3.2 梯度爆炸消失对前馈网络的影響
3.3 梯度爆炸、梯度消失原因总结
之前一篇文章写了。至于数据庫建表也不再赘述接下来介绍如何将数据进行mysql入库。
其实很简单数据源都拿到了,入库就是信手拈来着重介绍利用pymysql连接mysql数据库以及葑装。
以上还封装了数据操作的增删改查不用每次频繁的编写了。
在上文里的管道文件处理数据:
#调用封装好嘚mysql工具类 #参数就是我们爬取到的数据 #执行封装好的插入方法 #可以打印日志看看效果
补充:其实入库的数据处理也可以在爬虫文件的parse方法裏处理,写在管道里更好的发挥scrapy的异步优势,看个人习惯吧~
的函数图像假设有一个点p1?(x1?,y1?),求在p1点处关于x的偏微分 的平面a要求这个平面过p1与函数相交于上图中的绿色曲线
即:无论在哪里,偏导数值相反方向都是到达谷底的方向。
总结偏微分的原理得到梯度下降公式如下:
α 控制步伐大小,不断重复上述更新直到拟合,即到达下图的山谷位置过程如下图所示:
即:梯度更新的算法核心在于求目标函数关于变量
常见的矩阵乘法有两种,一种是数学上的乘法另一种是对应位置相乘,例如:
且上述运算只是链式计算中的一环,即有
通过同样的推导方式可得到如下结论:
那么 (要注意左乘和右乘的区別):
Δ 作用,目的是为了保证形状
上面是比较直观的矩阵展开推导过程现在用矩阵乘法公式进行求导过程。条件和上面一致所以
这也就是矩阵链式求导使用numpy.oneslike
的原因
且上述运算只是链式计算中的一环,即有
其中 表示 对应的矩阵通过同样的推导方式可以得到:
反向传播算法本質是梯度更新,只不过它为了更方便计算机计算先求出每一层的误差并缓存,然后再梯度更新
由于采用cross entropy为损失函数,所以损失函数 J 有:
又因为使用激活函数都是
根据2.1的矩阵求导法则因为
求解了每一层的误差,接下来需要求我们需要更新的权重的梯度:
根据2.1矩阵求导公式因为
从而就可以应用梯度更新公式了
第 i 层的误差,与对应层使用的激活函数相关:
最后一层误差需要结合损失函数求导得到
梯度消失和梯喥爆炸问题,字面上理解就是
假设网络采用线性激活,即不采用激活函数即:
其中 L 表示网络层数,当网络很深时 a(i) 在计算梯度时,做常数处理所以梯度的值和上一层的误差成正相关所以:
小结:当网络很深时,深层网络的梯度更新与输出层误差无关即梯度不一定朝着梯度变小的方向更新。
条件还是和上述一致那么:
小结:当存在梯度爆炸或梯度消失时,网络的输出和网络的输入X不相关
通過3.1、3.2的总结,我们发现如果权重矩阵设置不当即:
所以权重初始化很重要,至于怎么初始化我们后续再讲解
3.2 梯度爆炸消失对前馈网络的影響
3.3 梯度爆炸、梯度消失原因总结
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。