博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
神经网络损失函数公式解读
阅读量:7138 次
发布时间:2019-06-28

本文共 315 字,大约阅读时间需要 1 分钟。

原文地址:https://www.cnblogs.com/pinard/p/6437495.html

上面地址是一篇讲解DNN的文章,其中部分公式推导过程,自己在这里做一些记录,方便以后查阅。

 

上图公式由下两图公式得来,a = [ 1/ (1 + e-z) ]对z的求导,用到了sigmoid函数,sigmoid函数求导后的结果 [ e-z / (1 + e-z)],经过转换变成了(aL)(1-aL)。红色部分是巧妙点,所以softmax的交叉熵损失函数可以规避sigmoid函数导数为0的问题,解决了梯度消失问题。

转载于:https://www.cnblogs.com/hoojjack/p/10494077.html

你可能感兴趣的文章
Java Notes 00 - Singleton Pattern(单例总结)
查看>>
【转】Linux内核源码分析方法
查看>>
.NET分布式事务处理(转)
查看>>
当一个项目中同时存在webroot和webcontext时
查看>>
在Java中打开浏览器
查看>>
取一种类型里面的产品销售前3甲的数据Sql
查看>>
索引初探(二)
查看>>
linux 打造man中文帮助手册
查看>>
[数分提高]2014-2015-2第6教学周第1次课讲义 3.3 Taylor 公式
查看>>
Android 最火框架XUtils之注解机制详解
查看>>
spring4.x注解概述
查看>>
Dynamic CRM 2015学习笔记(6)没有足够的权限 - 您没有访问这些记录的权限。请联系 Microsoft Dynamics CRM 管理员...
查看>>
C++序列化、反序列化
查看>>
Mysql学习笔记(七)查(补充)
查看>>
[裴礼文数学分析中的典型问题与方法习题参考解答]4.5.5
查看>>
自然科学与社会科学的区别
查看>>
访问者模式
查看>>
Hadoop: MapReduce2的几个基本示例
查看>>
javascript客户端检测技术
查看>>
16款纯CSS3实现的loading加载动画
查看>>