-Net由FACE++提出,论文地址:
1、背景:
训练神经网络需要大量的时间,为了减少这些时间,对模型进行量化是个不错的选择 。但是,以往的工作没有对梯度/激活函数进行低bit量化并取得好的结果的先例 。所以,-Net被提了出来 。
2、贡献:3、方法: 3.1
在用bit运算来加速网络上,-Net使用了和以前工作相似的方式:
3.2
STE:
这种STE加入了噪声,文章说这对网络性能的提升很关键 。同时,上图的12式将梯度的范围限制到了[0,1] 。
3.3
总的运行框架:
【论文笔记:Dorefa】4.结果
事实上,的在W=1,A=1,G=32时表现并没有Xnor-Net好,其中原因值得进一步探讨 。事实上,读者感觉这篇文章的方向有点跑偏,或者是没做得足够好 。出于减少训练时间而量化梯度的本意是好的,但是这以不可接受的精度损失为代价是不可行的 。本文的主要贡献可能在于其提出了一种分层量化权重,激活和梯度的思想 。
- 论文解读《Semi
- 并发编程学习笔记 基于Python
- 基于STM32和ADS1118的热电偶设计笔记
- 二极、三极管 电子器件笔记
- 【笔记】openwrt - iptables 命令、例子、日志
- 移动wifi显示限制服务器,涨姿势|笔记本电脑连WiFi时显示受限怎么办?
- 《从点子到产品》读书笔记之产品价值和用户痛点
- ICV 智能网联汽车 技术的发展现状及趋势(论文学习思维导图)
- 二 Android集成百度地图SDK笔记
- WinXP下利用笔记本无线网卡创建WIFI热点