Rethinking the Value of Network Pruning #9

ryoherisson · 2021-01-27T14:35:54Z

一言でいうと

学習=>剪定=>再学習のプロセスを経た大規模な構造化剪定モデルよりも，重みがランダムに初期化された剪定モデルの方が精度が良い．

Zhuang Liu, Mingjie Sun, Tinghui Zhou, Gao Huang, Trevor Darrell
(University of California, Tsinghua University)

2019/03/05

FineTuningされた剪定モデルは，重みがランダムに初期化された剪定モデルを学習するよりも，精度が同等か低いことを実験から示した．
その他，構造探索としてのPruningの可能性の検証を実施．

モデル

人手で定義（4モデル）
- L1-norm based Filter Pruning (Li et al. (2017))
- ThiNet (Luo et al. (2017))
- Regression based Feature Reconstruction (He et al. (2017b))
- Soft Filter Pruning (He et al. (2018a))
自動剪定（2モデル）
- Network Slimming (Liu et al. (2017))
- Sparse Structure Selection (Huang & Wang (2018))
非構造剪定モデル
- Unstructured magnitude-based weight pruning (Han et al. (2015))

人手で定義（L1-norm based Filter Pruning (Li et al., 2017)）

自動剪定（Network Slimming(Liu et al. (2017))）

構造探索としてのPruning

The Lottery Ticket Hypothesis (Frankle & Carbin, 2019) との比較

参考文献論文との結果の間に矛盾がある理由として，データオーグメンテーションやハイパーパラメータの設定，評価方法の違いがあるとしている．
Gale et al. (2019) The State of Sparsity in Deep Neural Networksで，非構造化スパースアーキテクチャではランダムな重みで初期化したモデルは，FineTuneモデルの精度よりも低い，と指摘されている．

ryoherisson self-assigned this Jan 27, 2021

nocotan added the network pruning label Jun 3, 2021