Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Rethinking the Value of Network Pruning #9

Open
ryoherisson opened this issue Jan 27, 2021 · 0 comments
Open

Rethinking the Value of Network Pruning #9

ryoherisson opened this issue Jan 27, 2021 · 0 comments
Assignees

Comments

@ryoherisson
Copy link
Contributor

一言でいうと

学習=>剪定=>再学習のプロセスを経た大規模な構造化剪定モデルよりも,重みがランダムに初期化された剪定モデルの方が精度が良い.

論文リンク

https://openreview.net/pdf?id=rJlnB3C5Ym

著者/所属機関

Zhuang Liu, Mingjie Sun, Tinghui Zhou, Gao Huang, Trevor Darrell
(University of California, Tsinghua University)

投稿日付(yyyy/MM/dd)

2019/03/05

概要

FineTuningされた剪定モデルは,重みがランダムに初期化された剪定モデルを学習するよりも,精度が同等か低いことを実験から示した.
その他,構造探索としてのPruningの可能性の検証を実施.

新規性・差分

  • 大規模な剪定モデルの学習は必要なく,小さなネットワークアーキテクチャのモデルで代替可能.
  • 大規模モデルの学習された「重要な」重みは,小さな剪定されたモデルでは役に立たないことが多い.
  • 継承された「重要な」重みのセットよりも,剪定されたアーキテクチャ自体の方がより重要.

手法

モデル

  • 人手で定義(4モデル)
    • L1-norm based Filter Pruning (Li et al. (2017))
    • ThiNet (Luo et al. (2017))
    • Regression based Feature Reconstruction (He et al. (2017b))
    • Soft Filter Pruning (He et al. (2018a))
  • 自動剪定(2モデル)
    • Network Slimming (Liu et al. (2017))
    • Sparse Structure Selection (Huang & Wang (2018))
  • 非構造剪定モデル
    • Unstructured magnitude-based weight pruning (Han et al. (2015))

結果

人手で定義(L1-norm based Filter Pruning (Li et al., 2017))
スクリーンショット 2021-01-27 23 24 23

自動剪定(Network Slimming(Liu et al. (2017)))
スクリーンショット 2021-01-27 23 23 06

構造探索としてのPruning
スクリーンショット 2021-01-27 23 25 41

The Lottery Ticket Hypothesis (Frankle & Carbin, 2019) との比較
スクリーンショット 2021-01-27 22 31 06

コメント

  • 参考文献論文との結果の間に矛盾がある理由として,データオーグメンテーションやハイパーパラメータの設定,評価方法の違いがあるとしている.
  • Gale et al. (2019) The State of Sparsity in Deep Neural Networksで,非構造化スパースアーキテクチャではランダムな重みで初期化したモデルは,FineTuneモデルの精度よりも低い,と指摘されている.
@ryoherisson ryoherisson self-assigned this Jan 27, 2021
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants