Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Network Quantization with Element-wise Gradient Scaling #33

Open
ryoherisson opened this issue Jun 10, 2021 · 0 comments
Open

Network Quantization with Element-wise Gradient Scaling #33

ryoherisson opened this issue Jun 10, 2021 · 0 comments
Assignees

Comments

@ryoherisson
Copy link
Contributor

ryoherisson commented Jun 10, 2021

一言でいうと

離散化誤差を考慮するため,各層の勾配とスケーリングファクターを適応的に調整するEWGSを提案.

論文リンク

著者/所属機関

Junghyup Lee, Dohyung Kim, Bumsub Ham
(Yonsei University)

投稿日付(yyyy/MM/dd)

2021/04/02

概要

既存手法のSTEでは,離散値で得られた勾配を用いて更新をしており,丸めによって生じる離散化誤差を考慮していないという課題がある.

提案手法のEWGSでは,離散的な値の勾配の符号と,潜在的な値と離散的な値の間の離散化誤差を考慮して,勾配の各要素を適応的にスケールアップまたはスケールダウンし, スケーリングされた勾配を用いて潜在値を更新する.

さらに,異なる層の重みや活性化量子化器によって異なる可能性があるため,学習中に適応的に係数を調整するアプローチを提案.

ImageNetにおいて最先端の性能を達成.

スクリーンショット 2021-06-11 9 02 36

新規性・差分

  • 離散化器の入出力間の離散化誤差を考慮しながら,離散値の各勾配要素を適応的にスケールアップまたはスケールダウンするEWGSを導入
  • スケーリングファクターを離散値に対する損失関数の2次導関数と関連付けることで,量子化されたネットワークのヘシアン情報を用いてパラメータを効果的かつ適応的に計算

手法

スクリーンショット 2021-06-11 9 40 55
スクリーンショット 2021-06-11 9 41 30

スケーリングファクター
スケーリングファクターを離散値に対するタスクロスの2階微分と関連づけ,Hessian行列のトレースを用いてファクターを推定
スクリーンショット 2021-06-11 9 42 39

結果

スクリーンショット 2021-06-11 9 39 31
スクリーンショット 2021-06-11 9 40 18

コメント

@ryoherisson ryoherisson self-assigned this Jun 10, 2021
@ryoherisson ryoherisson changed the title [WIP]Network Quantization with Element-wise Gradient Scaling Network Quantization with Element-wise Gradient Scaling Jun 11, 2021
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant