We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
ANMLの中のリプレイ法で紹介された論文 ↓ 詳細は以下の記事がわかりやすかった https://qiita.com/d-ogawa/items/38dcdfda926739b49d55
リプレイ法とは,以前の経験を保存し、新たに遭遇したデータと混合する事で忘却を軽減する手法で,タスクをスケーリングしていくことは計算コストや記憶の点で,出来ない
https://arxiv.org/abs/1511.05952
Tom Schaul, John Quan, Ioannis Antonoglou and David Silver Google DeepMind {schaul,johnquan,ioannisa,davidsilver}@google.com
[v1] Wed, 18 Nov 2015 20:54:44 UTC (1,194 KB)
The text was updated successfully, but these errors were encountered:
sarrrrry
No branches or pull requests
一言でいうと
ANMLの中のリプレイ法で紹介された論文
↓ 詳細は以下の記事がわかりやすかった
https://qiita.com/d-ogawa/items/38dcdfda926739b49d55
リプレイ法とは,以前の経験を保存し、新たに遭遇したデータと混合する事で忘却を軽減する手法で,タスクをスケーリングしていくことは計算コストや記憶の点で,出来ない
論文リンク
https://arxiv.org/abs/1511.05952
著者/所属機関
Tom Schaul, John Quan, Ioannis Antonoglou and David Silver
Google DeepMind
{schaul,johnquan,ioannisa,davidsilver}@google.com
投稿日付(yyyy/MM/dd)
[v1] Wed, 18 Nov 2015 20:54:44 UTC (1,194 KB)
概要
新規性・差分
手法
結果
コメント
The text was updated successfully, but these errors were encountered: