We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
VQAタスクにおけるOOD testingのベンチマークに関する問題点を指摘し,評価方法を議論.
https://papers.nips.cc/paper/2020/file/045117b0e0a11a242b9765e79cbf113f-Paper.pdf
Damien Teney et al. (Australian Institute for Machine Learning, University of Adelaide, Australia)
2020/12
Goodhart’s law: When a measure becomes a target, it ceases to be a good measure.
OOD testingは学習データセットのバイアスを解決する手法の一つとして非常に注目を集めている. OODベンチマークは学習データとテストデータが異なる同時分布となるように設計されている. VQA-CPはvisual question answeringにおける一般的なOODベンチマークの一つである. しかしながら,著者たちはこのデータセットは実際には3つの問題が存在することを発見した.
このような問題を解決する評価方法について議論.
The text was updated successfully, but these errors were encountered:
nocotan
No branches or pull requests
一言でいうと
VQAタスクにおけるOOD testingのベンチマークに関する問題点を指摘し,評価方法を議論.
論文リンク
https://papers.nips.cc/paper/2020/file/045117b0e0a11a242b9765e79cbf113f-Paper.pdf
著者/所属機関
Damien Teney et al.
(Australian Institute for Machine Learning, University of Adelaide, Australia)
投稿日付(yyyy/MM/dd)
2020/12
概要
OOD testingは学習データセットのバイアスを解決する手法の一つとして非常に注目を集めている.
OODベンチマークは学習データとテストデータが異なる同時分布となるように設計されている.
VQA-CPはvisual question answeringにおける一般的なOODベンチマークの一つである.
しかしながら,著者たちはこのデータセットは実際には3つの問題が存在することを発見した.
このような問題を解決する評価方法について議論.
新規性・差分
手法
結果
コメント
The text was updated successfully, but these errors were encountered: