-
Notifications
You must be signed in to change notification settings - Fork 19
[Feature] JMTEB v2リリースに伴うリーダーボード更新&対応モデル追加 #93
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Conversation
akiFQC
left a comment
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
超大作ですね!!おつかれさまでした!LGTMです!!
| # Auto-optimize for PlamoEmbedder if no explicit kwargs provided | ||
| encode_kwargs = self.encode_kwargs.copy() | ||
|
|
||
| # Check if this is a PlamoEmbedder and set optimal encoding mode |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
[NIT] この処理が複数出てくるので、どこかにまとめてしまってもいいかもしれないですね。
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
それぞれのタスクにそれぞれの処理があるのでこのままでも良いかなと思います。
akiFQC
left a comment
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
LGTM
関連する Issue / PR
#83
PR をマージした後の挙動の変化
jmteb.jsonnetを更新し,更新版JMTEBを回せるようにしました。JMTEBの更新履歴はhttps://huggingface.co/datasets/sbintuitions/JMTEB/blob/main/UPDATES.md をご参照ください。
今回は
合わせてリーダーボードも更新しました。
plamo-embedding, embeddinggemmaとBAAI/bge-m3を回せるようにそれぞれのembedderを追加しました。
データセットごとに最大トークン長を設定できるようにしました。
挙動の変更を達成するために行ったこと
src/jmteb/configs/tasksにデータセットの追加・削除src/jmteb/configs/jmteb.jsonnetの変更src/jmteb/embeddersにplamoとembeddinggemma用のembedderを追加動作確認