Skip to content

Conversation

@lsz05
Copy link
Collaborator

@lsz05 lsz05 commented Oct 2, 2025

関連する Issue / PR

#83

PR をマージした後の挙動の変化

  1. jmteb.jsonnetを更新し,更新版JMTEBを回せるようにしました。
    JMTEBの更新履歴はhttps://huggingface.co/datasets/sbintuitions/JMTEB/blob/main/UPDATES.md をご参照ください。
    今回は

    • 次の13個のデータセットを追加しました
      • Japanese Sentiment Classification
      • SIB200 Japanese Classification
      • WRIME Classification
      • SIB200 Japanese Clustering
      • NLP Journal Abs-Article Retrieval
      • JaCWIR Retrieval
      • MIRACL Retrieval
      • MLDR Retrieval
      • Mintaka Retrieval
      • JQaRA Reranking
      • JaCWIR Reranking
      • MIRACL Reranking
      • MLDR Reranking
    • 次の1つのデータセットを削除しました
      • PAWS-X-ja PairClassification

    合わせてリーダーボードも更新しました。

  2. plamo-embedding, embeddinggemmaBAAI/bge-m3を回せるようにそれぞれのembedderを追加しました。

  3. データセットごとに最大トークン長を設定できるようにしました。

挙動の変更を達成するために行ったこと

  • src/jmteb/configs/tasksにデータセットの追加・削除
  • src/jmteb/configs/jmteb.jsonnetの変更
  • src/jmteb/embeddersにplamoとembeddinggemma用のembedderを追加
  • 各evaluatorにトークン長関連の設定を追加

動作確認

  • テストが通ることを確認した
  • マージ先がdevブランチであることを確認した
  • Leaderboardを更新

@lsz05 lsz05 mentioned this pull request Oct 2, 2025
3 tasks
@lsz05 lsz05 requested a review from akiFQC October 6, 2025 04:04
Copy link
Collaborator

@akiFQC akiFQC left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

超大作ですね!!おつかれさまでした!LGTMです!!

# Auto-optimize for PlamoEmbedder if no explicit kwargs provided
encode_kwargs = self.encode_kwargs.copy()

# Check if this is a PlamoEmbedder and set optimal encoding mode
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

[NIT] この処理が複数出てくるので、どこかにまとめてしまってもいいかもしれないですね。

Copy link
Collaborator Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

それぞれのタスクにそれぞれの処理があるのでこのままでも良いかなと思います。

@lsz05 lsz05 requested a review from akiFQC November 11, 2025 06:46
Copy link
Collaborator

@akiFQC akiFQC left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

LGTM

@lsz05 lsz05 merged commit 8f2ed38 into dev Nov 14, 2025
3 checks passed
@lsz05 lsz05 mentioned this pull request Nov 14, 2025
1 task
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

3 participants