Skip to content

Conversation

@t-sagara
Copy link

@t-sagara t-sagara commented Nov 6, 2025

corpus/llm-jp-corpus-v4/common/dedup/ に dedup 処理をシングルノードで実行するスクリプトおよび手順を追加しました。

  • SudachiPy を実行すると deplicated warning が出るので、installer/ に修正するパッチを追加
  • minhash/local_single_node/ にシングルノード実行に必要なファイルを追加

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant