Skip to content

sociocom/TNM-Classifier-Tester

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

TNM-Classifier-Tester

BERT を用いてがんの TNM 分類を行うプログラム.

このプログラムは,NTCIR-17 MedNLP-SC Radiology Report Subtask (MedTxt-RR)(肺がん患者の読影レポートから TNM 分類を予測するタスク)で使用したコードを基にしている.JMedRoBERTa (manbyo-wordpiece)モデルを,MedTxt-RR で提供されたコーパスを使用して再訓練したモデル(sociocom/TNM-Classifier)で実行される.

また,パッケージ管理には rye を利用している.

データの概要

サンプルデータdata/tnm_report.csv: MedTxt-RR で公開されたコーパスのうち抽出した 10 件.

入力 (data/)

id T N M text
0 4 3 0 左上葉気管支は閉塞して造影 CT で増強効果の乏しい 70mm の腫瘤があります。肺癌と考えます。

出力 (outputs/)

id T N M text TNM_pred
0 4 3 0 左上葉気管支は閉塞して造影 CT で増強効果の乏しい 70mm の腫瘤があります。肺癌と考えます。 420

使用方法

Mecab 用辞書万病辞書をダウンロードし,data ディレクトリ直下に配置する.

Rye を導入した後,rye sync で python ライブラリをインストール

下記のコマンド一覧を参考に適切な引数を追加し,実行する.
実行例

rye run python src/main.py -i='data/tnm_report.csv' -d='cpu' -b=8

出力ファイルは output ディレクトリ下に生成される.

コマンド一覧

help が見れるコマンド: rye run python src/main.py --help
入力すると以下の説明が表示される.

NAME
    main.py

SYNOPSIS
    main.py <flags>

FLAGS
    -p, --pretrained_model=PRETRAINED_MODEL
        Type: str
        Default: 'sociocom/TNM-Classifier'
    -i, --input_path=INPUT_PATH
        Type: str
        Default: 'data/tnm_report.csv'
    -o, --option_dic_path=OPTION_DIC_PATH
        Type: str
        Default: 'data/MANBYO_20210...
    -s, --seed=SEED
        Type: int
        Default: 2023
    -d, --device=DEVICE
        Type: str
        Default: device(type='cuda', ind...
    -b, --batch_size=BATCH_SIZE
        Type: int
        Default: 32
    -m, --max_length=MAX_LENGTH
        Type: int
        Default: 512

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages