Fix/trl-dependency-and-training-args (#8)

nickcom007 · web-flow · commit 50c99ac0c204 · 2024-06-06T10:38:53.000-04:00
* chore: upgrade trl

* fix: replace trainingargument to trlconfig
diff --git a/demo.py b/demo.py
@@ -3,9 +3,8 @@
 
 import torch
 from peft import LoraConfig
-from transformers import (AutoModelForCausalLM, AutoTokenizer,
-                          BitsAndBytesConfig, TrainingArguments)
-from trl import SFTTrainer
+from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
+from trl import SFTTrainer, SFTConfig
 
 from dataset import SFTDataCollator, SFTDataset
 from merge import merge_lora_to_base_model
@@ -44,7 +43,7 @@ def train_and_merge(
         bnb_4bit_compute_dtype=torch.bfloat16,
     )
 
-    training_args = TrainingArguments(
+    training_args = SFTConfig(
         per_device_train_batch_size=training_args.per_device_train_batch_size,
         gradient_accumulation_steps=training_args.gradient_accumulation_steps,
         warmup_steps=100,
@@ -55,6 +54,7 @@ def train_and_merge(
         optim="paged_adamw_8bit",
         remove_unused_columns=False,
         num_train_epochs=training_args.num_train_epochs,
+        max_seq_length=context_length,
     )
     tokenizer = AutoTokenizer.from_pretrained(
         model_id,
@@ -81,9 +81,7 @@ def train_and_merge(
         train_dataset=dataset,
         args=training_args,
         peft_config=lora_config,
-        packing=True,
         data_collator=SFTDataCollator(tokenizer, max_seq_length=context_length),
-        max_seq_length=context_length,
     )
 
     # Train model
diff --git a/requirements.txt b/requirements.txt
@@ -2,6 +2,6 @@ torch>=1.13.1
 transformers>=4.37.2
 peft>=0.10.0
 loguru
-trl>=0.8.1
+trl>=0.9.3
 bitsandbytes
 pyyaml