تخصيص Phi-3 باستخدام إطار عمل Apple MLX

يمكننا إتمام عملية التخصيص باستخدام Lora من خلال سطر أوامر إطار عمل Apple MLX. (إذا كنت ترغب في معرفة المزيد عن تشغيل إطار عمل MLX، يرجى قراءة Inference Phi-3 with Apple MLX Framework)

1. إعداد البيانات

بشكل افتراضي، يتطلب إطار عمل MLX تنسيق jsonl لملفات train، test، وeval، ويتم دمجها مع Lora لإتمام مهام التخصيص.

ملاحظة:

تنسيق بيانات jsonl:

{"text": "<|user|>\nWhen were iron maidens commonly used? <|end|>\n<|assistant|> \nIron maidens were never commonly used <|end|>"}
{"text": "<|user|>\nWhat did humans evolve from? <|end|>\n<|assistant|> \nHumans and apes evolved from a common ancestor <|end|>"}
{"text": "<|user|>\nIs 91 a prime number? <|end|>\n<|assistant|> \nNo, 91 is not a prime number <|end|>"}
....

المثال الذي استخدمناه يعتمد على بيانات TruthfulQA، ولكن كمية البيانات غير كافية نسبيًا، لذا قد لا تكون نتائج التخصيص هي الأفضل. يُنصح المتعلمين باستخدام بيانات أفضل بناءً على سيناريوهاتهم الخاصة.
يتم دمج تنسيق البيانات مع قالب Phi-3

يرجى تنزيل البيانات من هذا الرابط، ويجب تضمين جميع ملفات .jsonl في مجلد data

2. إجراء التخصيص من خلال الطرفية

يرجى تشغيل هذا الأمر في الطرفية:

python -m mlx_lm.lora --model microsoft/Phi-3-mini-4k-instruct --train --data ./data --iters 1000

ملاحظة:

هذا تخصيص LoRA، إطار عمل MLX لم ينشر QLoRA.
يمكنك تعديل config.yaml لتغيير بعض المعلمات، مثل:

# The path to the local model directory or Hugging Face repo.
model: "microsoft/Phi-3-mini-4k-instruct"
# Whether or not to train (boolean)
train: true

# Directory with {train, valid, test}.jsonl files
data: "data"

# The PRNG seed
seed: 0

# Number of layers to fine-tune
lora_layers: 32

# Minibatch size.
batch_size: 1

# Iterations to train for.
iters: 1000

# Number of validation batches, -1 uses the entire validation set.
val_batches: 25

# Adam learning rate.
learning_rate: 1e-6

# Number of training steps between loss reporting.
steps_per_report: 10

# Number of training steps between validations.
steps_per_eval: 200

# Load path to resume training with the given adapter weights.
resume_adapter_file: null

# Save/load path for the trained adapter weights.
adapter_path: "adapters"

# Save the model every N iterations.
save_every: 1000

# Evaluate on the test set after training
test: false

# Number of test set batches, -1 uses the entire test set.
test_batches: 100

# Maximum sequence length.
max_seq_length: 2048

# Use gradient checkpointing to reduce memory use.
grad_checkpoint: true

# LoRA parameters can only be specified in a config file
lora_parameters:
  # The layer keys to apply LoRA to.
  # These will be applied for the last lora_layers
  keys: ["o_proj","qkv_proj"]
  rank: 64
  scale: 1
  dropout: 0.1

يرجى تشغيل هذا الأمر في الطرفية:

python -m  mlx_lm.lora --config lora_config.yaml

3. تشغيل محول التخصيص للاختبار

يمكنك تشغيل محول التخصيص من خلال الطرفية، على النحو التالي:

python -m mlx_lm.generate --model microsoft/Phi-3-mini-4k-instruct --adapter-path ./adapters --max-token 2048 --prompt "Why do chameleons change colors? " --eos-token "<|end|>"

ثم تشغيل النموذج الأصلي لمقارنة النتائج:

python -m mlx_lm.generate --model microsoft/Phi-3-mini-4k-instruct --max-token 2048 --prompt "Why do chameleons change colors? " --eos-token "<|end|>"

يمكنك محاولة مقارنة نتائج التخصيص مع النموذج الأصلي.

4. دمج المحولات لإنشاء نماذج جديدة

python -m mlx_lm.fuse --model microsoft/Phi-3-mini-4k-instruct

5. تشغيل النماذج المخصصة المحسوبة باستخدام ollama

قبل الاستخدام، يرجى إعداد بيئة llama.cpp الخاصة بك:

git clone https://github.com/ggerganov/llama.cpp.git

cd llama.cpp

pip install -r requirements.txt

python convert.py 'Your meger model path'  --outfile phi-3-mini-ft.gguf --outtype f16

ملاحظة:

يدعم الآن تحويل التكميم لـ fp32، fp16 وINT 8.
النموذج المدمج يفتقد tokenizer.model، يرجى تنزيله من https://huggingface.co/microsoft/Phi-3-mini-4k-instruct.

قم بتعيين ملف نموذج Ollama (إذا لم يتم تثبيت ollama، يرجى قراءة Ollama QuickStart

FROM ./phi-3-mini-ft.gguf
PARAMETER stop "<|end|>"

قم بتشغيل الأمر في الطرفية:

 ollama create phi3ft -f Modelfile 

 ollama run phi3ft "Why do chameleons change colors?"

تهانينا! لقد أتقنت التخصيص باستخدام إطار عمل MLX.

إخلاء المسؤولية:
تمت ترجمة هذا المستند باستخدام خدمات الترجمة الآلية بالذكاء الاصطناعي. بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو عدم دقة. يجب اعتبار المستند الأصلي بلغته الأصلية هو المصدر الموثوق. للحصول على معلومات حاسمة، يُوصى بالاستعانة بترجمة بشرية احترافية. نحن غير مسؤولين عن أي سوء فهم أو تفسيرات خاطئة تنشأ عن استخدام هذه الترجمة.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FineTuning_MLX.md

FineTuning_MLX.md

تخصيص Phi-3 باستخدام إطار عمل Apple MLX

1. إعداد البيانات

ملاحظة:

2. إجراء التخصيص من خلال الطرفية

ملاحظة:

3. تشغيل محول التخصيص للاختبار

4. دمج المحولات لإنشاء نماذج جديدة

5. تشغيل النماذج المخصصة المحسوبة باستخدام ollama

Files

FineTuning_MLX.md

Latest commit

History

FineTuning_MLX.md

File metadata and controls

تخصيص Phi-3 باستخدام إطار عمل Apple MLX

1. إعداد البيانات

ملاحظة:

2. إجراء التخصيص من خلال الطرفية

ملاحظة:

3. تشغيل محول التخصيص للاختبار

4. دمج المحولات لإنشاء نماذج جديدة

5. تشغيل النماذج المخصصة المحسوبة باستخدام ollama