farid678/faraz
Viewer • Updated • 2.38k • 79 • 1
license: apache-2.0 datasets:
model-index:
این مدل یک نسخه فاینتیون شده LoRA از مدل Qwen/Qwen1.5-1.8B-Chat است که بر روی دادههای فارسی (dataset: farid678/faraz) آموزش دیده است.
این مدل میتواند برای تولید متن فارسی، چت و پاسخگویی به کاربر استفاده شود.
توجه داشته باشید که مدل هنوز با LoRA جداگانه است و merge نشده، بنابراین باید هم مدل پایه و هم LoRA لود شوند تا عملکرد کامل داشته باشد.
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel
import torch
# لود مدل پایه
base_model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen1.5-1.8B-Chat", torch_dtype=torch.float16, device_map="auto")
# لود LoRA
model = PeftModel.from_pretrained(base_model, "farid678/faraz")
# لود tokenizer
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen1.5-1.8B-Chat")
# تولید متن
prompt = "یک متن کوتاه درباره مدلهای زبان بزرگ بنویس"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_new_tokens=200)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
Base model
Qwen/Qwen1.5-1.8B-Chat