llmat
/

Qwen2.5-14B-GRPO

Text Generation

text-generation-inference

Model card Files Files and versions

Qwen2.5-14B-GRPO / model-00004-of-00006.safetensors

Commit History

Trained with Unsloth

42d776c
verified

llmat commited on Mar 10