erayalp
/

qwen2.5-0.5b-instruct-GRPO-v3-tr-math-gsm8k

Text Generation

group-relative-policy-optimization

reinforcement-learning

curriculum-learning

supervised-fine-tuning

Model card Files Files and versions Community

qwen2.5-0.5b-instruct-GRPO-v3-tr-math-gsm8k / .gitattributes

Commit History

Upload folder using huggingface_hub

6702d07
verified

erayalp commited on May 20

initial commit

df807f7
verified

erayalp commited on May 20