AaronHuangWei
/

Qwen2.5-7B-GRPO-MATH500-lora32

Generated from Trainer

Model card Files Files and versions

Qwen2.5-7B-GRPO-MATH500-lora32 / tokenizer_config.json

Commit History

Training in progress, step 100

6b416b9
verified

AaronHuangWei commited on 15 days ago