jbrinkma
/

Qwen2-0.5B-GRPO-test

Generated from Trainer

Model card Files Files and versions

Qwen2-0.5B-GRPO-test / README.md

Commit History

Model save

1129d29
verified

jbrinkma commited on Jun 26

Training in progress, step 10

a181ab7
verified

jbrinkma commited on Jun 26