fffanx
/

Llama-3.2-1B-Instruct-GRPO-agent15_E16

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Llama-3.2-1B-Instruct-GRPO-agent15_E16 / runs /May05_10-51-09_gpu010.avon.hpc

Commit History

Training in progress, step 10

3e776e4
verified

fffanx commited on May 5