fffanx
/

Llama-3.2-1B-Instruct-GRPO-agent9_E16

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Llama-3.2-1B-Instruct-GRPO-agent9_E16 / special_tokens_map.json

Commit History

Training in progress, step 10

a1a1097
verified

fffanx commited on May 5