fffanx
/

Llama-3.2-1B-Instruct-GRPO-agent2_E16

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Llama-3.2-1B-Instruct-GRPO-agent2_E16

Commit History

End of training

284de66
verified

fffanx commited on May 5

Model save

cfc9581
verified

fffanx commited on May 5

Training in progress, step 10

0fde098
verified

fffanx commited on May 5

End of training

05c3c98
verified

fffanx commited on May 5

Model save

f665c2f
verified

fffanx commited on May 5

Training in progress, step 10

1db0823
verified

fffanx commited on May 5

initial commit

a0ca29e
verified

fffanx commited on May 5