fffanx
/

Llama-3.2-1B-Instruct-GRPO-agent15_E16

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Llama-3.2-1B-Instruct-GRPO-agent15_E16 / runs

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

This model has 1 file scanned as suspicious.

fffanx's picture

Training in progress, step 10

3e776e4 verified 4 months ago

May05_10-51-09_gpu010.avon.hpc
Training in progress, step 10 4 months ago