fffanx
/

Llama-3.2-1B-Instruct-GRPO-agent11_E16

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Llama-3.2-1B-Instruct-GRPO-agent11_E16 / runs

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

This model has 1 file scanned as suspicious.

fffanx's picture

Training in progress, step 10

5614175 verified 4 months ago

May05_10-48-31_gpu010.avon.hpc
Training in progress, step 10 4 months ago