fffanx
/

Llama-3.2-1B-Instruct-GRPO-agent0_E17

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Llama-3.2-1B-Instruct-GRPO-agent0_E17 / runs

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

This model has 1 file scanned as suspicious.

fffanx's picture

Training in progress, step 10

ffea124 verified 3 months ago

May05_11-02-44_gpu010.avon.hpc
Training in progress, step 10 3 months ago