fffanx
/

Llama-3.2-1B-Instruct-GRPO-agent6

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Llama-3.2-1B-Instruct-GRPO-agent6 / runs

Ctrl+K

Ctrl+K

1 contributor

History: 10 commits

This model has 1 file scanned as suspicious.

fffanx's picture

Training in progress, step 100

86e717a verified 4 months ago

Apr28_20-31-25_gpu006.avon.hpc
Training in progress, step 100 4 months ago