alexredna
/

TinyLlama-1.1B-Chat-v1.0-reasoning-v2-dpo

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

TinyLlama-1.1B-Chat-v1.0-reasoning-v2-dpo / runs

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

alexredna's picture

Training in progress, step 300

55bf1eb over 1 year ago