chloeli
/

qwen-2.5-1.5B-instruct-sft-lora-countdown-deepseek-correct-seq8k-1k

Text Generation

Generated from Trainer

alignment-handbook

text-generation-inference

Model card Files Files and versions Community

qwen-2.5-1.5B-instruct-sft-lora-countdown-deepseek-correct-seq8k-1k

Commit History

Improve language tag

5dfdba3
verified

lbourdois commited on Apr 28

End of training

21b1ac1
verified

chloeli commited on Apr 4

Model save

2c5199f
verified

chloeli commited on Apr 4

Training in progress, step 125

d3a60f1
verified

chloeli commited on Apr 4

Training in progress, step 100

2b513de
verified

chloeli commited on Apr 4

initial commit

70d9cd2
verified

chloeli commited on Apr 4