plaguss
/

Mistral-7B-v0.1-Math-Shepherd-PRM-0.2

Token Classification

Generated from Trainer

stepwise-reward-trainer

text-generation-inference

Model card Files Files and versions Community

Mistral-7B-v0.1-Math-Shepherd-PRM-0.2

Commit History

Update README.md

97f6149
verified

plaguss commited on Dec 11, 2024

End of training

9791a93
verified

plaguss commited on Dec 10, 2024

Model save

5d4da06
verified

plaguss commited on Dec 10, 2024

Model save

94c2016
verified

plaguss commited on Dec 10, 2024

Training in progress, step 1650

fe7cd60
verified

plaguss commited on Dec 10, 2024

Training in progress, step 1500

9eab215
verified

plaguss commited on Dec 10, 2024

Training in progress, step 1000

41c826e
verified

plaguss commited on Dec 10, 2024

Training in progress, step 500

df2266a
verified

plaguss commited on Dec 10, 2024

Training in progress, step 1000

a22e408
verified

plaguss commited on Dec 10, 2024

Training in progress, step 500

dc8ac7a
verified

plaguss commited on Dec 10, 2024

initial commit

fb06cbe
verified

plaguss commited on Dec 10, 2024