HanningZhang
/

Qwen-7B-grpo-plusplus-nocliphigher-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter8

Text Generation

text-generation-inference

Model card Files Files and versions Community

Qwen-7B-grpo-plusplus-nocliphigher-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter8

Commit History

Upload tokenizer

fb17e54
verified

HanningZhang commited on Apr 20

Upload Qwen2ForCausalLM

9222bf2
verified

HanningZhang commited on Apr 20

initial commit

31eddc8
verified

HanningZhang commited on Apr 20