HanningZhang
/

Qwen-7B-grpo-plusplus-nocliphigher-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter4

Text Generation

text-generation-inference

Model card Files Files and versions

Qwen-7B-grpo-plusplus-nocliphigher-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter4 / config.json

Commit History

Upload Qwen2ForCausalLM

e8f472a
verified

HanningZhang commited on Apr 19