ValueFX9507
/

Tifa-Deepsex-14b-CoT-Q8

Reinforcement Learning

incremental-pretraining

Not-For-All-Audiences

Model card Files Files and versions

ValueFX9507 commited on Feb 13

Commit

c2b3373

·

verified ·

1 Parent(s): 8456670

Update README.md

Files changed (1) hide show

README.md +7 -0

README.md CHANGED Viewed

@@ -23,6 +23,13 @@ license: apache-2.0
 本模型基于Deepseek-R1-14B进行深度优化，借助Tifa_220B生成的数据集通过三重训练策略显著增强角色扮演、小说文本生成与思维链（CoT）能力。特别适合需要长程上下文关联的创作场景。
 ## 版本介绍：
 - **Tifa-Deepsex-14b-CoT**

 本模型基于Deepseek-R1-14B进行深度优化，借助Tifa_220B生成的数据集通过三重训练策略显著增强角色扮演、小说文本生成与思维链（CoT）能力。特别适合需要长程上下文关联的创作场景。
+## 鸣谢
+- **上海左北科技提供算法与算力**[企业网址](https://leftnorth.com/)
+- **Deepseek团队共享GRPO算法**
+- **Qwen团队提供优秀开源底座**
+- **母校上海复旦大学**
+- **PRIME团队提供优化思路**
 ## 版本介绍：
 - **Tifa-Deepsex-14b-CoT**