Update README.md
Browse files
README.md
CHANGED
@@ -23,6 +23,13 @@ license: apache-2.0
|
|
23 |
|
24 |
本模型基于Deepseek-R1-14B进行深度优化,借助Tifa_220B生成的数据集通过三重训练策略显著增强角色扮演、小说文本生成与思维链(CoT)能力。特别适合需要长程上下文关联的创作场景。
|
25 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
26 |
## 版本介绍:
|
27 |
- **Tifa-Deepsex-14b-CoT**
|
28 |
|
|
|
23 |
|
24 |
本模型基于Deepseek-R1-14B进行深度优化,借助Tifa_220B生成的数据集通过三重训练策略显著增强角色扮演、小说文本生成与思维链(CoT)能力。特别适合需要长程上下文关联的创作场景。
|
25 |
|
26 |
+
## 鸣谢
|
27 |
+
- **上海左北科技提供算法与算力**[企业网址](https://leftnorth.com/)
|
28 |
+
- **Deepseek团队共享GRPO算法**
|
29 |
+
- **Qwen团队提供优秀开源底座**
|
30 |
+
- **母校上海复旦大学**
|
31 |
+
- **PRIME团队提供优化思路**
|
32 |
+
|
33 |
## 版本介绍:
|
34 |
- **Tifa-Deepsex-14b-CoT**
|
35 |
|