RedHatAI
/

DeepSeek-R1-Distill-Qwen-14B-quantized.w8a8

Text Generation

text-generation-inference

8-bit precision

compressed-tensors

Model card Files Files and versions

nm-research commited on Feb 27

Commit

da92b40

·

verified ·

1 Parent(s): c241a5f

Add reasoning evals

Files changed (1) hide show

README.md +25 -0

README.md CHANGED Viewed

@@ -168,6 +168,31 @@ lm_eval \
   </thead>
   <tbody>
     <tr>
       <td rowspan="7"><b>OpenLLM V1</b></td>
       <td>ARC-Challenge (Acc-Norm, 25-shot)</td>
       <td>58.79</td>

   </thead>
   <tbody>
     <tr>
+<td rowspan="4"><b>Reasoning</b></td>
+<td>AIME 2024 (pass@1)</td>
+<td>66.67</td>
+<td>66.31</td>
+<td>99.46%</td>
+</tr>
+<tr>
+<td>MATH-500 (pass@1)</td>
+<td>94.66</td>
+<td>94.68</td>
+<td>100.02%</td>
+</tr>
+<tr>
+<td>GPQA Diamond (pass@1)</td>
+<td>59.35</td>
+<td>58.32</td>
+<td>98.26%</td>
+</tr>
+<tr>
+<td><b>Average Score</b></td>
+<td><b>73.56</b></td>
+<td><b>73.1</b></td>
+<td><b>99.37%</b></td>
+</tr>
+    <tr>
       <td rowspan="7"><b>OpenLLM V1</b></td>
       <td>ARC-Challenge (Acc-Norm, 25-shot)</td>
       <td>58.79</td>